Gemini逆风翻盘的18个关键

如果不是亲耳听到,很难想象一家科技巨头会在镜头前承认:“两年半前,我们远远落后了。”在这次访谈里,DeepMind CTO、Google 首席 AI 架构师 Koray Kavukcuoglu 罕见地拆开了过去两年 Google 的真实处境——不是*、不是规模,而是被时代加速甩在身后、再一点点追上来

如果不是亲耳听到,很难想象一家科技巨头会在镜头前承认:“两年半前,我们远远落后了。”在这次访谈里,DeepMind CTO、Google 首席 AI 架构师 Koray Kavukcuoglu 罕见地拆开了过去两年 Google 的真实处境——不是*、不是规模,而是被时代加速甩在身后、再一点点追上来的过程。

他没有炫耀参数,也没有谈模型的“神迹”,而是把重点放在更底层、更残酷的问题上:一家全球最强的 AI 实验室,如何在巨大的惯性中重新学会创新、学会工程化、学会组织协作、学会把技术真正变成产品?

Gemini 的故事只是表层。真正发生变化的,是 Google 这家公司的骨架与节奏。

原文访谈链接:https://www.youtube.com/watch?v=fXtna7UrL44以下是根据访谈实录整理的关键议题,希望也能帮你更清晰地读懂 Google 的这次“重构”。

一、真正的起点不是突破,而是承认自己落后了

访谈中最刺耳也最重要的一句话,出现在结尾:

“当 Gemini 项目开始时,我们离*进水平还很远,那是一个追赶。”

这句话标志着一个巨大的认知转折:Google 承认自己在 LLM 起跑线上是真正的落后者。不是“状态不好”这种轻描淡写,而是“远远落后”。这意味着 DeepMind 必须抛弃此前十年建立的自信,从最基础的用户使用场景重新学习。

而这种承认,是一切变化的源头。Koray 在访谈里反复强调:真正的转折不是某个新技术,而是 Google 接受自己必须重新建立训练方式、产品方式、工程方式以及组织方式

二、为什么中国用户*明显感觉到 Gemini 变好了?

访谈一开始,主持人提到一个特别中国的反馈:Gemini 3 在中国用户中被形容为“像 Windows XP 一样稳定好使”。Koray 很有兴致地解释,这不是模型本身突然“智商暴涨”,而是 Google 终于把“模型 × UI × 任务链路”统一到了一起。

以前的大模型“聪明”,但不“好使”。而 Gemini 3 的转折来自:

用户界面更直觉

任务拆解更稳定

模型更能理解人类意图

产品团队从训练阶段就介入模型设计

真实用户使用数据可以直接反哺训练

换句话说,Google 终于开始像一家做产品的公司在做大模型。这是 Gemini 3 变化最直观的原因,也是中国用户*体会到的原因。

三、Benchmark 正在失效,但真实世界永远不会

外界批评 Google 的 benchmark 成绩起伏不定,但 Koray 的解释很罕见地触及本质:主流 benchmark 正在靠近它们的自然上限。GPQA、ARC-AGI 等“智商题”已经被模型顶住,HLE 这种曾经难得离谱的测评如今也能“持续提升”。

Benchmark 会枯竭,但真实世界不会。学生写作、科学研究、专业翻译、复杂跨语境对话、跨语言表达……这些场景永远无法被一个固定测试集穷尽。Google 把模型的最终价值从“得分”转向“能不能帮人完成任务”。这是 Gemini 的*性原理转变。

四、Gemini 3 的核心不是智力提升,而是让模型“能干活”

从 Gemini 3 开始,Google 清晰确立了三个优先级最高的能力方向。

*是 指令遵从。模型要能“无二义性地理解和执行用户的真实意图”。这对用户体验影响巨大,比提升推理指标更重要。

第二是 国际化能力。Google 的用户覆盖超过 200 个国家,“理解全球不同文化语境”成为模型能力的底层指标,而不是翻译能力的延伸。

第三是 工具调用与代码执行。这是未来智能体的基础,模型必须不仅能理解问题,还能执行任务、运行工具链、处理工程环境中的真实任务。

三者加在一起,构成了 Google 的 “Gemini 设计哲学”:智能不是来自“更聪明的对话”,而来自“更可靠的执行”。

五、为什么多模态强的 Google,起初 Agent 却不好用?

这是主持人问得最尖锐的问题,也是外界最想知道的矛盾。Koray 的答案意外朴素:研究员可以在实验室推动视觉理解,但 Agent 的任务不是研究员能想出来的,是用户逼出来的。

真正的 Agent 场景来自:

创作者的任务链路

学生的写作流程

工程师的工具调用模式

商业用户的复杂需求

也就是说,Google 走了一条与 OpenAI 不同的路径:不是“demo 优先”,而是“真实用户需求优先”。Agent 的能力不是靠酷炫演示驱动的,而是靠“让百万用户每天用”驱动的。

六、Google 真正的反超武器:模型、产品、工程*次被统一

Koray 多次强调一个过去被低估的事实:Gemini 3 不是“模型团队”的胜利,而是“工程、产品、模型、安全”*次从*天就被捏在一起推进。

以往是:

模型训练完了,产品团队接盘

安全团队在最后做审核

工程团队负责部署

而今天是:

产品团队从训练最初就参与

安全成为训练目标,而不是后置规则

真实用户数据(AI Studio、AI Overviews、Anti-Gravity)直接反哺模型

使用成本、延迟、推理路径都在训练阶段就被优化

Google 终于构建出了一个“模型 × 产品 × 工程”的统一体系。这是它在 2024–2025 年真正反超的结构性基础。

七、Nano Banana Pro 的突破不是“画图变好看”,而是“理解世界结构”

外界关注图像模型总是看“清晰度”、“风格”,但 Koray 在访谈中反复强调,真正的突破来自:

理解 PDF、表格、图表等复杂文档结构

具备结构化的视觉推理

*次能生成“概念一致的信息图”

一句值得记下的话是:

一句值得记下的话是:

“当一个模型能把复杂概念准确地用一张信息图表达出来,你就能感受到真正的理解。”

这是多模态模型的真正价值,也直接指向 Agent 的未来能力。

八、多模态不是功能加法,而是真正的“世界模型”入口

Koray 给出了一个简洁但*说服力的框架:

文本是线性的,视觉是空间的,音频是时序的。真实世界不是只靠线性序列能描述的。因此一个真正智能的模型必须同时具备三种感知维度。

这也是为什么 Google 在推进统一多模态模型上比任何公司都更加坚持——不是因为多模态“更炫酷”,而是因为它是理解世界的基础。

九、统一模型并不是“把视觉塞进语言模型”,而是一场架构革命

外界经常把“统一模型”理解成方向正确的趋势,但 Koray 的解释更具技术深度。他指出:文本和图像的输出结构根本不同——文本是一维的,图像是二维的。这意味着训练方式、损失函数、优化器、token 化方式都要重新发明。

统一模型不是“时代潮流”这么简单,而是 必须突破的工程极限。Google 的叙事没有浪漫,也没有玄学,只有工程难题。

十、DeepMind 的文化基因:谦逊、科学与大规模协作

这部分是整场访谈里最“人味”的地方。

DeepMind 的文化由三部分组成:

科学心态 —— 所有问题回到实验与学习,而不是路径依赖。谦逊 —— 那句“我们不知道*配方”不是客套,而是策略。协作能力 —— 从 25 个人写论文到 2500 人一起推进单一模型。

在一个公司试图从科研转型为工程、从工程转型为产品的过程中,这种文化结构变得至关重要。

十一、规模是 Google 的*难题,也是*武器

Koray 承认:规模越大,一致性越难。但规模本身就是推进力。

Google 能够同时推进统一模型、多产品落地、跨部门协作、全球化数据管线、超大规模训练与部署,是因为它拥有世界上最成熟的基础设施链路。

过去两年,这条链路从“沉睡”变回“主力”,重启了 Google 的攻势。

十二、安全不是限制能力,而是训练能力

Google 与 OpenAI 在安全策略上*的差异不是严格程度,而是方式:安全不是“训练后加过滤器”,而是“训练中学会安全”。

这是“让模型可靠”的关键,并且天然适配 Google 的基础设施规模。

十三、统一模型与专用模型不是路线争夺,而是成本优化

Koray 说得很实在:这不是意识形态问题,而是效率问题。未来一定会同时存在统一模型与专用模型,Google 的策略是用合适的工具做合适的任务,而不是坚持单一范式。

这种务实,是 Google 过去缺失、现在重新找到的品质。

十四、Google 的真正底气:基础设施的重新激活

“我们能成功,不是因为我们更聪明,而是因为基础设施足够强。”Koray 的这句话其实深刻揭示了大模型时代的一个底层事实——智能规模化不是靠天才,而是靠管线。

能训练、能部署、能迭代、能处理全球数据、能保持安全一致性的,是基础设施,而不是算法。

十五、Google 不相信有单一路径,也不相信“持续扩参”能走到终点

他说:

“我们不知道最终配方。”

这句话的潜台词是:

扩参不是终局

统一模型不是最终答案

多模态不是最后形态

未来模型的路线还远未定型

这种“带着不确定性继续前行”的姿态,反而比某些公司宣称的“xxx 是通往 AGI 的*路径”更具有长寿感。

十六、下一阶段的重点:推理、执行与真正的自主性

Gemini 3 的故事才刚开始。Google 的下一个目标是:

深层推理

多步任务执行

在复杂场景中的鲁棒性

从“会回答”到“会行动”,这是整个行业的共同方向,但 Google 给出了相对清晰的内部路径。

十七、Google 内部的时间结构:研究 × 工程 × 产品的等权分配

Koray 透露,团队的时间分配不是研究优先,而是三者等权。这意味着一个模型从训练到使用的全过程是统一推进的,而不是线性流程。

这是模型“真正可用”的关键原因。

十八、Gemini 是一个全公司规模的“科学工程项目”

访谈的最后,Koray 用“全公司的科学工程任务”来形容 Gemini 的诞生。那更像是一种内部视角的注脚:模型的进步来自结构性调整,而结构性调整本身比模型更难。训练、数据、工程、产品、安全、协作……这些环节重新对齐,才构成了今天的 Gemini。

过去两年,Google 不是在寻找捷径,而是在恢复一个体系应有的速度和一致性。

当这些基础再次稳固起来,一个属于 Google 的节奏也重新出现了。

(0)
小多多的头像小多多创始人

相关推荐

  • 农民干什么能致富 可以考虑这些门路

    一直以来,很多人都想知道,在农村的话,有没有好的致富门路,这篇文章就跟大家聊聊这个话题,介绍几个值得关注的项目! 首先就是种植野菜,野菜的市场欢迎程度不用多说,无论是蒲公英,还是车…

    创投 2022年1月25日
  • 麦当劳降价,原因不简单

    麦当劳下调外送费,收取打包费,犹如变相降价,背后是麦当劳有些卖不动了,原因不简单,但不得不行动。01麦当劳突然宣布降价洋快餐巨头麦当劳又上热搜了,这次是因为降价。《新品略财经》关注到,12月2日,“麦当劳下调配送费收取打包费”话题冲上热搜,引发了全网关注和热议。‍据21世纪经济报道等媒体报道,麦当劳

    2024年12月3日
  • 27岁,他有望拿下三家上市公司

    随着五新科技上市审核状态的更新,其“95后”掌舵者王薪程,或将再斩获一家上市公司。值得一提的是,王薪程还是北交所上市公司五新隧装的实控人;此外,他“坐拥”的五新重工,也被传出了上市消息。也就是说,若五新科技上市顺利,王薪程极有可能收获3家上市公司,借此扩大扩张“五新系”的资本版图。据悉,五新科技主要

    2024年1月31日
  • 光伏概念股 硅材料降价引关注

    A股市场上,一直以来都对光伏行业非常的看重,这几天很多投资者都想知道,有哪些公司算是A股种的光伏概念股,这篇文章就跟大家聊聊。 协鑫集成:协鑫集成注重技术研发投入,打造专业化的系统…

    创投 2022年1月25日
  • 投资理财知识(详解5个理财小妙招)

    你是月光族吗?是穷忙族吗?那就得看一下具体情况了,今天桑尼就分享5条理财小妙招,能救你于水深火热之中。 如何正确合理地规划自己的财富,如何更好地理财, 是很多上班族最为关注的问题。…

  • 人工智能产业蓬勃发展,九方财富助力投顾行业前行_行业动态

    近年来,以ChatGPT为代表的生成式AI技术迅猛发展,全球各大科技巨头纷纷投入这一领域,各国纷纷出台与此相关的利好政策。在人工智能蓬勃发展的上海,根据《上海市人工智能产业发展“十四五”规划》,金融领域将深化人工智能在风控、监管、客服、投顾、投研、支付等各环节的应用。智能投顾行业的先行者九方财富(

    2024年2月19日
  • 蔚来李斌,2023年最善良的人

    在全球汽车工业长达 137 年的漫长发展史中,神秘而遥远的东方,曾孕育过这样一位“别具一格”的造车人:他对赚钱没什么兴趣,平常最喜欢做的事,是跟买了自家车的用户“粘”在一起,听他们唱歌,跟他们合影,给他们发红包;他对花大钱没什么感觉,公司内但凡是打着“提升用户体验”名号的预算申请,他从没吝啬过“亿”

    创投 2023年9月22日
  • 财报里的「外卖大战」

    外卖大战,打得咋样了?这场战役由京东率先发起,美团应战,两家正打得不知天地为何物时,阿里从暗地杀出,开大参团。三方打得不可交,可以说是一波未平一波又起,关于其完整的时间线和关键节点,我们用微博智搜整理了一下:由于这轮 “ 三国杀 ” 的巨头们都太有实力,这半年来,各种补贴也好、争议也好,几乎没停过

    2025年9月2日 创投
  • 10亿元,复旦科创投资基金正式启动

    投资界(ID:pedaily2012)12月3日消息,复旦科创母基金超额完成5亿元首关目标,宣告正式成立;明年将完成二关目标,实现首期总规模10亿元。同时,复旦科创投资基金在大会上启动,基金计划规模10亿元。与母基金不同,这是一个直投项目的投资基金,将聚焦生命健康、集成电路、人工智能、新材料/新能源

    2024年12月3日
  • 从实验室到智能工厂:AI制药的黄金十年

    英矽智能的生成式AI平台仅用18个月完成从靶点发现到候选药物设计,其抗纤维化新药INS018_055已进入Ⅱ期临床试验,较传统研发周期压缩70%;恒瑞医药的AI系统每日生成10万种化合物,其中20%通过成药性验证,效率达人工筛选的200倍,推动石药集团等企业拿下国际药企百亿订单——这些案例背后,是一

    2025年8月15日
  • 字节社交再变阵:抖音内测「朋友圈」、升级朋友功能,停止多闪研发

    Tech星球*获悉,时隔一年,抖音在社交上再次有新动作,抖音APP的“朋友”功能进行全面升级,具体玩法上,升级后的朋友关系,将独立于一直存在的互相关注的粉丝关系,用户需要主动申请添加对方成为“朋友”。朋友关系从社交亲密度上看,比互相关注的粉丝关系更高,更加偏向于传统的熟人关系。同时,抖音APP底部导

    2024年11月15日
  • 造车新势力出海,停在故事里

    近几年来,汽车产业掀起转型热潮,不管是传统车企还是造车新势力都在向新能源汽车拔足狂奔,大量资本涌入的同时,行业竞争也趋向白热化。对于造车新势力这样的汽车行业新玩家,随着传统车企发力,市场、融资等各方面资源都逐渐被分走,单纯发展国内市场已不再能满足它们的需求,为了讲出更为吸引人的资本故事,造车新势力在

    2024年7月23日
  • 靠卖成分起家,又一家代工厂要去IPO了

    以“多肽”——为主要成分的药品及化妆品,近年来备受消费者追捧。“肽”是蛋白质水解的中间产物,而“多肽”是多个氨基酸分子组成的肽。在医药领域,典型如“司美格鲁肽”,因在糖尿病及肥胖症等代谢类疾病领域的作用,成为一大现象级药品,相关产品在抖音、小红书等平台热度很高。全球咨询公司弗若斯特·沙利文(Fros

    2023年9月3日 创投
  • 神秘模型「小熊猫」一夜刷屏

    一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了!!登顶文生图竞技场,直接将Flux、Midjourney等一众*模型踩在脚下——其ELO得分比Flux 1.1 Pro高出100多,胜率高达79%,每7秒就能生成一张图像。生成效果be like:啥概念呢?按网友的话说,这家伙

    2024年10月29日 创投
  • 又一千亿级造车新势力栽了

    又一1000亿级造车新势力,彻底栽了。据最新消息,英国的明星造车玩家Arrival正式从纳斯达克摘牌、退市。摘牌前夕,Arrival的股价仅剩0.49美元,总市值仅剩900万美元。据悉,Arrival成立超过9年,2021年5月,Arrival公司以超150亿美元(约合人民币1077亿元)的估值上市

    2024年2月4日