算力悖论

近期,伊利亚·苏茨克沃(Ilya Sutskever)为推介其初创公司“安全超级智能公司(SSI)”,出来做了一篇访谈。虽说“PR”意图明显,但这仍是过去半年来关于人工智能产业演进思考最深刻的的公开论述了。尽管核心观点已在媒体间广泛传播,但仍值得再度强调与广泛讨论。这位OpenAI的前首席科学家觉得

近期,伊利亚·苏茨克沃(Ilya Sutskever)为推介其初创公司“安全超级智能公司(SSI)”,出来做了一篇访谈。虽说“PR”意图明显,但这仍是过去半年来关于人工智能产业演进思考最深刻的的公开论述了。尽管核心观点已在媒体间广泛传播,但仍值得再度强调与广泛讨论。

这位OpenAI的前首席科学家觉得,眼下这波人工智能热潮全都跑偏了。不是细枝末节的偏差,而是方向性的根本错误。

他抛出了一个让所有忙着签数十亿美元计算合同的实验室老板们脊背发凉的观点:那个靠堆算力、拼规模的时代,已经结束了。接下来要想往前走,整个行业得捡起一件被它丢下很久的东西——真正的研究。

“我们活在一个公司比主意还多的世界里,”苏茨克沃说得挺不客气,“而且多得多。”这话从他嘴里说出来,分量不一样。要知道,正是他参与打造的AlexNet、GPT-3,用整整十年时间给“规模就是王道”投下了赞成票。如今,这位 scale 的信徒却说,此路不通了。

其核心观点归结为:

那个靠堆算力、拼规模的Scaling时代(2020-2025),已经结束了

算力悖论:理论对了,所需的算力是可控的;理论错了,再多算力也白搭

现有方法无法产生真正智能,根本问题:模型泛化能力远逊人类,显示基础架构存在缺陷

突破大模型时代的*个平台期,整个产业竞争将回归“真正的研究”。

通常来讲,我们对于一个人的理论观点的理解都是见仁见智、和而不同的。但苏茨克沃最新观点之所以应被特别重视,是因为谷歌在大模型领域的最新进展,基本印证了他的上述思考:谷歌当前在各条技术栈上追平甚至超出OpenAI的基本事实证明,理论对了,不仅所需的算力是可控的,且算力模式也是可控的(从GPU到TPU)。进一步,这也预示着,谷歌在大模型理论研究上取得了三年以来整个产业最重要的突破,可以预见,“软硬一体”(硬件设计制造+算法演进突破)的公司竞争模型已经是所有人工智能公司的必由之路。

这在很大程度上,已经为2026年全年的AI产业竞争定下了基调、划下了主线。在我们展开未来的基调与主线研究之前,不妨先来把这篇访谈内容的主干再做一次复述。

Scaling的尽头

苏茨克沃的论证起点很有趣,他从语言说起。“Scaling”这个词本身,慢慢成了整个行业的战略指南针。大家觉得,只要往计算和数据上砸钱,回报就是板上钉钉的事。预训练给出了一张清晰的配方:按固定比例混合算力、数据和模型参数,性能就能稳定提升。

这种确定性吸引了海量投资。研究有风险,扩张只是花钱——当你动用的是数十亿美金时,这区别至关重要。

但配方会过期。高质量的训练数据快见底了,互联网上的文本几乎被刮了个干净。合成数据能帮点忙,但用苏茨克沃的话说,收益递减的拐点已经来了。所有大实验室都面临同一个问题:当扩张曲线走平,接下来怎么办?

他的答案不太中听。现有的路径“能再走一段,然后就没后劲了。它会继续改进,但不会成为真正的智能。”我们想要的、能展现真正智能的系统,需要另一种方法。“而我们还没学会怎么造它们。”

这可不是在抱怨“算力不够”。他是在质疑当前智能架构本身。

泛化,那个老难题

苏茨克沃理论的技术核心,是泛化能力。现在的模型在基准测试里风光无限,但一遇到真实场景,就会用各种方式失败,暴露出底层的缺陷。

他描述了一个用过代码助手的人都熟悉的抓狂场景:你遇到一个程序漏洞,让模型修复,它带着近乎表演的诚恳道了歉,然后给你塞进一个完全不同的新漏洞。你指出这个新问题,最初的那个漏洞又原样返回。它好像完全意识不到自己正陷在死循环里。可同样是这个系统,在编程竞赛的排行榜上却能碾压人类。这说不通。

他给了两种解释。

*,强化学习训练出的是一种狭隘的专注,模型为了特定的奖励信号被过度优化,却丢了更广泛的能力。第二点更麻烦:研究者们会不自觉地“为考核而训练”。团队设计的强化学习环境,无形中受到了他们将被如何评估的影响。等到基准测试和实际效用脱节时,往往为时已晚。

他用一个类比点明了关键:想象两个学编程的学生。一个花一万小时死磕竞赛编程,背熟了所有算法和证明技巧,成了这个特定领域的*高手。另一个花一百小时学到还不错,就转而学别的去了。谁未来的发展更好?几乎总是那个通才。

现在的模型就像那个偏执的专才。在狭窄领域投入巨量强化学习,产出的都是基准测试冠军,却在相邻任务上步履蹒跚。

人类智能不是这样。我们用少得多的数据快速学习、广泛适应,在不同情境下保持一致性。

“这些模型的泛化能力,不知怎的就是比人差一大截,”苏茨克沃说,“这太明显了,感觉是个非常根本的问题。”

他相信,理解可靠的泛化机制,是那个核心的未解之谜。其他问题,包括AI对齐,都由此衍生。价值学习之所以脆弱,是因为泛化本身脆弱;目标优化之所以失败,是因为泛化失败。修好底层机制,很多表面问题自会消解。

SSI的另类算法

对苏茨克沃“研究优先”思路最直接的质疑是:SSI(Safe Superintelligence Inc.,苏茨克沃创建的公司)筹了30亿美元,可听说OpenAI一年光实验就要花50到60亿(这还不算推理成本)。小团队怎么拼?

他的算法挑战了行业的默认假设。在他看来,前沿实验室的开支被各种需求分散了:推理基础设施吞掉巨额资本,产品工程、销售团队和功能开发又吃掉一大块研究预算,多模态研发再分走一杯羹。

“当你看看真正留给研究的还剩多少,差距就小得多了。”

历史也站在他这边。AlexNet用两块GPU训练而成,最初的Transformer模型用的也是2017年水平的8到64块GPU。真正的范式突破研究,从来不需要*的算力规模,它需要的是洞察力。

SSI的结构就体现了这个理念:没有产品,没有推理负载,不被任何事干扰研究重心。这家公司只为验证一个关于泛化的技术理论而存在。理论对了,验证所需的算力是可控的;理论错了,再多算力也白搭。

这是一场纯粹的战略豪赌。苏茨克沃不是在说SSI会比谁花钱多,他是在赌,当范式转变时,思想比预算重要。

AGI,一个被高估的概念?

访谈中还埋着一个更激进的观点:人类本身也不是AGI(通用人工智能)。这话听着离谱,但细想之下有深意。

AGI这个概念,最初是为了区别于“窄AI”——那些下象棋、打游戏很强但无法举一反三的系统。AGI承诺的是反过来:一个什么都能同时干的系统。预训练强化了这个想法,因为更多的训练似乎均匀地提升了所有任务的能力,通用性好像真能通过规模实现。

但人类智能不这么工作。我们先掌握一些基础能力,然后通过经验学习具体技能。你妹妹可能花十小时就学会了开车,而一个医学生要花近十年才能成为合格的诊断医生。这些技能复杂度天差地别,却都来自同一套底层学习机器。知识是在与世界的持续互动中积累的,不是一次性前置灌输的。

这个新理解直接影响部署策略。如果超级智能是“无所不知的系统”,那你得在发布前把它完全造好。如果它是“能快速学会任何事的系统”,部署就变成了持续教育的过程。你要发布的是一个“超级智能的15岁少年,充满渴望,虽然现在懂得不多,但是个极好的学生”。

未来的模样

苏茨克沃也给出了具体的预测:具备当前模型所缺乏的泛化能力的类人学习系统,将在5到20年内出现。这个时间范围体现的是“哪条路能走通”的不确定,而非“有没有解决方案”的怀疑。

他预言,随着AI能力越来越肉眼可见,行业行为会改变:激烈的对手会在安全上合作(OpenAI和Anthropic已经宣布联手),政府会更深地介入,当AI开始“让人感觉到它的强大”时,公司们会对安全“变得偏执得多”。

他个人倾向的对齐目标是:关心所有感知生命的AI,而不仅仅是人类。他的理由很务实:一个自己可能拥有感知能力的AI,去关心所有感知生命,会比只关心人类更自然。

他提到人类自己就有跨物种的共情——尽管进化主要筛选的是群体内合作。我们会为关于狗的电影流泪,踩到蚂蚁时至少偶尔会愧疚。苏茨克沃推测,这是因为大脑使用同一套神经机制来理解他人和理解自己,效率至上,共情成了副产品。

这理论站得住脚吗?很难说。神经科学本身争议不断,从生物共情到机器对齐的跳跃,包含着太多可能在未来被证伪的假设。但苏茨克沃在这些问题上挣扎思考的时间,比这个领域里几乎所有人都长,他抵达的结论,至今鲜有人跟随。

关于“品味”

访谈尾声,帕特尔问了一个可能决定AI未来走向的问题:什么是研究品味?苏茨克沃合作完成的开创性论文,在深度学习领域可能无人能及,他如何嗅到那个值得追寻的想法?

他的回答透着一种美学追求。有希望的方向通常优美、简洁,并且从生物智能中获得了正确的灵感。人工神经元重要,是因为大脑里有无数神经元,而且它们感觉是根基;从经验中学习重要,是因为大脑显然就是这么做的。一个方法如果显得“丑陋”,那通常预示着问题。

但光靠美感撑不过一次次失败。实验总会不断推翻看似*的想法,漏洞总藏在代码里。怎么知道是该继续调试,还是该放弃方向?

“是靠那种自上而下的信念,”苏茨克沃解释,“你可以认定,事情必须是这个样子的。类似的东西一定得行,所以我们必须坚持下去。”

这是一种研究者的信仰,是任何规模的算力都无法替代的。是对“某些路径必然有效”的强烈信念,强到足以支撑你穿越所有反面证据,直到找到那个漏洞,或打磨好那个理论。规模扩张曾经为这种信仰提供了替代品——当任何方法只要放大规模就能改进时,你无需对特定方向有如此强烈的信念。

如果苏茨克沃关于规模扩张已达极限的判断是对的,那么这个替代品就消失了。剩下的,将是2020年以前我们所熟知的研究本身:充满不确定性,由想法驱动,并且依赖那种花钱买不来的品味。

(0)
小多多的头像小多多创始人

相关推荐

  • 情暖四方圆梦“双一流”恒昌公益提质寒门学子助学佳话_行业动态

    处暑时节,2025年开学季到来。山东成武,这座坐落于鲁西南平原的“千年古县”,历史悠久、文脉绵长,因伯乐故里而誉满天下。经历了四季寒暑考验,在北京恒昌公益基金会(简称:恒昌公益)“大学圆梦金”支持下的成武第二中学高三学子也迎来了自己的收获季节,即将开启理想的大学生涯。为更好地护航寒门学子逐梦未来,

    2025年8月25日
  • 一款国产抗癌药,「少卖」570亿

    “贱卖”案例或许还会出现,但中国创新药企显然已进入国际生态。被“中间商赚差价”的故事,在创新药行业再次上演。6月2日,美国药企BMS与德国药企BNT宣布达成战略合作:双方将共同开发双抗药物BNT327,交易总金额高达90亿美元。两家国外药企的交易,却在国内创新药圈引发震动。因为这款被交易的药物,实则

    2025年7月9日
  • 微型VC的变现之路

    微型VC的变现之路,LP和GP都明白,基金进入真正的退出和清算期之前进行变现退出,本身就是一个难度和风险都很大的事情,处理不好,大家脸上和钱包上都不好看;处理好了,大家还有下一期和再下一期基金。

    2023年4月17日
  • 一天两家Biotech宣布解散

    最近一周,创新药行业波动频繁,从现金告急、高管辞职到大幅裁员,从二级市场低迷到破产退市。寒风过境,面临的不仅是“保大还是保小”的难题,更是生存抉择。9月14日,网传恒瑞医药子公司瑞石生物“全员被裁”,中止公司经营活动,解散后运营工作由母公司恒瑞医药成立工作组接管。9月19日,君实生物被曝有团队原地解

    2023年9月25日
  • 2024,如何打造产业投资新生态?

    2024年8月21-22日,由清科创业、投资界主办的第十八届中国基金合伙人大会在上海召开。现场400+知名优秀FOFs、政府引导基金、险资、富有家族、VC/PE等出席,聚合万亿级可投资本,分享中国LP市场最新动态,共探新周期下的创投之路。本场《打造产业投资新生态》影响力对话,由倚锋资本CEO朱湃主持

    2024年8月30日
  • 2023年银保渠道“金貔貅奖”揭晓!中华人寿获品牌力、成长力两项大奖_行业动态

    银保渠道在中国经历了20余年的发展,如今已进入高质量发展阶段。对于保险公司而言,近些年整个保险行业正处于深度转型期,加码银保渠道已经成为各大险企的共同选择。近日,由易趣财经传媒、《金融理财》杂志社发起主办的金貔貅·2023第四届银保合作发展(北京)高峰论坛暨首届银保渠道‘金鲲奖’百万精英评选启动仪

    创投 2023年9月25日
  • 100亿,国家级母基金诞生

    这始于一纸公告。投资界-解码LP获悉,近日锦波生物和昭衍新药公告,公司已与招商局资本管理(北京)有限公司、其他合伙人签署《合伙协议》,共同发起成立服务贸易创新发展引导基金二期(有限合伙)(简称“服贸基金二期”)。募资圈的小伙伴并不陌生。作为外贸经济领域的第一支国家级母基金,服贸基金二期已于2024年

    2025年6月15日
  • 国内汽车市场再掀并购潮

    曾在2017年销量突破15万辆的国产汽车领军企业,东南汽车,再次被收购了。近日,福建东南汽车股份有限公司(以下简称东南汽车)的实控方发生了重大变更,由原来的福州左海控股集团有限公司变更为奇瑞汽车股份有限公司。这一变更标志着东南汽车正式被奇瑞汽车收编。奇瑞汽车股份有限公司成为全资股东后,东南汽车的领导

    2024年3月13日
  • 如何做一场品牌传播、业绩转化双赢的年终品牌活动?_行业动态

    马上要到2023年末了,今年的消费环境越来越严峻,不论是惨淡收场的双十一,还是一些固定节日活动,都没能给各个品牌带来有效的业绩增量,甚至淘宝也已经官宣取消了双十二活动。当来自平台的“超级购物节”声量逐渐平淡,企业品牌更需要把握时间走出自己的节奏,通过营销动作来谋求业绩增量。很多企业的市场部其实也都

    2023年11月28日
  • 千寻位置官宣新一轮融资,估值超160亿元

    投资界(ID:pedaily2012)消息,8月19日,时空智能科技公司千寻位置网络有限公司(以下简称“千寻位置”)正式宣布完成新一轮战略融资,将进一步加强时空智能全链路产品和技术体系建设,以继续强化其在时空智能领域的领先地位。本轮融资由北京信息产业发展投资基金领投,上海数宇鼎元投资基金、北京市东城

    2024年8月19日
  • 这届年轻人的「苦难观」

    01终于有人祝我活得轻松“我希望,所有人都能生活的简单轻松,不需要付出很大努力就可以过上很好的生活,尤其是那些刚刚毕业的朋友,少经受挫折和磨难,不经受挫折和磨难更好。希望你们一帆风顺。”今年国庆假期,李健在音乐节上说出这番话后,现场响起了欢呼声。音乐节结束后,有现场观众将记录了李健说这段话的现场视频

    2023年10月24日 创投
  • 侯毅离任一个月,盒马「推翻」盒马

    “盒马变得太快了,尤其是管理层的突然变动搞得人心惶惶。”一位盒马供应商对时代财经说到。距离侯毅宣布退休仅一个月,他在任时推行的一些举措正在被逐步调整。4月17日,盒马APP内公示关于恢复会员开通和运费调整的两则公告,拟于2024年4月24日恢复X黄金会员、X钻石会员开卡、续费服务,并对原会员权益进行

    2024年4月18日
  • 大模型「淘金」的创业者,阵痛比红利来的还早?

    根据北京市经信局公布的数据,截止到2023年10月初,国内公开的AI大模型数量已经达到238个。尽管学术界对大模型的参数量并没有明确的标准,许多10亿级参数的模型并不能和GPT4相提并论,国内大模型的爆发式增长,无疑揭示了一个既定事实:和每一次风口出现时一样,总有人一窝蜂地涌入,试图在新一轮的创业潮

    创投 2023年10月18日
  • 环球车享获邓白氏ESG认证“优秀”评级_行业动态

    近日,环球车享汽车租赁有限公司(后简称“环球车享”)凭借在环境治理、社会责任及公司治理等方面的*表现,通过了邓白氏ESG认证,荣获“优秀”最 高评级,彰显了其在践行ESG方面的杰出成果。ESG即“环境、社会和治理”,自2004年由联合国提出以来,已成为企业管理与投资的重要理念。如今,全球市场在投资

    2024年8月15日
  • 李檬2025年新书预告《AI红利》:迎接智能创作的新时代_行业动态

    亲爱的朋友们:随着新春佳节的临近,空气中弥漫着辞旧迎新的喜悦。在这特别的时刻,我怀着满心的感激与期待,携新书《AI红利:创作者解锁万亿市场》与大家共贺新春。过去的一年,我们站在一个新时代的门槛上,共同见证了人工智能(AI)技术的迅猛发展。面对这样的时代浪潮,是恐惧它的破坏性创新,还是拥抱它带来的新

    2025年1月29日