Sora证明马斯克的是对的,但特斯拉和人类可能都输了

Sora 证明特斯拉的思路是对的,而特斯拉证明 Sora 的价值不止是生成视频。Sora 推出,马斯克可能是心情最复杂的一个。不仅因为其本人与 OpenAI 早年的纠葛,更因为 Sora 实现的其实是特斯拉早几年间一直在探索的方向。2 月 18 日,马斯克在科技主播 @Dr.KnowItAll 一条

Sora 证明特斯拉的思路是对的,而特斯拉证明 Sora 的价值不止是生成视频。

Sora 推出,马斯克可能是心情最复杂的一个。不仅因为其本人与 OpenAI 早年的纠葛,更因为 Sora 实现的其实是特斯拉早几年间一直在探索的方向。

2 月 18 日,马斯克在科技主播 @Dr.KnowItAll 一条主题为「OpenAI 的重磅炸弹证实了特斯拉的理论」的视频下留言,称「特斯拉已经能够用精确物理原理制作真实世界视频大约一年了」。

随后他在 X 上转发了一条 2023 年的视频,内容是特斯拉自动驾驶总监 Ashok Elluswamy 向外界介绍特斯拉如何用 AI 模拟真实世界驾驶。视频中,AI 同时生成了七个不同角度的驾驶视频,同时只需要输入「直行」或者「变道」这样的指令,就能让这七路视频同步变化。

Sora证明马斯克的是对的,但特斯拉和人类可能都输了

当然,这不意味着特斯拉早在一年前就掌握了 Sora 的技术,毕竟特斯拉的生成技术只用于模拟车辆行驶,而 Sora 能够处理的环境、场景、Prompt、物理规律等信息更加复杂,二者在难度上不可同日而语。

但特斯拉 AI 和 Sora 训练的思路是一致的:并不是训练 AI 如何生成视频,而是训练 AI 理解和生成一个真实的场景或者世界,视频只是从某一个视角观察这个场景的一段时空。这是两家在现有业务上完全不同的公司,以彼此不同的方法来感知真实世界,而他们共同希望通向的,都是 AGI(通用人工智能),甚至更具体一些,就是具身智能和智能体。

理解这个观点的核心,是理解 OpenAI 为 Sora 赋予的使命,并不只是替代视频生成的创作者,而是将视频生成作为帮助 AI 理解真实世界的「模拟器」。如果说特斯拉数以百万计的车辆仍然需要用「肉身」感受这个世界,那么 Sora 则是单纯依靠数据的输入,建立起对世界的认知。

Sora证明马斯克的是对的,但特斯拉和人类可能都输了

OpenAI 官网上,关于 Sora 的这篇研究论文名为《把视频生成模型作为世界模拟器》。请注意「世界模拟器」(world simulators)这个关键词,它是比生成视频更关键的核心所在。

其实,早在特斯拉发布 FSD V12 的时候,这家以汽车为主要消费产品的人工智能公司,就已经展示了类似的能力。

如何理解呢?首先,在 FSD V12 上,工程师删除了超过 30 万行定义驾驶规则的代码,系统将从被「投喂」的驾驶视频中,学习如何应对真实的驾驶场景,而不是向过往那样,按照写好的规则,在某个特定场景下执行某一个具体的命令。

当然,和作为「生成式模型」的 Sora 不同,FSD 的目标是实现自动驾驶,所以它并不需要真正生成一个具体的视频。你可以想象成一个人(或者智能体)正在进行「防御性驾驶」,基于过往经验,可以对周围环境中交通参与者的下一步移动趋势做出判断。这个判断存在在头脑里就行了,不需要真正把它画在纸上。因此,特斯拉的 FSD 也不需要把对未来的想象,生成为一个真实视频,并呈现在车辆的某一个屏幕上。

所以,现在有 OpenAI 和特斯拉两家完全不同的公司,用截然不同的方式和路径,实现「通过视频生成,让 AI 理解物理世界」这个相同的目标。

简单了解一下 Sora 的运行逻辑:OpenAI 表示,Sora 结合了 Transformer 和 Diffusion 两个过去几年最重要的模型。ChatGPT、Gemini、LLaMA 等语言模式都是基于 Transformer 模型,它对词语进行标记,并生成下一个单词;Diffusion 模型则是「文生图」的代表。

如果从「理解世界」的角度来审视 Sora,那么某一帧图像的画质、画面关系绝不是模型质量高低的评判标准,甚至官网释出的 60 秒一镜到底视频也不是最核心的部分。重要的是这个生成的视频可以被剪辑——在不同的机位下,无论是广角、中景、近景、特写,视频中人物和背景的关系都保持着高度的「一致性」。这才是 Sora 遥遥*并接近真实的地方。

这一点和特斯拉在 FSD 上采取「纯视觉」方案可以结合理解。简单来说,99% 的车企或者智驾团队都会在车辆上保留激光雷达,通过激光束的发射和接收,辅助计算周围物体和车辆间的距离关系。但马斯克不仅删除了 30 万行代码,还移除了雷达,只依靠高清摄像头采集和神经网络学习来判断距离关系。

无论是对特斯拉,还是对 OpenAI,这都是巨大的挑战。毕竟输入的画面是 2D 的,但输出的结果(无论是驾驶指令还是视频)都需要基于对 3D 世界的深刻理解。

规模和质量是训练模型的核心。特斯拉的数据来源于真实道路上,搭载了传感器的车辆;而 OpenAI 的大量数据,从目前的公开信息来看,来源于网络。在质量的维度,在《马斯克传》里,作者艾萨克森写道特斯拉通过和 Uber 合作,获取「五星司机」的素材训练 FSD;而从规模出发,奥特曼最近希望筹集万亿规模的资金,就是重注算力和规模的具体体现。

最后,回到一开始的那个问题,为什么我们会认为 Sora 和 FSD v12 是相似的?Sora 和 OpenAI 未来的想象空间又是什么呢?它们和 AGI 又有什么关系?

在马斯克看来,当人工智能可以真正解决一个问题(物理、数学、化学等等)的时候,AGI 就到来了。不过还有另外一个理解维度,那就是具身智能。毕竟现实世界里,并不是只有数学公式和文字规则,拥有一定的智商的小猫小狗也可以依靠运动真实地和物理世界进行互动。

这点对于过去只能输入二维信息的 AI 来说很难做到。这也是为什么马斯克看到 Sora 后在 X 上评价是「GG Humans」,在他看来 Sora 今天做到的,已经打破了过去的次元壁,而能理解真实世界并继续学习,AI 也就有了更进一步影响真实世界的能力。

而就像特斯拉把这种生成能力用于训练车辆,Sora 的价值也不仅仅是生成一个难以让人区分真假的视频,用作影视创作者的生产力工具(尽管这是一个非常困难且刚需的场景)。就像周鸿祎所说,「Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。」

(0)
小多多的头像小多多创始人

相关推荐

  • 年终奖一般什么时候发 那就看是否在合同中有约定了

    每到年底的时间点大家最为关心的还是自己的年终奖什么时候才能发到自己的手里,肯定有不少的读者因为这个事情有不少的困扰接下来的,这篇文章里就跟大家稍微聊一聊这个话题! 首先就是第一种情…

    创投 2022年1月25日
  • 方舟云康再冲港股:估值14亿美元,高特佳、火山石是股东

    方舟云康再冲港股:估值14亿美元,高特佳、火山石是股东,虽然方舟健康把自己定位成慢性病管理平台,但从收入结构来看,方舟健康实际上靠“卖药”支撑营收,这也是当前一众互联网医疗赛道企业的通病。

    2023年6月19日 创投
  • 预制菜春节大洗牌,味知香、千味央厨谁是「硬菜」

    2024年春节预制菜销量走俏,预制菜依然是消费者“年夜饭”上的重头戏。各大生鲜平台、电商、商超、餐饮门店都纷纷开卖春节预制菜。预制菜赛道两大“玩家”:“预制菜*股”味知香(605089.SH)、“餐饮供应链*股”千味央厨(001215.SZ)均在此前公布了2023年三季报,其业绩有所分化。「不二研究

    2024年1月29日 创投
  • 霸王条款惹品牌争议,京东双11站在商家对立面?

    双11活动*天,京东就站上了风口浪尖。与烘焙烤箱品牌海氏的话题接连登上微博热搜,海氏控诉京东滥用市场竞争地位,破坏市场竞争秩序。在海氏的声明中,京东的行为让吃瓜群众大开眼界:擅自更改品牌价格,品牌不同意就锁住其后台权限,品牌递交律师函之后,拉黑品牌工作人员,直接改成了半价。而据海氏描述,京东擅自改价

    2023年10月25日 创投
  • 企业年金退休能拿多少 需要考虑的条件有哪几个

    对于不少的职场人来说企业年金这个词可能都会感到有点陌生,那么到底企业年金是什么大家交了企业年金之后退休能拿多少钱呢?接下来分享的内容就是聊一下这个相关的话题! 只要提起来养老金大家…

    创投 2022年1月25日
  • 拼多多「总部迁移」疑云

    拼多多「总部迁移」疑云,狂奔数年之后,拼多多有了减速的迹象,海外扩张步伐则全方面加速。

    创投 2023年5月9日
  • 市值暴跌100亿美元,投资人拒绝给Shopee转型时间

    在东南亚称霸,迅速铺开全球市场而后仓皇离场,是Shopee近些年给人的印象。2022年经历凛冽的风暴后,2023年二季度其依旧深陷增长乏力的困局之中。近日,Shopee母公司冬海集团公布二季度财报,其营收和增长都低于市场预期。冬海集团二季度总收入为30.96亿元,低于市场约32亿元的预期;净利润约5

    2023年8月21日
  • 当笑果成为庞然大物,一个段子引来立案调查

    当笑果成为庞然大物,一个段子引来立案调查,5月15日,笑果文化对此作出回应:已在第一时间对HOUSE进行了严肃批评,并将无限期停止其后续一切演艺工作。

    创投 2023年5月16日
  • 恒星引力,学不成唐人,做不了于正?

    要说去年8月最出风头的影视公司,非恒星引力莫属。一部《苍兰诀》,给业界留下关于古偶革新的诸多思考,也令粉圈注目这家年轻公司突出的造星能力。然而到了今年8月,恒星引力却仿佛进入了水逆期:《苍兰诀》一周年表面和和美美,实则暗流涌动;《永夜星河》(即遛人无数的晋江新晋言情名著《黑莲花攻略手册》)终于开机,

    创投 2023年8月21日
  • 住房公积金贷款合同编号查询 可以携带身份证到银行柜台查询

    住房公积金贷款合同编号查询?据悉可以登录住房公积金管理中心的官网查询公积金贷款合同的编号,也可以拨打贷款银行的客服电话查询公积金贷款合同的编号,还可以携带身份证到银行柜台查询公积金…

    创投 2022年1月25日
  • 除了交强险必须买哪些车险?车险有必要购买吗?

    现在基本每个家庭都拥有一辆车,而对于有车一族而言,在汽车事故的发生率一直都是比较高的,那么除了交强险外还必须买哪些车险?车险有必要购买吗? 一、车险种类 交强险 交强险是国家强制性…

    创投 2022年3月31日
  • 挣扎在县城药店的年轻人

    经过三年之后的洗礼,在这个流行病高发的时节,每个人家里的屯药量都远远超过了自己所需要的。而药店在不知不觉中越开越多。当我开始有点流感症状之后,随手一搜药品助理发现,在我家方圆五公里以内分布着295所药房,出门散步,不到一百米,就能看见3家药房.药店的密集程度,甚至超过了饭店。这让我不禁好奇:能在五环

    2023年12月5日 创投
  • 炒股是怎么赔钱的 看看你有没有被说中-财经

    说起投资股市,很多人最热衷的就是想知道,有没有什么方法是一定赚钱的,但是这种方法真的是没有的。这篇文章咱们就反其道而行之,看看,炒股赔钱的人都有什么共性,大家有则改之无则加勉。 首…

    创投 2022年1月25日
  • 浙江省「415X」高端装备产业基金招GP

    浙江省产业基金有限公司关于公开遴选浙江省高端装备产业基金管理机构的公告根据《浙江省“415X”先进制造业集群建设行动方案(2023—2027年)》和组建浙江省“415X”产业集群专项基金的战略部署,经浙江省政府批准,浙江省产业基金(以下简称省产业基金)拟联合宁波国有出资主体和社会资本组建设立浙江省高

    创投 2023年9月22日
  • 这几个城市,爆了,但大戏才刚刚开始

    1月13日,哈尔滨冰雪大世界,迎来了一位特殊的表演者:哈尔滨阿城区文旅局局长王殿友,在舞者们的簇拥下,站上舞台C位,在动感的音乐声中,与大家一起热舞、跳跃。王殿友走到台前之时,全国已有多地文旅局长集体“表演”,掀起一股股文旅出圈的热潮。浪潮的背后,则是中国旅游及城市经济,或正迎来拐点式的变化。01.

    2024年2月5日