特斯拉其实是一家AI公司

人形机器人上一次这么火,还是2016年波士顿动力的Atlas。Atlas的名场面是被波士顿动力员工一棍子撂倒,整个过程栩栩如生,引发了“停止霸凌机器人”的后现代哲学思考。后来,改进版的Atlas完成了后空翻等一连串高难度动作,在公司内部的地位提升肉眼可见。但波士顿动力的走向却和舆论热度成反比:201

机器人上一次这么火,还是2016年波士顿动力的Atlas。

Atlas的名场面是被波士顿动力员工一棍子撂倒,整个过程栩栩如生,引发了“停止霸凌机器人”的后现代哲学思考。

后来,改进版的Atlas完成了后空翻等一连串高难度动作,在公司内部的地位提升肉眼可见。但波士顿动力的走向却和舆论热度成反比:

2013年被谷歌收购,2017年被甩卖给软银,2020年又卖给了韩国现代,逐渐泯然众人。

带起当下人形机器人节奏的,是个既出乎意料又情理之中的名字:特斯拉

从2021年到现在,特斯拉的人形机器人以每年一次的频率,稳定的刷着存在感:

·2021年AIDay,特斯拉PPT首发了人形机器人Optimus的概念机设计方案,由于缺少后空翻这种直观冲击,影响力只局限在A股相关概念股

·2022年的AIDay,特斯拉把Optimus的原型机搬到了会场。身高还是一米七,体重从上一年的50kg暴增至73kg,可以完成招手、搬运物体等简单工作,但走路需要特斯拉员工搀扶。

·2023年股东大会,Optimus以视频形式出场,不仅走路不用人扶了,还能完成物品分类、分拣等更高难度动作。

特斯拉其实是一家AI公司

Optimus体重暴增前后

虽然在舆论场的声量远不及当年的波士顿动力,但特斯拉的Optimus引发了产业界的沸腾,原因有两点:

一是相比Atlas百万美元的造价,马斯克表示Optimus两万美元就能买回家,说明人形机器人有大规模量产的可能。

二是通用性,在特斯拉的演示视频里,Optimus已经可以完成很多简单的体力劳动,潜在销路大增。

问题随之而来:为什么是现在?为什么是特斯拉?

一次技术浪潮

理解人形机器人的技术浪潮,首先要了解它和传统的工业/服务机器人的区别。

简单来说,传统机器人大多基于特定的规划执行特定的操作,比如运输、分拣,不具备感知和决策能力。人形机器人不仅能与物理世界交互,还有感知和理解能力。

举一个不太恰当但好理解的例子:送餐机器人执行“把外卖送到1203号房”这个任务时,并不理解什么是“外卖”和“1203号房”,只是根据软件系统既定的指令和路线规划完成任务。

但人形机器人可以借由智能化,理解物理世界各种物体、语言和文字的含义,并自主规划和决策。

所以理想状态下,机器人不仅可以送外卖,还能顺便洗个碗,走之前再把垃圾带下去。当然马斯克想的更远:让Optimus军团搭乘SpaceX的龙飞船登陆火星。

因此,两者的*区别就在“通用性”,一个只能完成预先规划的特点任务,一个理论上什么都能干。

技术跃迁的背后,是人工智能近20年来的两次里程碑事件:

*次是2012年,Geoffrey Hinton三人组携AlexNet算法参加ImageNet图像识别大赛,以84%的识别准确率夺得冠军。神经网络从多种技术路线中脱颖而出,成为人工智能的*解。

所谓神经网络,可以理解为用算法模拟人脑的运行机制,配合足够规模的数据和算力,理论上人脑能够实现的智能,计算机也能实现。李飞飞举过一个形象的例子:

如果把眼睛当作照相机,一个三岁的孩子就已经拍摄了上亿张照片,借此认识世界。那么只要让算法看足够多的图片,算法也能够识别物体。

2012年,李飞飞创建的数据集,AlexNet在算法上的创新,加上Geoffrey Hinton三人组开创性的使用了英伟达显卡训练算法,数据、算法、算力齐备,人工智能迎来爆发期,人脸识别、机器翻译、自动驾驶等场景迅速落地,GPU订单雪花一般飘向圣克拉拉的英伟达总部。

顺带提一句,Geoffrey Hinton的新东家Vayu Robotics,就是一家做机器人的公司。

第二次是2017年,Google八位员工公开了Transformer架构,开启了大模型时代。

两次的区别可以简单概括为,2012年的AlexNetAI有了“感知”的能力,而Transformer和之后的大模型让AI有了“生成”的能力。

举例来说,2012年的AI可以识别出各种各样的猫,2017年之后的AI已经可以自己生成猫的图片了。

“感知”让AI能够学习人类对世界的认知,“生成”让AI有自主决策的能力。至此,机器人的地基已经打好了。实际上ChatGPT和各类AI Agent,已经可以视为具备感知和决策能力的机器人。

只不过这类“机器人”局限在数字环境,有量大管饱的参数和算力就能搓出来。但人形机器人需要与真实的物理世界交互,就需要真实世界的参数训练。同时,由于硬件产品的存在,又会触及制造业的核心命题:低成本大规模量产

从早年的本田ASIMO,到几年前的波士顿动力Atlas,都是栽在了无法低成本量产,导致没有商业化场景的问题上。

而特斯拉进展神速的秘密在于,他们抓住了人形机器人的“前置产业”:自动驾驶

一个“前置产业”

2021年的AI Day上,马斯克曾说:我们几乎拥有人型机器人所需的所有部件,因为我们已经制造了带轮子的机器人。

这句话其实很好概括了特斯拉在人形机器人上的发展策略:用汽车研发的经验给机器人开路。

如上文所说,本轮人形机器人浪潮的想象空间在于“通用性”,也就是把机器人从基于特定规划执行任务的功能性产品,变成具备感知和决策能力的智能设备。

此前的种种智能化路线,往往都难以脱离“穷举法”的桎梏,导致始终会面临像这个程序员段子一样的尴尬问题:

特斯拉其实是一家AI公司

但Transformer打开大模型时代后,带来了两个立竿见影的改变:

一是把无法实现的穷举法变成了简单粗暴的大力出奇迹:只要让机器学习足够多的数据,就能拥有类人的智能,可以脱离预设的规划进行自主决策。

二是多模态能力的建立,让机器人可以实现感知-决策-执行的整个流程。

一个样板工程是今年7月《纽约时报》探班谷歌实验室, 完整记录了基于RT-2模型的机器人智能闪现的瞬间:

桌子上放着恐龙、鲸鱼、狮子三个塑料玩具,工程师让单臂机器人“捡起灭绝的动物”,机器人拿起了恐龙。

这意味着机器人不仅能识别三种动物,也能理解“灭绝的动物”的含义,还可以完成具体的操作。

以此类推,只要数据、算法、算力三要素满足,那么机器人不仅能抓取灭绝的动物,还能自己切菜刷锅洗碗,甚至先切十斤精肉不见半点肥的,再切十斤肥的不见半点精肉。

如果可以实现,那么机器人的应用场景就大幅度增加,比如做饭、打扫卫生、照顾老人。而且机器人还会依照算法不断自我学习自我进化,自驱力秒杀99%的打工人。

特斯拉其实是一家AI公司

Google的RT-2模型论文

自动驾驶的技术演进一度万马齐喑,就在于难以脱离“穷举法”的陷阱,直到以神经网络为代表的人工智能兴起。而人形机器人的既定发展路线,恰恰与自动驾驶的技术演进完全吻合:

两者的核心都是基于人工智能,实现感知-决策-执行的完整链条。

这就意味着无论是软件层面的算法,还是硬件层面的视觉传感器、FSD芯片等零部件,理论上都可以用于人形机器人。这也是为什么马斯克会说:当你能解决自动驾驶,你就能解决现实世界中的人工智能。

如果把新能源车理解为“带轮子的机器人”,那么特斯拉的布局其实可以追溯到2014年9月*版Autopilot发布。在这过程中,特斯拉一步步用自研软硬件替换掉了第三方的方案,为Optimus机器人探路。

最核心的自动驾驶芯片上,特斯拉最初采用Mobileye的方案,后来换成了英伟达。2019年,特斯拉自研的FSD芯片正式上车,沿用至今。

软件算法上,特斯拉在2020年对底层代码进行了网络重构,引入了Transformer架构,实现将2D图像拼接为3D视角,随后又3D空间基础上加入了时序信息,转化为4D空间。2022年引入占用网络(Occupancy Network),解决通用障碍物识别问题。

云端算力上,特斯拉在2021年AI Day首次公开了Dojo超算和自研的D1芯片。至此,特斯拉完成了从云端到终端,核心软硬件的自研。

因此,Optimus在2021年的公开亮相,并不是巧合。

一家伪装成汽车制造商的AI公司

为什么波士顿动力的Atlas成本高达百万美元,特斯拉Optimus的目标价位只有两万美元?

因为那98万已经由广大特斯拉车主先行分摊了。

虽然机器人所需的数据集与自动驾驶有所不同,控制系统也有差别,但自动驾驶还是*的帮人形机器人解决了“VR式难题”。

VR经历了无数个“元年”依然死气沉沉,核心在于如果要满足VR头显对性能、体积和能耗的要求,手机的研发经验几乎无法复用,软件系统和处理器、屏幕这些零部件,都要重新走一遍从0到1的过程。

在产品不成熟、应用匮乏的情况下,消费者兴致寡然,导致企业无法大规模生产摊薄成本,而高昂的售价又进一步加剧这个恶性循环。

人型机器人则相反,研发过程中耗资巨大的软件算法、数据采集、芯片和传感器等零部件、云端算力设施,都在自动驾驶的开发过程中建设完成了。

几乎所有人工智能的应用都需要算法、算力、数据三驾马车来拉动,算法决定了AI识别和决策的方式;但强大的算法需要足够的算力来驱动;同时,算法的提升又需要大规模高质量的数据;三者相辅相成,缺一不可。

具体到人形机器人,Optimus的每一个环节,都能照抄S3XY四大车型的作业。

算法层面,Optimus的软硬件几乎照搬了特斯拉电动车的方案:

Optimus共配置有3颗摄像头,左右眼各一个,外加一颗鱼眼广角。芯片是和电动车一模一样的FSD自动驾驶芯片,参照当前HW3.0系统的算力,Optimus的算力为72TOPS(车里有两颗,机器人只有一颗)。

软件上,Optimus承袭了特斯拉自动驾驶的BEV+Transformer+占用网络的方案。简单来说,算法会将摄像头拍摄的画面“拼”成一张动态的4D图像,并规划行车路径。在Optimus的演示里,其识别和决策系统与自动驾驶算法如出一辙。

特斯拉其实是一家AI公司

Optimus的视觉传感系统

2023年特斯拉股东大会,马斯克就表示,特斯拉已经打通了FSD和机器人的底层模块,实现了一定程度的算法复用。

算力层面,依靠2021年发布的D1芯片,特斯拉组建了自己的算力集群DojoExaPod。

一套Dojo ExaPod包含3000个D1芯片,总算力达到1.1EFLOP,相当于14000块A100的算力。Dojo主要服务于特斯拉的自动驾驶任务,但也可以无痛切换到机器人的训练。特斯拉为汽车设计的碰撞模拟软件,也可以给Optimus编写跌倒测试程序。

数据层面,特斯拉已经拥有了规模*的数据采集网络。

和GPT等大模型不同,自动驾驶与机器人需要物理世界的真实数据来训练算法。与自建工程车队,专门采集数据的自动驾驶公司不同,特斯拉车主组成了一个规模庞大的免费外包车队,加上近30万购买了FSD功能的车主,源源不断的将真实数据传送给Dojo训练。

2022年的AI Day上,特斯拉宣称已经存储的有价值训练数据集有23.2万帧,验证数据集0.38万帧。

Optimus中负责驱动的电机也来自特斯拉电动车现有的方案。不过考虑到机器人的灵活性更强,单独的电机数量远远超过电动车。

特斯拉其实是一家AI公司

总结一下,新能源车和自动驾驶可以靠自身的造血能力,替人形机器人趟过研发开支最密集的阶段;同时,自动驾驶的落地也为人形机器人积累了大量数据采集、算法迭代、模型训练的工程化经验。

波士顿动力的日益平庸,特斯拉的后来居上,背后的变量都是人工智能的技术革命,和自动驾驶这个“前置产业”。

马斯克在AI领域的涉足常被忽略,他其实是OpenAI的创始人之一,也是DeepMind的早期投资人。他参与的人工智能公司还有脑机芯片Neuralink、聊天机器人Grok。

特斯拉每天接受并处理的视频画面超过1600亿帧,这是商业公司能拥有的*的真实世界数据集,不仅能拿来精进自动驾驶系统,还能给Optimus做预训练。

人们觉得特斯拉属于制造业,其实它更像一家软件公司。特斯拉的自我介绍是“纯电动车、太阳能和清洁能源”,但实际上,它是一家彻头彻尾的人工智能公司。

(0)
小多多的头像小多多创始人

相关推荐

  • 如何应对员工在年底离职 想要留住员工其实方法很多

    各行各业在春节期间都要面对一个问题那就是员工的离职潮,那么到底该如何应对这种情况有没有什么方法留住员工呢?今天的这篇内容就是和大家分析这个问题的! 首先每个管理者了解员工内心所想,…

    创投 2022年1月25日
  • 亏了5亿个冰淇淋,宝马不冤

    亏了5亿个冰淇淋,宝马不冤,宝马首先应该思考的是,怎样用真诚和尊重来挽救全世界消费者,尤其是中国消费者的信任。

    创投 2023年4月24日
  • 跨境电商概念股有哪些 追热点的投资者需要了解

    投资追热点也是一个非常好的投资策略,那么在A股市场上最近的热点就是跨境电商了,这篇文章就给各位介绍几家做相关业务的公司! 华图山鼎:公司拟作价11亿元购买萨拉摩尔100%股权,其中…

    创投 2022年1月25日
  • 液冷时代,等待补齐「标准」的短板

    随着单芯片的能耗和单机柜的密度在不断上升,数据中心发展液冷已经成为行业共识。但在行业大规模应用之前,液冷标准的匮乏和产业不成熟,成为当前液冷产业*的制肘。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍过去一年,浪潮信息做了一两百次的客户交流,话题都很一致,聊的都是液冷,这个数字比前一年增加了10倍以上,“大家都

    2024年1月25日
  • 贷款车能过户吗 未还清车贷款之前是不能过户的

    贷款车能过户吗?据悉一般来说,利用贷款买的车在未还清车贷款之前是不能过户的,因为车辆被抵押给了贷款机构。只有汽车的使用权,而没有处置权。如果要想转让你的车辆,必须经过债权人的同意。…

    2022年1月25日
  • 了不起的新徽商

    从鲜有人问津到风投强省,从工业真空带到未来产业城,短短十多年,安徽从传统农业大省摇身一变,成为“新兴产业聚集地”。2022年,安徽GDP规模达到4.5万亿,首次超越上海跻身全国经济*,合肥更是凭借“芯屏汽合”(芯片、屏显、汽车、产业融合)和“集终生智”(集成电路、终端产业、生物技术、人工智能)等新兴

    2023年12月29日
  • 全国各大保险公司客服电话一览

    序号 保险公司 全国客服电话 1 中国安全 保险(集团)股份有限公司955112中国安定洋保险(集团)股份有限公司955003中国人寿保险股份有限公司955194阳光保险集团股份有…

    2022年3月31日
  • 618回归「价格战」:京东淘宝进入存量竞争,小红书、视频号深入电商直播

    618回归「价格战」:京东淘宝进入存量竞争,小红书、视频号深入电商直播,“价格战”是今年618各平台的竞争核心点。背后的原因在于,电商平台进入存量竞争时代。除了低价刺激用户消费外,电商直播在大型商业促销活动中的存在感越来越强。

    2023年6月9日
  • 2023闲鱼年度热词发布:疯狂省钱的年轻人,爱上找搭子_行业动态

    距离2024年还有不到一周的时间,各家平台的年度报告接连发布,复盘这一整年的生活痕迹,也是重新见证这一年的成长。当然了,年轻人最关心的重点一直都是“好好生活”,为了好好生活,年轻人总在思索如何拥有财富,把物质价值发挥到*,把每一笔钱都花在刀刃上。在2023年的消费世界,又有什么新的省钱门道,年轻人

    2023年12月26日 创投
  • 仅一周时间,左小姐在上海连开3家新门店!_行业动态

    品牌升级是品牌发展的重要一环,左小姐秉承着一直以来的原则与服务理念,致力于为顾客为加盟伙伴提供更全面、更周到的体验。为了更好地满足加盟伙伴的…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年3月31日
  • 《漫长的季节》与《繁花》中的港商

    ‍“表面是饮食男女,里面是山河岁月、时代变迁。”昨晚(1月9日),2024开年大剧《繁花》落下帷幕。作为王家卫导演的首部电视剧,《繁花》一经上线就是话题中心,剧集热度居高不下。有着电影般质感的《繁花》,在王家卫的手中变成了一个怎样的故事?《繁花》以改革开放时期的上海为背景,讲述一无所有的阿宝(“胡歌

    2024年1月10日 创投
  • 年底离职有13薪吗 公司不同情况不同没有确定答案

    对于想要离职的人尤其是在春节期间想要离职的朋友们来说,年底的话最在意的一定就是能不能在离职的同时拿到13薪,接下来的文章就是和感兴趣的朋友们聊一下相关的一些话题! 一般而言第十三薪…

    创投 2022年1月25日
  • 3天狂赚370亿!被挤爆的景区,救活了多少导游?

    3天狂赚370亿!被挤爆的景区,救活了多少导游?,在强烈的刚需之下,旅行社和导游们拿出最大诚意打出了一场场翻身仗,让更多的宝藏地被看见。想要抓住这波旅游复苏风口,关键还是回归本质,不玩骚操作不搞套路。

    2023年7月17日 创投
  • 小规模纳税人申报表如何填写 一些需要注意的地方

    小规模纳税人申报表如何填写?据悉增值税纳税申报表(适用小规模纳税人)每季度申报一次,就算是公司没有业务,收入为0也要申报,告诉税务局你没有收入,这种情况是不需要缴纳税款的。 《增值…

    创投 2022年1月25日
  • 2022年适合乡镇创业 投资者不能错过的好文章

    每到一年的末尾,都会有很多的投资者计划来年的创业项目,马上就要到2022年了,那么有哪些项目很适合2022年在乡镇创业呢?这篇文章就跟大家聊聊。 首先给朋友们推荐的就是种植水果玉米…

    创投 2022年1月25日