斯坦福为机器人提了个醒

傅盛说,“2023年是人类历史上第三个奇迹年。”这一年,大模型盛行,人工智能爆发,尤其是在具身智能领域的突破,让机器人有了更大的想象空间。整个机器人产业都在摩拳擦掌,希望能在这样的利好背景下做些什么,才不至于错失良机。迈过2023年,也就是在刚刚进入2024年的*周,斯坦福大学的研究团队又对外公开了

傅盛说,“2023年是人类历史上第三个奇迹年。”

这一年,大模型盛行,人工智能爆发,尤其是在具身智能领域的突破,让机器人有了更大的想象空间。

整个机器人产业都在摩拳擦掌,希望能在这样的利好背景下做些什么,才不至于错失良机。

迈过2023年,也就是在刚刚进入2024年的*周,斯坦福大学的研究团队又对外公开了一个开源项目,一个名为「Mobile ALOHA」的机器人开源项目。

在这个开源项目中,一台配备了双臂的“机器人”能够叠被子、做家务,甚至还学会了烹饪。

尤其是在其公布出的几个忙起来像模像样的视频,一经各种短视频大肆传播,让不少人惊叹,这不妥妥就是我们梦寐以求的保姆机器人吗

然而,和当年跑酷、蹦迪的波士顿动力超能机器人一样,在如今失焦的媒体视角下,斯坦福研究团队的这一项目的魔力再次被神话

面对大家如此始料未及的反响,就连Mobile ALOHA项目联合负责人Tony Z. Zhao都亲自在Twitter上放出Mobile ALOHA执行任务失败的视频,并称,“机器人还没有准备好接管世界!

斯坦福为机器人提了个醒

一波热度将Mobile ALOHA推上风口,一番闹剧让这一项目又面临质疑。

实则,如果花些时间看完这篇论文,就会发现,Mobile ALOHA是一个不错的开源项目,也是一个和现在主流视野中的具身智能略有不同的机器人项目。

01.Mobile ALOHA是什么?

从短视频中看到过它的人都知道:

Mobile ALOHA是一个会收拾家务,又会煎蛋煮饭的机器人,而这台机器人能完成的这些工作,正是家庭保姆机器人所需要的技能。

正因如此,Mobile ALOHA一度被认为是保姆机器人的原型机,甚至被人认为是未来几年内推动保姆机器人出现的关键。

实际上,论文的作者们,并没有想这么多。

在这篇论文中,Mobile ALOHA在硬件上被定义为「一种用于收集双臂运动数据的低成本全身远程操作系统」。

斯坦福为机器人提了个醒

这台机器人,也就是这套系统,主要由以下几个部分组成:

移动底座——一台AGV机器人;

供电系统——一块1.26kW·h、14kg重的电池;

控制系统——一台配备英伟达3070显卡和英特尔i7-12800H的笔记本电脑;

运动系统——两个机械臂;

视觉系统——3个分辨率为480×640、频率为50Hz的摄像头。

如此硬件配置打造出一台如前文所述能在家庭环境下实现诸多功能的机器人,最为关键的其实是两点:

*,机器人移动能力。

看过锌产业此前文章的人应该都了解,在机器人领域,除去工业机械臂外,还有两类机器人已经相当成熟:

一类是用在家庭地面清洁场景中的扫地机器人,另一类是用在仓储搬运场景下的AGV。

实际上,正是关乎机器人移动能力的定位导航、路径规划等技术的成熟,推动了这两类产品在上一个十年逐渐普及。

就移动底盘而言,Mobile ALOHA直接选用了市面上成熟的AGV产品,解决了机器人在家庭环境下的移动能力。

第二,机器人的运动控制能力

这里主要是指机械手臂的运动控制,也是Mobile ALOHA这一开源项目的独特性和技术含量所在。

和现在通过强化学习模型、大模型等驱动机器人自主认识(感知)环境、执行(决策)任务不同的是:

Mobile ALOHA采用的依然是更直接的「模仿学习」——通过人类操作机器人,机器人学习模仿人类行为,构成机器人的行为逻辑

在这一项目发布的视频中,我们看到的人类操作机械臂运动的场景,其实就是模仿学习中人类示教的过程,也是机器人模仿学习中最为关键的一步。

正是凭借这样一套方法论,Mobile ALOHA仅需要人类通过50次演示的训练,在处理日常家务时,就能够达到80%以上的成功率

02.令人挠头的“虾仁炒蛋”

在这篇论文中,作者一共对Mobile ALOHA进行了7项任务的训练和研究,分别是擦红酒、炒虾仁、冲洗平底锅、收纳平底锅、呼叫电梯、推椅子、击掌

在最终呈现出来的演示视频中,最让人惊讶的是,Mobile ALOHA竟然能很好地做出让不少猛男少女都挠头的滑蛋虾仁。

然而,要让机器人做出这样一道菜,其实并没有想象中的那般容易。

除了需要人类示教,让机器人模仿学习外,作者还为Mobile ALOHA导入了一个静态数据集,这个数据集包含了825个任务的双臂执行数据

不过,这825个任务的双臂执行数据与Mobile ALOHA要执行的任务不同,甚至产生这些数据的机器人原型与Mobile ALOHA双臂安装位置也不同

科研是一条漫长的道路,所有成熟的技术最终能够顺利应用,都是众多科学家不断积累,一代代不断基于前人研究成果推陈出新的结果。

基于已有数据集,再加上模仿学习,能否让Mobile ALOHA掌握更好的操作能力,也是这篇论文尝试解释的一个重要问题。

在实际实验过程中,通过为原有数据集加入模仿学习的方法,在执行「推椅子」、「擦红酒」任务时,明显有很好的能力提升,有更强的泛化能力。

具体而言,在将一排5把椅子收到桌子下时,当推到第4、第5把椅子时,这一方法的成功率分别提高了15%和89%。

从实验中整体任务执行成功率来看,在进行50次示教(击掌20次)后,擦红酒、呼叫电梯、击掌、收纳平底锅、冲洗平底锅、推椅子6项任务的成功率分别达到了95%、95%、85%、85%、80%、80%

然而,最惊艳的制作滑蛋虾仁这项长达75秒的的艰巨烹饪任务,实际上,Mobile ALOHA的任务执行成功率只有40%

也就是说,我们看到的Mobile ALOHA*地做好一道滑蛋虾仁,同样是一个概率没有那么大的事件。

看来,“虾仁炒蛋”,不仅让人类挠头,如今也还是让机器人挠头。

03.斯坦福为机器人提了个醒

“虾仁炒蛋”做不好没关系,毕竟,这也不是斯坦福这一个研究团队,以一己之力能够*解决的问题。

实际上,他们想要解决的也并不是这个问题。

他们想要解决的是,能否将现在双臂机器人运动控制的研究方法再往前推一步——验证静态数据集与不同模仿学习算法联合训练的可行性

从这一点上来看,他们做到了。

在一系列实验中,他们验证了ACT、Diffusion Policy(扩散策略)、VINN三类重要的模仿学习算法在Mobile ALOHA上任务执行的成功率都得到了明显的提高

更重要的是,他们打造的这套平台,成本只有3.2万美元(约合22.7万元)。

在此之前,类似Mobile ALOHA的双臂机器人平台PR2、TIAGo,价格普遍在20万美元(约合142万元)以上。

也就是说,斯坦福这一研究团队,为机器人双臂运动控制的研究验证了一个思路提供了一套更便宜的研究平台

虽然没有大家想象的直接搞出一个厨师机器人,甚至保姆机器人来得炫酷,但这样一套开源平台和算法展现出来的效果,尤其是在大模型被神话了的现在,让大家再次意识到了模仿学习对于机器人的重要性

同时也为接下来机器人,乃至人形机器人的上肢运动控制研究,提供了一个新的思路。

而且,这又是一个由华人科学家团队开源的项目。

(0)
小多多的头像小多多创始人

相关推荐

  • 储能变奏:一场大逃杀即将开始

    一个多月前,在国内的两场能源转型论坛上,两位颇具名望的院士把炮口对准储能,直言“储能在新型电力系统中发挥的作用十分有限”,打破了此前把储能视为“新型电力系统压舱石”的行业共识。语出惊人,引发业内哗然。作为能够平抑新能源波动性,与风电光伏结合最紧密的电化学储能,在“双碳”背景之下的重要性不言而喻。然而

    2023年11月11日
  • 玖富万卡申请流程介绍:玖富万卡怎么借钱

    玖富万卡是玖富集团新推出的贷款APP,最高可申请20万额度循环使用,开卡成功即可终身消费,用户信用越高、额度就越高。玖富万卡的额度分期服务提供1-48期不同的期限的借款服务,用户可…

    2022年3月31日
  • 汇聚成海聚力潮生|维谛技术(Vertiv)成功举办“2023合作伙伴睿盟高层沟通”活动_行业动态

    12月20日,维谛技术(Vertiv,NYSE:VRT)成功举办了“汇聚成海 聚力潮生——2023维谛技术合作伙伴睿盟高层沟通”活动,本次活动通过核心议题沟通交流,与合作伙伴协同发展,实现市场破局和业务增长。维谛技术(Vertiv)大中华区董事长李宁、总裁崔益彬以及市场营销与产品应用副总裁田军、技

    创投 2023年12月22日
  • 通达极兔顺丰菜鸟,快递业再迎洗牌时刻

    通达极兔顺丰菜鸟,快递业再迎洗牌时刻,极兔的跃出和菜鸟的入场,说明快递行业依然充满变数,每个玩家都无法掉以轻心。这个和电商发展、和国民消费息息相关的行业,仍然值得被高度关注。

    创投 2023年6月29日
  • 一个新手怎么开理发店 学习一下前人的经验-财经

    万事开头难,很多人都想知道,一个新手的话,怎么开一家理发店,这篇文章就跟大家聊聊这个话题,介绍一些新手开理发店可以学习的经验。 选址和装修:美发店选址必须遵从以下原则,年轻一族聚集…

    创投 2022年1月25日
  • 梁家辉救不了马自达

    梁家辉救不了马自达,一些粉丝或许对马自达电动化抱有期待,但市场永远不会停下来等待。

    创投 2023年7月1日
  • Keep卖货,生意难做

    Keep卖货,生意难做,《华尔街日报》对此的评论是,Peloton做的生意是希望把动感单车从奢侈品变成大众化的设备,“听起来有点牵强”。更关键的是,健身是门“反人性”的生意——用户容易流失,如何在“反人性”的生意上薅出羊毛以及留住用户就成了拿下市场的关键。

    2023年4月13日
  • 农行怎么解除限额一万 可到银行的营业窗口办理提高转账限额

    农行怎么解除限额一万?据悉农行系统默认的转账额度是一万元,用户可以携带身份证和银行卡,到银行的营业窗口办理提高转账限额的手续。 农行网银修改支付限额操作步骤如下:1、打卡农行官网,…

    2022年1月25日
  • 隐秘的孤儿药

    面对国内医药市场的持续内卷,不少药企将出海看成了破局的方向,这种做法与当年日本药企的选择如出一辙。目标出海并没有错,但却必须建立在强大的创新能力之上,如果没有产品层面的创新作为支撑,那么最终注定将会进入到另一层内卷循环之中。只要产品竞争力强了,那么全球化自然也就是一件水到渠成的事情。既然创新是中国药

    2023年9月25日 创投
  • 邯郸冀南新区第一支产业发展投资基金签约落地

    投资界(ID:pedaily2012)消息,1月22日,邯郸冀南新区隆重举行邯郸零度产业发展投资基金合伙企业签约仪式,标志着邯郸冀南新区与零度资本开展产业基金合作的正式启动,第一支产业发展投资基金落地落实。新区管委会主任杨万春表示:这次签约是新区开启产业基金招商的重要里程碑,也是深入落实市委十届七次

    2024年1月29日
  • 脑机接口技术研发公司「微灵医疗」获数千万元天使+轮融资,高榕资本领投

    投资界(ID:pedaily2012)11月1日消息,脑机智能融合技术企业——深圳微灵医疗科技有限公司(简称“微灵医疗”)近日宣布完成数千万人民币的天使加轮融资,由高榕资本领投,中发领创生命园创投基金(简称“生命园创投”)、齐济投资跟投,老股东鼎晖投资追投。今年初,微灵医疗已完成数千万人民币的天使轮

    2023年11月1日
  • 头部主播「没落」,AI能否重构直播带货?

    直播带货,已经开始由过去的卷低价、卷GMV,渐渐演变为卷科技。北京理工大学融合发展研究基地副主任尹西明就曾表示,AI不仅能够以更便捷、实时和多模态的交互来帮助供给端更高效地感知、获取并预测直播用户的偏好和需求痛点,还可以大幅降低消费场景建构、触达和深耕的门槛与成本。此外,在数字经济时代,直播电商提供

    2023年12月1日
  • 国产漫画大逃杀

    国产漫画大逃杀,踏入互联网时代之后,国产漫画面临的生存危机,似乎不比纸媒时代少。

    2023年6月23日 创投
  • 争相联名户外,奢侈品牌高贵不起来了

    曾经的跨界无论玩得多花,奢侈品牌都是高位者。有印花的用印花打底,没有印花的就把品牌字母放大到夸张的地步。就算是遇上AIR Jordan这样的强势品牌,Dior照样可以豪气用专属花纹盖满倒钩。FENDI在和喜茶联名中包揽了几乎所有周边视觉输出,大家却还是一边倒地认为是喜茶赚麻了,无人注意到多年无爆款的

    2023年12月6日
  • 充电桩背后的芯片生意

    充电桩背后的芯片生意,国内充电桩未来数量有望大增,充电桩数量增加必然会带动相关半导体产品的发展。

    创投 2023年6月28日