李沐重返母校,上交秒变追星现场

什么是顶流?AI大神李沐回母校做演讲,直接让上交大变成了大型追星现场——现场可谓是人人从从众众,先来感受一下这个feel:正式演讲前的场外已经是排起了大长龙,现场更是座无虚席。即便是演讲结束,李沐老师也是被热情的上交大学子围得里三层外三层:许多学生更是把经典的《动手学深度学习》这本书拿了过来让李沐老

什么是顶流?

AI大神李沐回母校做演讲,直接让上交大变成了大型追星现场——

现场可谓是人人从从众众,先来感受一下这个feel:

李沐重返母校,上交秒变追星现场

正式演讲前的场外已经是排起了大长龙,现场更是座无虚席。

即便是演讲结束,李沐老师也是被热情的上交大学子围得里三层外三层

李沐重返母校,上交秒变追星现场

许多学生更是把经典的《动手学深度学习》这本书拿了过来让李沐老师签名

李沐重返母校,上交秒变追星现场

如此场景,甚至上交大计算机科学与工程系教授俞勇都在朋友圈发出了这样的感慨:

*次亲眼看到追“星”的盛况。

李沐重返母校,上交秒变追星现场
图源:俞勇教授朋友圈,已授权

对此,李沐老师也回应俞勇老师:

母校老师同学太热情了。

李沐重返母校,上交秒变追星现场

而李沐老师此次回母校的演讲,归结两个关键词,就是LLM趋势个人职业选择

李沐重返母校,上交秒变追星现场
图源:小红书用户“昭曦”

尤其是正值李沐老师创业一年半(BosonAI)之际,他在现场基于自己的经历,总结了三个不同阶段中“每天在想的基本目标”:

大公司:你要想如何升职加薪

博士:你要想如何毕业

创业:你要想如何“退出”(要么上市,要么卖掉)

李沐重返母校,上交秒变追星现场
图源:B站用户“Kimoyee”

金句之多,内容之精彩,引得在场师生掌声、笑声,声声不断。

那么李沐老师具体都讲了什么?我们继续往下看。

(PS:完整演讲视频见文末)

谈LLM趋势

首先对于LLM的整体构成,李沐认为主要分为三大方面,分别是数据算力算法

李沐重返母校,上交秒变追星现场

而整个LLM的过程非常像炼丹,“数据”就是找材料的环节。

就好比小说里很多主角去深山里找材料一样,搞数据是个很难的过程,是个体力活。

之后的“算力”就是炼“数据”,火量大一点、设备先进一点,能炼出来的东西就越好。

至于“算法”就相当于丹方,但这点与小说是不同的,因为它每年都在快速进步、变化,并且对细节的把控显得格外重要。

对于LLM与上一次深度学习较大的区别,李沐认为:

之前的深度学习“炼丹”是比较稳定的。

但现在LLM“炼丹”,(开发者或用户)是希望有灵魂在里面的,它能够解决很多问题。

接下来,李沐便针对上述的三大方面进行了详细的讲解。

李沐重返母校,上交秒变追星现场

在LLM硬件方面,李沐认为最难且最重要的是带宽(bandwidth)。

这是因为现在大模型的训练很难通过一个机器来搞定,而要做分布式,那么瓶颈就会出现在带宽上了。

毕竟现在基本上都会是多个服务器机架甚至是集群,即便两个机架间隔1米,但由此带来的哪怕几纳秒的延迟也是不能忍的。

带宽之后,LLM硬件难点便是内存(Memory)。

大模型在训练过程中,是把超大的数据压缩到了一起,使得模型的体量动辄便是几百个G,运行时的中间变量也会变得很大,因此需要很大的内存:

在未来,很有可能一个200G内存的芯片是走不动的。

这就意味着我们的模型大小一定程度上会被受限在某个尺寸;内存不够,模型就大不了。

在带宽、内存之后,便来到了算力(Compute),对此,李沐认为:

摩尔定律依旧有效。

李沐重返母校,上交秒变追星现场

而模型到了一定尺寸之后,资源(Resources)又成了问题,也就是供电。

李沐基于自身经验分享到,发现自己造一个电厂,比付电费的成本要低。

至于价格,当算力翻倍的时候,价格目前不一定会保持不变,可能是1.4倍的价格;但当市场竞争足够,长期来看可以做到价格不变。

至于芯片的替代品(Alternatives),李沐认为谷歌的TPU、英特尔的Habana、AMD和Azure的芯片在做推理时是OK的;但训练方面,可能还需要几年的时间。

李沐在此做了个小总结:

模型训练每年会以2倍的速度变得更便宜、更快、更大。

今年训练的大模型,到明年的价值就会减半。

李沐重返母校,上交秒变追星现场

模型方面,李沐从语言(Language)、语音(Voice)、音乐(Music)、图像(Image)和视频(Video)等不同模态方面做了介绍,并认为多模态是当下的一个趋势。

李沐重返母校,上交秒变追星现场

李沐还给目前不同模态的现状打了个分:

语言模型:80-85分左右,目前是gets good的状态。

音频模型:70-80分左右,目前是good enough的状态。

视频模型:目前还是比较弱的。

基于此,李沐给出了一个推论:

在长文本上的人机交互变得越发流行。

李沐重返母校,上交秒变追星现场

至于大模型的应用(Applicaitions),李沐认为它们本质应该是可以为用户提供无限的人力资源

李沐重返母校,上交秒变追星现场

而这些应用目前在白领和蓝领职场上“上岗”或“协作”的效果如何,李沐做了个表格。

从结果上来看,只有白领、文科属性的简单工作是hold得住的。

李沐重返母校,上交秒变追星现场

对于应用的总结,李沐认为:

只要数据足够,万物即可被自动化。

李沐重返母校,上交秒变追星现场

基于李沐创业一年半的经历,他也分享了几点技术上的思考。

首先,预训练(pre-training)和后训练(post-training)是同等重要的。

李沐重返母校,上交秒变追星现场

其次,没有真正的垂直领域模型;再垂直的模型,它的通用能力也是差不了的。

李沐重返母校,上交秒变追星现场

以及,在大模型评测方面,李沐认为现在的评测太简单了,即使各种刷榜,但用起来的时候就能感受到真实效果。

因此他认为评测这件事虽然很重要,但真正做起来却很难。

李沐重返母校,上交秒变追星现场

除此之外,李沐还分享了几个观点:

数据定义了大模型的能力上限

自建GPU不会比租GPU便宜太多

大部分机器学习时代的经验,依旧适用于大模型时代

李沐重返母校,上交秒变追星现场

而除了技术之外,李沐在这次演讲中也给上交大的师生们分享了自己在职场上的心得。

谈个人“打卡式人生”

了解李沐的人或许对他的个人经历比较熟知了。

本科和研究生就读于上海交通大学,而后赴香港科技大学和CMU深造,在伯克利和斯坦福担任助理教授。

也曾任职于百度和亚马逊等科技大厂,最近的一年半则是创业BosonAI(第二次创业)。

李沐回顾自己的过往,在现场戏称为“打卡式人生”——什么样的地方都转过了一遍了。

李沐重返母校,上交秒变追星现场

那么李沐在经历了种种之后,是一种什么体验?

这也正是我们文章开头提到的“每天在想的基本目标”(精彩的内容必须再提一遍):

大公司:你要想如何升职加薪

博士:你要想如何毕业

创业:你要想如何“退出”(要么上市,要么卖掉)

李沐重返母校,上交秒变追星现场

基于这三个大方面,李沐基于自己的经验,将各自阶段的优点缺点罗列了出来。

例如对于“打工人”这个角色,李沐的PPT刚出来,上交大的学子们便笑了出来:

李沐重返母校,上交秒变追星现场

读博士期间的优点和缺点是这样的:

李沐重返母校,上交秒变追星现场

聊到创业的优点,李沐形象地将这个过程比喻为:

可以体验当(合法)海盗的乐趣,哪儿有钱就去抢一把,没抢到就死掉了。

李沐重返母校,上交秒变追星现场

但李沐此次演讲的两个大part并非是割裂的,相反,是可以非常自然的做一个“有机结合”

他认为应该从“动机”出发去解决一个问题:

有学术价值:那就去做对LLM的理解(PhD/教职)

有商业价值:那就去做LLM上的新应用(创业)

有成长价值:那就去做LMM上的产品落地(打工人)

李沐重返母校,上交秒变追星现场

最后,李沐老师也给了上交大学生一点Tips:

李沐重返母校,上交秒变追星现场李沐重返母校,上交秒变追星现场

而谈到创业归来,就在前几天,李沐在知乎写的一篇文章《创业一年,人间三年》非常火爆。

李沐重返母校,上交秒变追星现场

不仅是李沐自述了创业一年来的进展,也在三言两语之间,展现了大佬创业的势能——

一开始没打算直接做大模型,但张一鸣建议要创业就直接大模型;买卡需要排队等不及只好给老黄写信,没想到老黄就给安排了;刚创业做游戏的“老蔡”就来交流过了——米哈游那个老蔡;在斯坦福和快手创始人宿华散步,感叹创业心得……

总之,千字短文,但细节之精彩,故事之有趣,值得多读几遍:

One More Thing

目前已经有B站网友Kimoyee将李沐老师此次的演讲视频上传,感兴趣的小伙伴们可以“深度学习”下哦~

参考链接:[1]https://www.xiaohongshu.com/explore/66c926d9000000001f01929c[2]https://www.xiaohongshu.com/explore/66c81dd5000000001f014761[3]https://www.bilibili.com/video/BV1vBWDepECq/?spm_id_from=333.337.search-card.all.click

(0)
小多多的头像小多多创始人

相关推荐

  • 科创时代下的创业投资

    2024年1月9日-11日,“2024创投大会”在西安举办。本届大会以“向实 · 向新 · 向强”为主题,邀请院士专家、投资机构、产业企业从宏观趋势、产业投资、企业发展等多个角度呈现一场思想饕餮盛宴。会上,国投创合基金管理有限公司总经理刘伟发表主题演讲《科创时代下的创业投资》。以下为演讲实录,经投资

    创投 2024年1月16日
  • 什么是筹码理论 筹码供求力量的两方:资金和筹码

    股价走势循环周期的四个阶段: A阶段:无穷成本均线由向下到走平;俗称筑底阶段;B阶段:无穷成本均线由走平到向上;俗称拉升阶段,可称为上升阶段;C阶段:无穷成本均线由向上到走平;俗称…

    2022年1月25日
  • 这届打工人,等不来全季、亚朵降价了

    一晚割走打工人3天窝囊费的连锁酒店们,终于得到了“应有的惩罚”。作为酒店三大经营指标之一的OCC(入住率),已经亮起了黄灯。1月的行业专家纪要提到:今年的入住率并不是非常乐观,预计同比去年可能只增长1-2个百分点。各酒店的RevPAR(每间可用客房收入),更是早在2023Q4就集体出现了增速放缓。今

    2024年4月26日 创投
  • 7000亿,孙正义正式宣战

    孙正义不隐藏了。彭博首次披露一则震撼消息——软银创始人孙正义正寻求筹资1000亿美元(约合人民币7000亿元),用于创立一家AI芯片企业,旨在挑战英伟达。这将是自ChatGPT问世以来,人工智能领域最大的一笔投资。而刚刚过去的春节假期,孙正义可谓赚翻了——他所执掌的ARM股价三天暴涨93%,市值一度

    2024年2月20日
  • 2年亏840亿,恒大汽车资不抵债

    2年亏840亿,恒大汽车资不抵债,截至2022年末,恒大汽车涉及未能清偿的到期债务累计约116.26亿元,逾期商票累计约185.12亿元。

    创投 2023年7月29日
  • 古玩将死,文玩火爆

    一度被奉为财富的象征,备受资本藏家追捧的古玩收藏品,如今进入了萧条期,甚至整个行业迎来关店潮。而曾经不起眼的文玩市场,却在年轻人的巨大购买力下,日渐火爆和兴旺起来。一个是历史的印记,高处不胜寒;一个是文化产品,怡情又亲民。古玩和文玩当下的市场境遇,为何如此不同?01 有价无市,古玩进入萧条期今年7月

    2024年9月2日 创投
  • 「自动驾驶第一股」退市了

    “全球自动驾驶第 一股”图森未来在今年1月正式宣布退市。基于图森未来业绩长期遇阻,这一消息在多数人意料之中。本质来说,退市更多是融资渠道的变化,以及冻结美国业务,公司技术研发和业务推进不受影响。但在正式退市后十余天,消息进一步恶化。1月29日,图森未来收到美国南加州法庭下达的临时限制令,要求公司停止

    2024年3月5日
  • 金域检测荣获“年度服务之星”,精准诊断实力获认可_行业动态

    金域检测作为行业“链主”,凭借高达三分之一的市占率,早已在转型之路上迈出坚实步伐。公司不仅成功搭建了覆盖1.5万家基层医院的远程病理协作网,更推出了多款AI辅助病理诊断产品,从而确立了新的差异化竞争优势。而今,金域检测更是勇攀科技高峰,向大模型进军,积极探索“医检AIGC”的深度开发及应用,以科技

    2024年4月12日
  • 大模型时代的算力和存储产业新机遇

    2024年2月16日,OpenAI发布自己的*AI视频生成模型Sora,继ChatGPT后再次展现了大模型强大的泛化能力。大模型的持续迭代升级催生了对算力基础设施的大量需求,二级市场英伟达市值也屡创新高。本文将从大模型发展趋势出发,分析大模型时代算力和存储产业的新机遇,并提出相应的投资意见。大模型浪

    2024年4月10日 创投
  • 我在TikTok上卖车给老外,三个月入账2000万

    Fast Reading2000元投入实现2000万营收,这不是爽文,而是2023年发生在汽车平行出口行业的真实故事。欧美日车企的退出让俄罗斯市场出现真空,而本土品牌无力与涌入的中国汽车竞争。入局门槛的提高和内卷加剧成为从业者头顶的阴霾,这已经不是一个能赚快钱的行业了。抱着“反正亏不了多少钱”的心态

    2024年3月14日
  • 暑期游戏大乱斗,腾讯还能稳坐太师椅吗?

    如果说腾讯手撕安卓渠道,是内容方面对产业链各方的利益博弈。那么当上游内容方同室操戈,比拼的就是对用户需求的理解,对产业趋势的判断,以及研运一体的硬实力。自从2022年版号恢复审批,今年才是真正意义上走出疫情扰动的*个正常暑假(无封锁、线下文旅报复性消费放缓)。经过两年的版号储备和研发测试,这个暑假也

    2024年7月4日
  • 迈向空天信息的万亿市场

    2024年1月9日-11日,“2024创投大会”在西安举办。本届大会以“向实· 向新 · 向强”为主题,邀请院士专家、投资机构、产业企业从宏观趋势、产业投资、企业发展等多个角度呈现一场思想饕餮盛宴。本场《迈向空天信息的万亿市场》圆桌对话由未来宇航创始人、CEO牛旼主持,对话嘉宾为:陈东 元航资本合伙

    2024年1月22日
  • 新华社报道:中资企业艾雪进入印尼8年,讲述中国企业“一带一路”出海的新故事_行业动态

    近期,新华社对印尼的中资企业艾雪集团进行《共话中国经济新机遇 | 一个冰淇淋里的中印尼民心相亲》的报道,讲述了艾雪集团进入印尼8年以来,与印尼人民共同成长的暖心故事。2023年11月21日文章发布后,仅新华社客户端已有数十万次的阅读量。艾雪已成为中印尼两国民心相通的重要组成部分秉持与当地民众共成长

    2023年11月29日 创投
  • 极兔速递港股上市:一场拼多多式的崛起

    极兔速递港股上市:一场拼多多式的崛起,这条鲶鱼的加入,让本就因价格战而倍感吃力的中国快递业内卷加剧。随后,极兔速递趁势收购掉队者百世汇通,直接坐上了主桌。

    2023年6月19日
  • 硬折扣该怎样长硬不衰?

    刚刚过去的周末,让零售行业的从业者神经紧绷。因为,12月23日多个信源曝出,社区硬折扣超市比宜德已公告于12月22日起暂停营业。作为*家,也是*一家规模*的硬折扣社区连锁店零售商,比宜德不仅是上海市场最近10年新创的硬折扣社区超市标杆,也称得上中国硬折扣业态的“晴雨表”和“风向标”。有业内人士透露,

    创投 2023年12月26日