AMD的翻身仗

AMD的翻身仗,这似乎是高科技公司常常会出现的状况——在鼎盛年代忽视新的技术浪潮,在低谷期如梦方醒仓促憋大招。

今年6月,AMD发布了一款专门针对AI需求的最新款芯片Instinct MI300。

MI300将CPU、GPU和内存封装在了一起,晶体管数量高达1460亿个,接近英伟达H100的两倍。其搭载的HBM(高带宽内存)密度也达到了H100的2.4倍。也就是说,MI300在理论上可以运行比H100更大的AI模型。

受益于AI训练的增长,GPU需求肉眼可见的从游戏市场向高性能计算领域倾斜,就连刚开启GPU产品线的英特尔,也迫不及待的PPT首发了面向高性能计算场景的Falcon Shores架构芯片。

伴随英伟达一路冲向万亿美元市值,资本市场对GPU行业老二的期待值也达到了顶峰。今年以来,AMD股价累计上涨已经超过90%。

AMD的翻身仗

英特尔的Falcon Shores,预计2024年推出

然而MI300发布会结束,AMD股价下跌3.6%,反倒是英伟达上涨3.9%。资本市场表达好恶,向来是这么冷酷无情。

原因可能在于,AMD没有在发布会中透露这款芯片的客户,这也是市场对英伟达以外的AI芯片*的担心。

长期以来,AMD在GPU市场一直被英伟达按在地上反复摩擦,Instinct产品线其实已经迭代了好几年,但相比英伟达的连战连捷,AMD在高性能计算领域的存在感一直比较稀薄。

AI训练打开的市场空间,一度被市场视为AMD与英伟达拉进距离的机会,但事情似乎没那么简单。

离不开CPU,但离得开英特尔

虽说在AI训练上,更擅长大规模并行计算的GPU承担了大部分计算工作,而整个系统仍需要CPU进行调度和统筹。也就是说,尽管GPU的需求量大幅度增加,但CPU仍是必需品。

作为一家同时拥有CPU和GPU设计能力的芯片公司,AMD被看好也不意外。更何况过去几年,AMD在CPU市场连战连捷。

AMD现任CEO苏姿丰在2014年接手,时值推土机架构性能孱弱,让英特尔心安理得的挤牙膏。而在卖掉Imageon后,AMD和拒绝为苹果设计iPhone芯片的英特尔一起,*错过了智能手机的浪潮,公司一片风雨飘摇。

面临多条战线的失血,苏姿丰只能将有限的资源集中在核心的CPU业务上,从苹果请回了架构大师吉姆·凯勒,开始Zen架构处理器的研发。

2017年,Zen架构处理器横空出世,把挤牙膏上瘾的英特尔打了个措手不及。2019年,Zen处理器更换为台积电7nm工艺,此时英特尔10nm工艺姗姗来迟。

虽然英特尔还占据着大部分市场份额,但AMD的反攻速度实在太快,尤其是在服务器市场,几乎是从0杀到了接近20%的市占率。

2023年Q1,AMD的x86处理器市场份额达到了34.6%这一历史峰值[2],这也是AMD市值超过英特尔的重要背景。

AMD的翻身仗

今年5月,全球超级计算机Top500强公布:前500强中,使用AMD CPU进行驱动的超算达到121台,使用英特尔CPU的超算则从2016年的454台下降至360台,虽然看着不少,但其中很多是英特尔10年前的家底——至强(Xeon)处理器[3]。

但同一时期,AMD与英伟达差距也越来越大。

难以逾越的CUDA

英伟达不仅是一流的硬件公司,更是一流的软件公司。

虽然在理论性能上,MI300的一些参数甚至*于英伟达,但市场对英伟达对手们*的担心往往在于,就算硬件性能可以跟英伟达比肩,但是软件解决方案仍难以与英伟达的CUDA对抗。

2006年,英伟达推出了CUDA平台,让开发者能够给予GPU进行编程和开发,最终形成了一个庞大稳固的生态。在推出CUDA之前,全球能用GPU进行编程的不足100人,目前CUDA的使用者超过400万。

每一个成功的硬件公司背后,往往都有一个更强大的软件团队,苹果和英伟达都是如此。即便是光刻机制造商ASML也不例外,他们的官方网站上有这样一段话:

您可能将ASML视为一家硬件公司,但实际上我们拥有世界上*、*开创性的软件社区之一。如果没有我们开发的软件,我们的客户就不可能制造出10纳米或更小的尺寸的芯片。

想要芯片真正在具体场景的满足各种需求,就需要开发者对硬件进行编程以实现各种功能。如果说硬件编程的过程相当于进行各种复杂计算,那么CUDA就是提供给使用者的一部计算器。

无论对英伟达的刀法多么怀恨在心,都不能否认黄仁勋对通用计算和人工智能的超前押注。

AMD显然深知软件和生态的重要性,但对标CUDA的ROCm在2016年推出时,就已经比英伟达晚了十年。

直到2023年4月,ROCm都仅支持Linux平台;而CUDA自问世以来,就提供Windows和Linux两个版本,后期还为苹果用户增设Mac OS版本。

相比英伟达不遗余力的推广和洗脑,AMD在生态建设上也显得投入不足,据说早年英伟达对项目的GPU试用申请几乎是有求必应,动不动就去高校实验室发显卡。深度学习大神杰夫·辛顿带着学生训练AlexNet模型,就用了三块GTX 580。

另外,AMD的软件能力也令人不安——AMD在今年6月发布了一份EPYC 7002 “Rome”服务器芯片指南,承认由于时钟倒计时器存在 BUG,导致第二代EPYC芯片运行1044天后,会出现内核卡死。如果有服务器使用这款芯片,需要每隔2.93年重新启动一次。

原因也不难理解,直到推出ROCm的2016年,AMD甚至还没摆脱亏损。在这期间,AMD只能把有限的资源都聚焦在CPU的研发上,无法为GPU部门投入太多资源,更不要说ROCm的软件团队了。

而当AMD在CPU市场收复失地,希望依靠AI卷土重来时,英伟达已经慢慢补齐了短板。

英伟达的反攻

2020年9月,英伟达宣布准备以400亿美元的价格准备收购移动CPU架构商Arm,其背后意图人尽皆知:一方面是整合移动端资源,另一方面则是入局CPU。

正如前文所说,尽管AI时代需要更多的GPU,但CPU仍不可或缺。当CPU与GPU共同在服务器中的工作时,实际场景更像是一个大学生(CPU)带领一群小学生(GPU)组队完成各种任务。这个时候,配合就显得尤为重要。

因此,英伟达之所以自己做CPU,并非完全因为英特尔或AMD,而是从自身产品需求出发,使CPU和GPU紧密耦合,以发挥*性能。比如CPU和GPU中,需要用到尽可能相似技术的一致内存,以保证数据之间的无缝共享[8]。

虽然收购基本没有成功的可能性,但英伟达依然按部就班的招兵买马。2021年4月,黄仁勋在自家厨房里宣布,英伟达即将推出*5nm制程工艺CPU Grace,基于Arm架构,面向超大型 AI 模型的和高性能计算。

紧接着就是具体工作的有序展开:英伟达首先选定了根据地以色列,那里有全球第三多的纳斯达克上市公司(仅次于美国和中国);然后对外招聘600名硬件工程师、软件工程师和芯片设计师,搭建CPU研发团队[7]。

最后,英伟达挖来了英特尔在以色列的CPU架构专家Rafi Marom,后者曾参与10nm制程的Tiger Lake和Alder lake芯片开发工作。

在2022年3月的GTC大会上,英伟达对外宣布Grace CPU性能:拥有144个Arm内核和1TB/s的内存带宽,性能较当前*进的DGX A100搭载的双CPU相比高1.5倍以上。

不过,原本预计在今年上半年可以开始供货的Grace芯片,目前已推迟至下半年。

APU

InstinctMI300本质上是一颗“APU”,这是AMD早在2009年提出的一个概念——CPUGPU集成在一起,使得二者高速互联,实现1+1>2的效果。

在2006年收购了GPU公司ATI后,AMD成为了当时*同时拥有CPU和GPU设计能力的芯片公司,而且在两个市场都是行业老二——但坏消息是,市场主流玩家也就两个。

在这种局面下,AMD希望借助APU打开市场局面。2011年,*代APU推出后,AMD持续宣传APU是“x86架构三十年来的*革命”,并向投资者强调,这款产品存在着“强劲且被压抑”的需求。

市场最初也对APU概念充满期待,结果2012年Q3财报出炉,AMD收入下滑25%,顺便减记了1亿美元的库存——APU需求量并不高,芯片根本卖不出去[1]。紧接着,公司股价跌到1.86美元的历史性低点,苏姿丰临危受命,开始掌舵风雨飘摇中的AMD。

APU的优势在于,由于CPU和GPU集成在了一起,数据传输效率得到了大幅度提高。苹果的M1 Ultra也采用了类似的“把几个小芯片拼成一块大芯片”的思路,换来了更强的数据吞吐能力。

但在2009年,APU的理念显得过于超前。

一方面,APU涉及芯片的先进封装技术,在当时既不成熟,成本也难以控制。另一方面,APU在需求高度多元化的消费市场很难行得通。

比如10种型号的CPU和GPU,理论上有100种组合方案,这就导致做10种方案无法满足市场需求,做100种方案难以收回生产成本。

因此在很长一段时间里,APU只能在PS4游戏机这类高度标准化的产品上才能找到市场。但深度学习的大爆发改变了这一点。

相比游戏和渲染,AI训练对算力和数据吞吐效率的需求成百上千倍的增加,目前针对AI市场推出的芯片产品,除了算力的堆砌,往往都采用3D堆叠和先进封装等方式,增加数据传输的效率,这与APU的优势不谋而合。

英特尔尚未正式发布的Falcon Shores,同样采用了将CPU、GPU、内存封装在一起的思路,只不过英特尔将其称为“XPU”。

但目前来看,最接近这个目标的反而是英伟达的Grace Hopper芯片。

AMD的翻身仗

英伟达的Grace Hopper将CPU和GPU集成在了一起

尾声

在2009年APU的概念被提出时,AMD正经历公司历史上的*谷,APU多少有些毕功一役的憋大招成分。

但也正是因为处于低谷,导致AMD无法拿出足够的资金与技术支持,让APU的革命性理念真正落地,最终只变成了简单的CPU+GPU的组合。

从商业角度看,最适合在2009年搞点革命性产品的反而是富可敌国的英特尔,但英特尔当时在干什么呢——心安理得的挤牙膏,同时拒绝为iPhone设计芯片。

这似乎是高科技公司常常会出现的状况——在鼎盛年代忽视新的技术浪潮,在低谷期如梦方醒仓促憋大招。

事实上,英特尔还尝试过“联A抗N”——2017年,英特尔宣布将在自家CPU上集成AMD的GPU,合作推出新的芯片。

结果没过多久,英特尔就挖走了AMD的核心技术负责人之一:图形主管Raja Koduri,为英特尔开发高端独立GPU。

参考资料

[1]AMD: $30 Million Settlement Ends Llano Lawsuit,tom’s Hardware

[2] AMD and Intel CPU Market Share Report: Recovery on the Horizon (Updated),tom’s Hardware

[3] AMD Now Powers 121 of the World’s Fastest Supercomputers,tom’s Hardware

[4] A Closer Look at Intel’s Coral Supercomputers Coming to Argonne,inside HPC

[5] Argonne’s 44-Petaflops ‘Polaris’ Supercomputer Will Be Testbed for Aurora, Exascale Era,HPC wire

[6] Top500: No Exascale, Fugaku Still Reigns, Polaris Debuts at #12,HPC wire

[7] 英伟达在以色列组芯片团队,发力CPU,半导体行业观察

[8] 它们需要基于这两种设备中尽可能相似技术的一致内存,智能计算芯世界

(0)
小多多的头像小多多创始人

相关推荐

  • 等本土企业烧死了再抢市场,起亚给中国车企提了个醒

    等本土企业烧死了再抢市场,起亚给中国车企提了个醒,很多车企卖一辆亏一辆的现状,虽然中国新能源汽车如火如荼,但真正赚钱的也就那两家。

    2023年6月19日
  • 蔚来手机,OPPO味道

    蔚来手机,OPPO味道,蔚来总裁秦力洪今年1月表示,手机研发已经接近尾声,今年二季度会开启用户内测,预计于今年三季度正式发售。

    2023年6月3日 创投
  • 奶茶行业的幕后大佬,藏在这个中国小县城

    如今的新茶饮,简直是卷疯了。奶茶界的“下沉*”蜜雪冰城,前段时间自制的动画《雪王驾到》在B站获得了高分评价。动画中有个恶趣味的小细节,雪王死对头的形象是一头“酷似雪王的熊”,疑似是在阴阳蜜雪冰城的“山寨竞品”冰语时间。即便是下沉*,也对满地的山寨店感到头疼。在中国的现制茶饮市场,唱主角的,其实正是这

    创投 2023年9月3日
  • 存储,怎么看?

    航行在汹涌水域的NANDYole Group在其NAND告中表示,消费者信心恶化、通胀上升和供应链面临挑战,对智能手机和个人电脑的需求产生了负面影响。由于新冠肺炎相关的供应链不确定性以及对 2022 年下半年需求增长的预期,原始设备制造商 (OEM) 积累了较高的内存库存,目前正在积极减少库存,从而

    创投 2023年9月14日
  • 年底离职好还是年初离职好 结合自己的情况来选择

    很多人在辞职的时候都想选择一个好的时间点,那么到底是年底辞职比较好还是年初的辞职更好呢?接下来的内容就简单聊聊这两种情况! 其实无论年底辞职还是年初辞职你的目的都是一定的那就是辞职…

    创投 2022年1月25日
  • 几番辩驳终认错,卷入争议的刘润商业版图有多大?

    “我的朋友们劝我,不要回应。不要回应。千万不要回应。被人蹭流量,是演讲成功的标志。你一回应,他的目的就达到了。然后,会浑水摸鱼,胡搅蛮缠,接着蹭。不蹭白不蹭。这是一场不对等的游戏。吵赢了,你才赢。但是只要吵起来,他就赢了。千万不要‘湿手沾面粉’”。刘润最终没有选择听朋友的,而是站出来对近期争议进行了

    2023年11月3日
  • 茶饮卷了2年,蜜雪冰城率先开始涨价

    2021年,当一众茶饮品牌纷纷涨价,蜜雪冰城在微博回复网友表示:“我们做了一个艰难的决定,蜜雪冰城,不涨价!”如今,茶饮品牌们纷纷降价走起下沉路线,因价格实惠而被网友亲切称为“雪王”的蜜雪冰城却逆势涨价,相关话题也迅速冲上了微博热搜。社交平台上,有网友对蜜雪冰城涨价表示接受,“就涨一块钱是看不起我吗

    2023年10月2日 创投
  • 特斯拉学不会苹果的「降价经」

    特斯拉学不会苹果的「降价经」,在自动驾驶真正落地之前,造车这种传统制造生意中,极致创新者也会在效率面前败下阵来。如何更好更快地丰富产品线,可能才是特斯拉能否实现产能、价格、需求三者平衡的关键。

    创投 2023年5月9日
  • 双十一之后,京东还能继续低价吗?

    双11京东打了一场漂亮仗,成功建立了低价心智。问题是,是否会只在双11昙花一现,京东有没有能力将低价常态化?要回答这个问题,得把时间线拉回到去年年底。2022年底,将“低价”设定为京东最高优先度目标,成为京东新一轮剧变的原点。去年年末宣告低价战略的那场大会上,刘强东宣称低价是“过去成功最重要的武器”

    2023年11月13日
  • 寰盈证券正规吗 寰盈证券怎么样 佣金怎么收

    寰粜臫頭條盈证券是受香港证监会监管的、从事港美股交易的证券品牌之一,于2014年创建,持有新西兰、香港牌照,隶属于寰盈国际金融集团。 品牌简介 寰盈证券是一家国际互联网金融投资服务…

  • 李斌向现实低头

    李斌向现实低头,这些企业对于降价所带来的销量增长不仅有期待,也有依赖。一旦降价策略没能带来足够正向的现金流,其亏损面积就将继续扩大,骑虎难下。

    2023年6月15日 创投
  • 中国半导体巨头,冰火两重天

    中国半导体巨头,冰火两重天,与大多数其他半导体市场形成鲜明对比的是,汽车半导体库存普遍低于预期水平,汽车半导体市场在2023年以及本十年末将呈现健康的增长。

    2023年4月14日 创投
  • 刚刚,超级LP来深圳了

    这一幕极具风向标意味——今天(9月25日),深圳市产业投资人大会举行。投资界从现场获悉,深圳市引导基金与国寿集团、太平保险、平安集团合作组建基金,首期总规模420亿元。此外,还宣布了深圳市与全国社会保障基金理事会相关合作。更多超级LP现身。前一天(24日),一场闭门座谈会上,深圳市委书记孟凡利主持,

    创投 2023年9月26日
  • 缩减400人,创88亿营收,这家广州大厂再度冲刺上市

    中旭未来没有搁置上市计划。中旭未来可能是一个很陌生的名字,它在之前叫「贪玩游戏」。去年宣布品牌升级之后,很快推进了的进程,并且前不久对失效的招股书进行了更新。这家公司以传奇游戏闻名、却又不只想被传奇束缚。为求上市,它尝试着摆脱单一品类的固有印象,储备产品覆盖到了女性向、SLG、塔防等不同品类。营收的

    2023年8月23日 创投
  • 最高1亿元支持,北京十大举措培育和服务独角兽企业

    投资界(ID:pedaily2012)9月14日消息,为进一步加大本市独角兽企业培育和服务力度,北京市科学技术委员会委、中关村科技园区管理委会官网近日公布了《关于进一步培育和服务独角兽企业的若干措施(征求意见稿)》(以下简称《若干措施》),向社会公开征求意见。对在原始创新和关键核心技术攻关等方面承担

    创投 2023年9月14日