英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

老黄又来掀桌了啦!在今天凌晨的 2023 年全球超算大会( SC2023 )上,英伟达推出了全新GPU H200 。作为前代 H100 的升级款,老黄直接不装了,在官网上单方面将 H200 称为 “ 当世最强 ” 。但更秀的是,没人会因此质疑他们违反广告法,因为在 AI 时代,对手们真只能眼巴巴地看

老黄又来掀桌了啦!

在今天凌晨的 2023 年全球超算大会( SC2023 )上,英伟达推出了全新GPU H200 

作为前代 H100 的升级款,老黄直接不装了,在官网上单方面将 H200 称为 “ 当世最强 ” 。

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

但更秀的是,没人会因此质疑他们违反广告法,因为在 AI 时代,对手们真只能眼巴巴地看着英伟达的车尾灯。

从英伟达官方透露的数据来看, H200 最强的就是在大模型推理表现上。

以 700 亿参数的 LLama2 大模型为例, H200 推理速度几乎比前代的 H100 快了一倍,而且能耗还降低了一半。

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

能取得这么强的成绩,自然是 H200 的硬件给力。

从参数方面看, H200 的主要提升就是把上一代 “ G 皇 ”H100 的显存,从 80GB 拉到了 141GB 带宽从 3.35TB/s 增加到了 4.8 TB/s 

而这些进步则主要要归功于HBM3e 内存技术

今年 8 月的时候, SK 海力士推出 HBM3e 之后,据宣称单颗带宽可以达到 1.15TB/s ,相当于在 1 秒钟内传输了 230 部 FHD 高清电影(每部容量 5G )。

在 SK 海力士官宣 HBM3e 之后不久,包括三星、美光在内的内存厂商们,都陆续跟进了这一技术。

这个 HBM3e ,其实就是之前大家都在用的 HBM3 的升级版。

说白了就是有更高的性能、更高的带宽,好处就是芯片能用更快的速度传输数据,同时还降低功耗。

非常适合眼下的AI 和大数据运用

于是英伟达*时间就找到 SK 海力士进行了合作。

所以我们能看到这才没多久, H200 就已经用上了这一新技术。

比起技术升级更方便的是, H200 和 H100 都是基于英伟达 Hopper 架构打造的。

所以两款芯片可以互相兼容,那些装满了 H100 的企业不需要调整,可以直接更换。

不过,乍一看好像是王炸,但实际上H200 可能只是 H100 的一个 “ 中期改款 ” 

因为我们发现, H100 和 H200 单论峰值算力的话,其实是一模一样的。

真正提升的参数只有显存、带宽。

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

而在此前,大家常用来评判 AI 芯片性能的重要参数:训练能力。

H200 相较 H100 的提升并不明显

从英伟达给出的数据来看,在 GPT-3 175B 大模型的训练中, H200 只比 H100 强了 10% 。

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

在世超看来,这种操作大概率是有意为之

之前各个大厂忙着打造自家的大模型,对 GPU *的需求毫无疑问就是训练,所以当时大家的需求是提升训练能力。

而如今,随着 AI 大语言模型不断落地应用,训练模型在厂商眼中可能已经是牛夫人了,大家反而全去卷推理速度。

所以这次 H200 很可能是故意忽略 “ 算力 ” 升级,转而进行推理方面的发力

不得不说,老黄的刀法依旧精准。

当然了,这也是英伟达工程师们给老黄挤牙膏的本事,谁让人家显卡真就遥遥*呢。

哪怕只是做了个小提升, H200 还真就能当得起 “ 当世最强 ” 的名号。

而且根据瑞杰金融集团估计, H100 芯片售价在 2 万 5-4 万美金之间,那加量后的 H200 只会比这高

而如今像亚马逊、谷歌、微软和甲骨文等大厂的云部门,已经付完钱排排站,就等着明年 H200 交货了。

毕竟,哪家大模型随便升个级不要几千个 GPU ?

只能说这波老黄又又又赚麻了。

但问题就是,加价对于 AI 芯片永远不是问题。

今年初创公司、大厂、政府机构等等为了抢一张 H100 挤破脑袋的样子还在上演,所以明年H200 的销量根本不用愁

“ 是人是狗都在买显卡 ” ,去年说完这句话的马斯克也不得不转头就加入 “ 抢卡大军 ” 。

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

更夸张的是,英伟达方面还说了,推出 H200 不会影响 H100 的扩产计划。

也就是明年英伟达还是打算卖 200 万颗 H100 芯片,也能侧面看出, AI 芯片是多么不愁卖。

但面对全球嗷嗷待哺的市场,英伟达其实也有点力不从心。。

像 OpenAI 作为打响 AI 革命*枪的人,结果因为没有足够的 GPU 痛苦得不行。

比如因为算力不够用,自家 GPT 们被各种吐槽 API 又卡又慢;

因为算力不够用, GPT 更强的上下文能力始终没法全员推广;

因为算力不够用, GPT 们没法卖给客户更多专有定制模型。。。

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

光连 OpenAI 创始人奥特曼,就已经出来好几次炮轰过算力短缺。

而为了解决这个问题, OpenAI 也想了不少办法。

比如自研 AI 芯片、与英伟达等制造商展开更紧密合作、实现供应商多元化等等。

上个月初就有消息说 OpenAI 已经在找收购目标了。

更进一步的是特斯拉,他们就在 7 月推出了由定制 AI 芯片 D1 打造的 Dojo 超级计算机,用来训练自动驾驶系统。

当时摩根士丹利直接吹了一篇研报说:特斯拉这波下来,比用英伟达的 A100 足足省下了 65 亿美元

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

当然,这也不是说马斯克的这个自研的 AI 芯片就比 A100 强了。

而只是因为自研芯片只需要干自家的活,更符合自己需要、也没有算力浪费。

就好比英伟达的芯片是一锅大杂烩,谁来了吃都能吃饱饱;而自研芯片虽然只是小碗菜,但它可以按照个人口味做,虽然做得少、但更合胃口。

其他大厂也没闲着,比如微软要自研 “ 雅典娜 ” 谷歌在年初就在自研芯片上取得突破进展。。

但就像我们前面说的,这次 H200 其实只是一个 “ 中期改款 ” ,还不足以打消其他厂商们的小心思。

按照英伟达自己放出的消息,大的还是明年会来的 B100 ,从图里看它至少是有指数级的提升

英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

所以世超觉得,大家伙忙活半天,在硬实力面前,黄老爷的位置恐怕还是会越来越稳。

你看像是即使强如 Meta 早在 2021 年就意识到,自己怎么干都比不上英伟达的GPU 性能,转头就从老黄那下了几十亿订单( Meta 最近好像又有点自研的心思了 )。

还记得老黄刚宣布英伟达是 “ AI 时代的台积电 ” 的时候,有不少人冷嘲热讽。

结果现在才发现,这句话居然是老黄的谦辞。

毕竟 2022 年台积电 “ 只 ” 占了全球晶圆代工产能的 60% ,而英伟达如今已经占据了可用于机器学习的图形处理器市场 80% 以上的份额。

总感觉,等老黄的大招真来了,这些大厂们的芯片自研项目恐怕又得死一片吧。。。

资料来源

英伟达官网

The Verge:Nvidia is launching a new must-have AI chip — as customers still scramble for its last one

知乎:英伟达发布世界最强 AI 芯片 H200,性能飙升90%,Llama 2 推理速度翻倍,有何重要意义?

(0)
小多多的头像小多多创始人

相关推荐

  • 互联网「35岁陷阱」:欲望、人性与灰色空间

    互联网「35岁陷阱」:欲望、人性与灰色空间,互联网高台上,扁平化、快速升迁、期权红利等优越条件帮年轻人营造好了造富梦,但现实社会中的财富固化却泼了他们一身冷水——上升通道依旧只属于极少数人。

    创投 2023年5月23日
  • 街机经典变重氪手游,腾讯天美《合金弹头:觉醒》充多少有自由?

    街机经典变重氪手游,腾讯天美《合金弹头:觉醒》充多少有自由?,如何抓住机会去肥增瘦,增强技术革新、玩法突破和内容创新能力,提升IP变现背后的价值延伸,将是2023年甚至更远的一个周期里,以腾讯网易等头部游戏公司的主要命题。

    2023年4月26日
  • 陆奇为什么不创业?

    陆奇为什么不创业?,陆奇在硅谷的成绩单过于优秀,他有“最有权势华人高管”的美誉,但凡和Ai、创投沾点边的人,没有人想和他对立。

    2023年4月27日
  • 小天才和华为,分割小学生朋友圈

    小天才和华为,分割小学生朋友圈,就在今年六一前一周,小天才、华为、小米扎堆推出新款智能手表,产品从300多元到1999元不等,价位、品牌和功能背后,隐藏着孩子们的安全、社交等一系列衍生问题,对家长来说,这不是一次简单的考题。

    2023年5月31日 创投
  • 暑期档热门影视IP带火目的地,马蜂窝安阳“殷墟”热度大涨200%_行业动态

    影视作品对于旅游目的地的带动作用不止于取景地巡礼,其背后的文化内涵也能极大地激发游客的旅行灵感和热情。今年暑期档,口碑逆袭,热度一路飙升的《…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年8月3日
  • A股语料势力榜

    A股语料势力榜,具体到与ChatGPT的联动方面,如果考虑机器学习横向增长大于纵向增长,结合市值中文传媒的潜在增长空间较大,因为营收种类中一般图书占比最大,其次实洋也排名前三。除此之外,凤凰传媒和中国出版的实洋占比也比较高。

    2023年4月6日
  • 中创新航6月装车量配套量双创历史新高_行业动态

    7月11日,中国汽车动力电池产业创新联盟发布了2023年6月及1-6月国内动力电池相关数据及排行榜单。在6月份国内动力电池企业装车量和1至6…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    2023年7月12日
  • AI直面算力难题:在密集发布大模型之外,我们离算力自由还有多远?

    AI直面算力难题:在密集发布大模型之外,我们离算力自由还有多远?,目前AI对算力需求增长的速度要快于算力供给增长的速度,AI芯片的迭代也有点跟不上模型训练及迭代所需。

    2023年4月24日
  • 大家为什么不爱逛超市了?商超的败落与出路

    大家为什么不爱逛超市了?商超的败落与出路,商业唯一不变的是永远在变化,本质就是适者生存。商超百货行业如何修炼内功、更好地存活成为行业亟需解决的问题。他们开始尝试创新、寻求突破,收缩、调整和变革成了共同选择,数字化和轻型化成为转型的主流方向。

    2023年6月8日
  • 品鉴古琴名曲传承非遗佳音十八数藏首发浙派古琴数藏盲盒_行业动态

    中国是一个历史悠久的文明古国、文化大国,也是物质遗产和非物质文化遗产的大国。我国是最早、最积极参与和介入国际非遗保护事务的国家,也是进入世界…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年4月24日
  • 怎样炒黄金 最佳保值产品之一

    怎样炒黄金?据悉黄金从古至今都是最佳保值产品之一,升值潜力大,很多新手投资者对于炒黄金市场蠢蠢欲动,那么怎样炒黄金才可以更快入门呢? 第一,在进行炒黄金投资之前,投资者应该对炒黄金…

    2022年1月25日
  • 50亿,浙江省科创母基金招GP

    关于公开遴选浙江省科创母基金第一批子基金管理机构的公告为深入实施科技创新和人才强省首位战略,全力实施“315”科技创新体系建设工程,加快构建完善科技创新基金体系,组建设立浙江省科技创新母基金(以下简称“科创母基金”)。现面向全国优秀机构,公开遴选第一批子基金管理机构,有关事项公告如下:一、科创母基金

    创投 2023年9月26日
  • 生死存亡时刻,雷军要省下每一粒「米」

    生死存亡时刻,雷军要省下每一粒「米」,“现在是生死存亡的时刻,要找到降本增效的点。”据新浪科技援引知情人士的说法称,雷军曾在一次内部高管会议上如是直言。

    创投 2023年7月13日
  • 无锡落地百亿级股权投资基金

    10月18日,无锡产业集团携手建信投资、建行江苏省分行正式签约设立规模百亿级的建源锡产股权投资基金。金融是实体经济的血脉,建信投资和建行江苏省分行都是业内知名代表,拥有强大专业能力和丰富实践经验,希望以此次签约合作为新起点,在共同推进合作项目提速的基础上,围绕“465”现代产业集群、高水平科技自立自

    创投 2023年10月19日
  • 刘强东打出两张牌

    京东集团史上首位女CEO许冉,交出其成为“执行官”后的首份季度财报。这也是2023年以来,京东真正掌舵者、创始人、集团董事长刘强东在总部大楼公开露面后(6月18日京东20周年庆),这家零售巨头发布的首份季度财报。8月16日,京东发布2023年第二季度财报。从业绩上看,“充满变数的二季度”并没有影响京

    2023年8月17日