大模型创业公司成了「GPU贫民」

一夜醒来,大模型圈都在热议一个词——“GPU贫民”(GPU-Poor)。来自行业分析机构SemiAnalysis的一篇报告,爆料谷歌拥有的算力资源比OpenAI、Meta、亚马逊、甲骨文和CoreWeave加起来还要多。分析师Dylan Patel预测,谷歌DeepMind联手的下一代大模型Gemi

一夜醒来,大模型圈都在热议一个词——GPU贫民”(GPU-Poor)。

来自行业分析机构SemiAnalysis的一篇报告,爆料谷歌拥有的算力资源比OpenAI、Meta、亚马逊、甲骨文和CoreWeave加起来还要多

分析师Dylan Patel预测,谷歌DeepMind联手的下一代大模型Gemini,到年底训练量将碾压(Smash)GPT-4达到后者5倍

报告提出在这种压倒性的优势面前,大部分创业公司和开源势力都成了“GPU贫民”,在用有限的资源苦苦挣扎。

这个既扎眼又扎心的说法迅速成为新梗,在行业里流传开来。

大模型创业公司成了「GPU贫民」

巧了,也是同一位作者搞出来的,另外GPT-4内部架构细节大曝光也是他干的。

被点名的开源扛把子HuggingFace联合创始人Julien Chaumond表示:不要小看我们贫民啊。

大模型创业公司成了「GPU贫民」

也有人代表学生在线吐槽:金钱上穷,算力上也穷,说的就是我们博士生了。

大模型创业公司成了「GPU贫民」

正致力于让手机跑大模型的知名学者陈天奇表示,未来每个人都会拥有自己的AI助手,其中大多数人都会是“GPU贫民”,但不要低估合起来的总量。

大模型创业公司成了「GPU贫民」

也有不少人认为,抛开争议性的内容和大部分内容收费不谈,这篇报告的免费前言部分就是对大模型行业现状的一个很好的批评和总结。

01、“GPU贫民”在做无用功

报告下笔很不留情,直言很多创业公司在GPU匮乏情况下花费大量时间精力做的事,都是无用功

比如很多人热衷使用大模型的输出微调小模型,然后去刷排行榜,但是评估方法不完善,更注重风格而不是准确性或实用性

报告还认为各种测量标准不完善的排行榜本身,也是对小公司的误导,由此产生一大批不实用的模型,对开源运动也是一种伤害

另一方面,GPU贫民们反而对资源的利用效率不高,大多使用密集模型,主要基于开源的羊驼生态。

但是OpenAI谷歌这些巨头已经在玩MoE架构这样的稀疏模型,以及利用小模型投机采样 (speculative decoding)提高推理效率了,完全是两个游戏

作者希望GPU贫民们不应该过度限制模型规模以及过度量化,而忽视模型质量下降。应该专注于在共享的基础设施上高效地提供微调模型,减少延迟和内存带宽需求,满足边缘计算的需求

看到这里,也有人提出不同意见,认为创造性的突破往往正是来自有限制的环境,这反而是某种优势。

大模型创业公司成了「GPU贫民」

但Perplexity.AI联合创始人Aravind Srinivas认为,GPU丰富的组织实际也会投资于带限制条件的研究。

并且要找到下一个像Transformer这样的突破,需要成千上万次的实验,要求的资源*不低。

大模型创业公司成了「GPU贫民」

02、“GPU土豪”的游戏怎么玩

那么GPU平民的另一面,谷歌这个“GPU土豪”在做什么呢?。

严格来说,谷歌算力不是GPU而是自家TPU。报告认为虽然TPUv5单体性能不如英伟达H100,但是谷歌有最高效的基础设施架构。

谷歌大脑与DeepMind合并后,联手训练对标GPT-4的Gemini大模型。

由前DeepMind两位研究VPKoray KavukcuogluOriol Vinyals和前谷歌大脑掌门人Jeff Dean共同领导百人团队。

大模型创业公司成了「GPU贫民」

根据多方爆料,Gemini预计年内就会发布,更准确的来说是美国的秋季范围之内(9月23日-12月21日)。

Gemini将整合大模型与AI图像生成的能力,使用Youtube上93.6亿分钟的视频字幕训练,总数据集大小据估计是GPT-4的两倍。

前DeepMind创始人Hassabis曾透露,Gemini将结合AlphaGo类型系统的一些能力和“其他非常有趣的创新”。

另外谷歌创始人布林也一直在亲自参与Gemini研发,包括对模型做评估并协助训练。

关于Gemini更具体的消息还不多,但是有人推测也将与GPT-4一样使用MoE架构和投机采样技术

8月初Google DeepMind发表的新论文From Sparse to Soft Mixtures of Experts被认为可能与Gemini相关。

大模型创业公司成了「GPU贫民」

投机采样能在不损失生成质量的前提下,让Transformer大模型获得2-3倍的推理加速。

具体来说是让小模型生成提前生成一些token并让大模型做评判,如果接受就让大模型生成下一个token再重复*步,如果小模型生成的质量不高再换用大模型。

谷歌一方的投机采样论文在2022年11月才发表,但之前的爆料认为GPT-4也用了类似的技术。

大模型创业公司成了「GPU贫民」

实际上投机采样技术的前身Blockwise Parallel Decoding也来自谷歌,作者中包括Transformer作者中的Noam Shazeer

Noam Shazeer这个人在谷歌时同时参与了Transformer、MoE和投机采样的研究,对今天的大模型来说都至关重要,另外他还参与了T5、LaMDA和PaLM等多个大模型研究。

SemiAnalysis的报告中还讲了他的一个八卦。

早在GPT-2时代Noam Shazeer就在谷歌写了一份内部备忘录,预测了未来大模型将以各种方式融入人们的生活,但当时这个观点并未被谷歌重视。

现在看来,他预测的很多事都在ChatGPT发布后真实发生了。

不过Noam Shazeer在2021年就离开谷歌创办了Character.ai,按照这篇报告的说法,他现在也是“GPU贫民”的一份子。

参考链接:

[1]https://www.semianalysis.com/p/google-gemini-eats-the-world-gemini

[2]https://x.com/dylan522p/status/1695956854344749234

[3]https://x.com/AravSrinivas/status/1696182301934395486[4]https://arxiv.org/abs/2211.17192

(0)
小多多的头像小多多创始人

相关推荐

  • 建设银行转账多久能到账 一般不超过2小时

    建设银行转账多久能到账?据悉同行之间转帐,工作时间转帐在9:00-16:30实时到帐。在非工作时间,一般不超过2小时。建行跨行转账,到帐时间大概是1-3个工作日。 1、如办理的是建…

    2022年1月25日
  • 美团降维

    美团降维,自2022年Q2财报,美团变更了业绩披露架构,坐实外界对“配送服务一直亏损”的猜测。#值得玩味#

    2023年3月28日 创投
  • 2023年,109位汽车行业高管都去哪儿了?

    2023年,109位汽车行业高管都去哪儿了?,整体销量的下滑和电动化转型迟缓,导致合资车企出现了密集的人事调整。

    2023年7月10日 创投
  • 大模型,还是救不了困境中的AI企业

    去年,ChatGPT掀起的一片浪花,卷起了全球互联网科技创新的浪潮,大模型成为当之无愧的风口,这也给近几年略显平静和停滞的AI行业注入了新的活力,让AI相关企业再次站在互联网舞台的中央。围绕大模型的创业潮流也在涌动,不少创业公司纷纷推出大模型相关产品,聚焦细分市场应用的小型AI产品也层出不穷。但一年

    2024年1月24日
  • 社保卡补办要多久 补办条件资料流程一览-财经

    关于社保卡,现在,满足可办理社保卡条件的人,几乎是人手一张,如果社保卡遗失或是不能正常读写,那是需要补办社保卡的,那么,社保卡的补办,需要多长时间呢?下面,社保卡补办条件资料流程一…

    创投 2022年1月25日
  • 汽车卷入百模大战

    “物以稀为贵,现在一台8卡的A800服务器,已经卖到了140万。”某云服务商的业务人员表示。“现在大模型的问题主要是两个,一是算力,一是落地的场景。”A800已经是英伟达A100的阉割版,但随着国内百模大战,英伟达GPU的需求水涨船高,*中国市场的A800,H800价格也已经超过了A100,H100

    2023年8月16日
  • 花西子翻车,给所有国货品牌提了个醒!

    国货和直播的恩怨情仇,不是“谁误了谁”的简单判断,而是国货品牌价值提升的复杂困境。不是“直播害了国货”,而是国货品牌不能像过去那样高度依赖直播渠道。国潮十年,是一轮爆发式的成长,现在的市场环境、经济形势下,应该进入一个沉淀期。因李佳琦直播翻车,国产化妆品品牌“花西子”连坐,引发全网围观。国货品牌和直

    2023年9月15日
  • 华讯财经网财经门户网站 华讯财经深圳分公司

    智通财经APP讯,华讯(00833)公布,集团预期截至2021年9月30日止九个月期间的收益对比2020年同期将取得下跌约3.3亿港元(或约20%)。 公告称,收益下跌乃主要由于静…

  • 天津,终于大火了!

    没想到,天津以这样的方式出圈了。近段时间,天津“跳水大爷”登上热搜,狮子林桥成为天津新晋网红打卡地,围观大爷跳水的人群将岸边挤得水泄不通。有网友评论道,“世界跳水看中国,中国跳水看天津,天津跳水看大爷”。相较于一众网红城市,经济掉队的天津,不算是热搜榜上的常客,它的低调,是北方第二城历史荣光的逐渐暗

    2023年9月6日
  • 在买包和买醉之间,年轻人热衷买彩票

    在买包和买醉之间,年轻人热衷买彩票,彩票大爆发,不仅是因为消费端的需求变大,也是彩票行业积极自救的结果。

    创投 2023年6月8日
  • 智能交通概念真正龙头 优先参考这几家

    这几天,很多的机构都频繁的发表看多智能交通概念的言论,那么在A股市场上,有哪些上市公司算是智能交通领域真正的龙头呢?这篇文章就跟大家聊聊。 皖通科技:公司主营高速公路信息化建设,承…

    创投 2022年1月25日
  • 2023年,超10万家烘焙店倒下了

    红餐大数据显示,截至2023年10月,面包烘焙赛道新增门店12.2万家,关店12.01万家,净增长门店数1874家。整体来看,2023年全国面包烘焙总门店数的增长率只有1%,注册吊销比呈波动下滑趋势。在《2023美团到店餐饮品类报告之烘焙行业疫情后发展变化洞察》中,2019年美团TOP100的烘焙商

    2024年1月5日 创投
  • 邦器生物完成数千万元A+轮融资,啟赋资本、接力基金联合投资

    邦器生物完成数千万元A+轮融资,啟赋资本、接力基金联合投资,本轮融资的资金主要用于邦器生物已获证免疫印迹平台产品的市场拓展和多重液相免疫荧光平台产品注册的推进。

    2023年8月8日
  • 实验动物平台,被各地生物医药园区抢疯了

    实验动物平台,被各地生物医药园区抢疯了,实验动物平台资源变得抢手,短期内可能会增加实验成本,但从长期来看,却是构建生物医药创新生态的关键一环。

    2023年5月26日
  • 农民创业致富好项目 选择其实很多还要多多考虑

    现在很多的农民朋友都在找合适的创业项目,因为农村经济发展的已经很好了有很多的致富机会,这篇文章就简单给大家介绍几个值得大家了解的项目! 首先第一个推荐的项目就是开办农村建材店,农村…

    创投 2022年1月25日