殊途同归,所有人都想摆脱英伟达的垄断

所有人都在想办法摆脱英伟达的垄断,不管是因为贵还是因为买不到、抢不到,不管是通过自研还是收购还是寻找其他供应商,殊途同归。英伟达*的竞争对手和最重要的客户们,都作出了同样的选择。OpenAI考虑自研芯片,考虑在英伟达之外拓展更多的算力供应商,不管是成本考虑还是有更大的野心。微软将在下个月发布自研芯片

所有人都在想办法摆脱英伟达的垄断,不管是因为贵还是因为买不到、抢不到,不管是通过自研还是收购还是寻找其他供应商,殊途同归。英伟达*的竞争对手和最重要的客户们,都作出了同样的选择。

OpenAI考虑自研芯片,考虑在英伟达之外拓展更多的算力供应商,不管是成本考虑还是有更大的野心。

微软将在下个月发布自研芯片,然而它已经是主流云厂商里动作最慢的一个,Google的 TPU 已经供应了自家(不算云客户)90% 的 AI 算力需求,亚马逊也通过数十亿级别的投资锁定了自家芯片的客户(不仅仅是 Anthropic)。

「苏妈」更不可能缺席,面对 CUDA 的垄断局面,AMD的 CEO 苏姿丰说:「我不相信护城河」。

连马斯克都抱怨难买的 A/H100 在大模型行业构成的独领风骚的局面,正在发生一些变化。

01、OpenAI 的下一步:自研 AI 芯片

路透社报道,至少从去年开始,OpenAI 就已讨论各种方案,以解决 AI 芯片短缺问题。OpenAI 已将获取更多 AI 芯片列为公司首要任务,讨论方案包括自研 AI 芯片,与包括英伟达在内的其他芯片制造商更密切地合作,以及在英伟达之外实现供应商多元化。

对于 OpenAI 来说,自研芯片不仅能解决 GPU 的短缺问题,同时也将有效降低硬件运行所需的成本,毕竟 GPT-4 的运行成本实在太高了。

当然,美国主要科技巨头多年来一直在试图打造属于自己的芯片,但实际成果有限。对于 OpenAI 来说,能不能另辟蹊径做出成果,尚可未知。

02、微软的自研 AI 芯片计划

The Information 报道,据知情人士透露,Microsoft 计划下个月在其年度开发者大会上推出*专为人工智能设计的芯片。此举是微软多年工作的结晶,旨在减少 Microsoft 对英伟达设计的 AI 芯片的依赖,随着需求激增,这些芯片一直供不应求。

Microsoft 的芯片类似于 Nvidia GPU,专为训练和运行大型语言模型的数据中心服务器而设计。

The Information 4 月份的新闻报道了代号名为 Athena 的芯片,目前尚不清楚它在 11 月 14 日开始的西雅图会议上宣布时的正式名称是什么。

知情人士表示,Microsoft 仍在争论是否会向 Azure 云客户提供该芯片。

该芯片只是 Microsoft 试图避免被锁定在 Nvidia GPU 的方式之一。据知情人士透露,Microsoft 还与 Advanced Micro Devices 就 AMD 即将推出的 AI 芯片 MI300X 密切合作。

03、亚马逊和 Google 的做法

先于微软一步,另外两家主流云厂商亚马逊和 Google 已经在自研 AI 芯片上积累了很多经验,甚至已经有经过市场验证的成熟产品。

亚马逊有两款自研 AI 芯片,名字都起得非常「露骨」——Inferentia 和 Trainium(推理和训练),完全针对机器学习。但这两款芯片追求的并不是*的性能,它们无法与英伟达*的产品相提并论。

在 2021 年产品发布时,亚马逊产品副总裁 Matt Wood 表示 Trainium 在性价比方面比当时 AWS 上的其他选择高 50%。今年春天亚马逊 CEO Andy Jassy 在股东信中表示,使用 Trainium 训练常见 AI 模型相比「类似 的 GPU 系统」快 140%,成本降低 70%。而推理芯片 Inferentia 自从 2019 年推出以来,「为亚马逊等公司节省了超过 1 亿美元的资本支出。」

成本效益是核心目标。

在 9 月底针对 Anthropic 的投资和战略合作中,亚马逊特别强调,会让 Anthropic 使用自家的两款芯片训练模型。Anthropic 当然有能力使用亚马逊的芯片(外加 AWS 上的 N 卡)训练出时下*竞争力的模型。可以想见当 Anthropic 下一款 SOTA 模型发布时,AWS 会铺天盖地地宣传背后如何使用了自研芯片。

同样主打效率的还有另一个云厂商,Google。

在 8 月底的 Google Cloud 发布会上,Google 发布特别针对大模型的第五代 TPU,号称相比上一代,每美元的训练性能提高两倍,推理性能提高 2.5 倍,而 v5e 的成本不到 TPU v4 的一半。「这是迄今为止*成本效益的云端 TPU。」

在 5 月,Google 发布了一篇论文解读自家的 AI 超级计算机,一台包括 4000 多个 TPUv4 的 AI 超算,并加入专为运行和训练 AI 模型定制的组件。Google 宣称这台超算比 NVIDIA A100 快 1.2 – 1.7 倍,功耗低 1.3 – 1.9 倍。(但并没有与 H100 比较,因为 H100 和 TPUv4 并不是同一代产品。)

Google 曾表示,自家 90% 的 AI 任务都是使用 TPU 在跑,但这并不包括大量采购 NVIDIA GPU 的 Google Cloud。

04

AMD,试图跨越 CUDA 护城河

英伟达在 AI 市场的风光,最不甘的可能就是 AMD 了。

最近 AMD 在大模型领域的动作不断,一是 MI300 GPU 芯片的发布,其次是跟 Lamini 合作,携手推出基于 AMD GPU 的企业级 LLM。

对于 MI300,他们的目标是对标英伟达的 H100,MI300 为推理,尤其是大型语言模型推理,进行了专门的优化。

此外,针对英伟达的护城河 CUDA 平台,在 The Verge 对苏姿丰的专访以及 HPCwire 的文章中均有专门的分析。

「在市场发展如此迅速的情况下,我不相信护城河。当你考虑护城河时,它更多的是成熟市场,人们并不真正想要改变很多东西。而生成式人工智能的发展速度令人难以置信。我们在常规开发环境中几个月取得的进展可能需要几年时间。尤其是软件,我们的方法是一种开放式软件方法。」苏姿丰回应道。

目前 CUDA 和大模型的中间层平台以主流的开源工具 PyTorch 为主,在 HuggingFace 上,92% 的可用模型是基于 PyTorch 进行开发的。而 PyTorch 本身是兼容 AMD 平台的,AMD 最新的芯片也针对 PyTorch 进行了优化。

殊途同归,所有人都想摆脱英伟达的垄断

如图所示:机器学习论文的数量比较显示出 PyTorch 和 TensorFlow 的显着趋势。

在访谈中,苏姿丰宣称,「我们所取得的一个重要里程碑就是,在 PyTorch 2.0 上,AMD 在*天就获得了适配。这意味着,现在在 PyTorch 上运行 CUDA 的人,开箱就能在 AMD 上运行,因为我们在这方面做了大量工作。坦率地说,它也能在其他硬件上运行。」

而和 Lamini 的合作,AMD 也能借此寻求其在 LLM Finetune 方面的专业知识,针对企业用户做进一步的优化。Lamini 针对企业级 Finetune LLM 进行了优化,这些 LLM 拥有大数据并使用专门的数据、任务和软件接口,建立在基础模型——Llama 2、GPT-4 和 Claude 等基础模型通过在 CommonCrawl、the Pile 或教科书等通用数据集上进行训练,针对英语、自动完成、推理和编程等通用技能进行了优化。

(0)
小多多的头像小多多创始人

相关推荐

  • 傲慢的特斯拉屈服了

    傲慢的特斯拉屈服了,如今的一纸召回公告,基本坐实了特斯拉强制单踏板模式的安全隐患。

    创投 2023年5月14日
  • 年底离职年终奖不发合法吗 一定要坚决维护自己的权益

    现在很多的公司为了应对年底员工的离职潮都会拖延年终奖的发放甚至有时候会拖到春节之后,那么在年前离职的员工就没法拿到了,那么究竟这种情况合法吗大家又该怎样维护自己的合法权益呢?接下来…

    创投 2022年1月25日
  • 对董宇辉突然清空微博的一点看法

    2024年2月27日上午,董宇辉突然清空了自己的新浪微博,由此导致了东方甄选股价一度下跌5%。不过,这一次的市场反应没有去年年底“小作文事件”时那么激烈,因为这大概率是一次个人行为,没有预示什么深层矛盾——就在前一天的直播中,董宇辉表示“天生讨厌热搜,明天就去注销微博”,然后果然就这么做了。这个突如

    2024年2月27日
  • 100亿大黄山产业投资基金招募管理机构

    为推进大黄山世界级休闲度假康养旅游目的地建设,推动大黄山生态、文化、旅游、科技等资源要素融合,聚集高端人才创新创业,打造休闲度假、医疗康养、创意经济、体育赛事、会展经济、文化服务等高端服务业集群,安徽省将牵头发起设立大黄山产业投资基金(以下简称“大黄山基金”)总规模100亿元,现启动第一期基金组建设

    2024年4月11日
  • 年轻人涌入租车市场

    在春节租一台电车回家,成为了很多中国人的新选择。根据交通运输部预计,在探亲、休闲等多种出行需求推动下,2024年春运期间约有90亿次人员流动,其中,80%源于自驾。如此庞大的出行流量也带火了租车市场,电厂从滴滴、携程、飞猪等多个聚合平台获悉,今年春节国内租车订单普遍同比翻番,相较于疫情之前最高增幅则

    2024年2月27日
  • 丑衣服泛滥,年轻人买到怀疑人生

    2023年,女装行业不太平。夏天,苦恼于市面上女装越做越小,买不到合适衣服(参见);而秋季新款,做旧的、土黄色的,又让人难以下手。“女装退货率为什么那么高”的话题一度冲上微博热搜,翻一圈评论区,都是消费者“讨伐”的声音。小衣服和丑衣服,图源小红书网友们发现,不知道从什么时候起,不管是线上还是线下,买

    2023年11月13日 创投
  • 华尔街顶尖投行,为什么认定特斯拉Dojo值5000亿美元?

    当地时间 9 月 11 日,特斯拉股价暴涨 10.09%,报收于 273.58 美元,市值 8683.41 亿美元,其市值一夜增加 799 亿美元(约合人民币 5800 亿元)。特斯拉股价暴涨源于一份摩根士丹利的研报。这份报告看好特斯拉 Dojo 超级计算机的市场前景,分析师认为其为特斯拉带来高达

    创投 2023年9月13日
  • 辛巴盯上了小杨哥的生意

    这回,快手顶流主播辛巴,盯上了疯狂小杨哥的“生意”。近期,辛巴旗下的辛选集团发布内部信,官宣成立负责直播切片带货业务的子公司,“切片分销”生意将成为辛选集团2024年重点发力的领域之一。“现在的直播带货行业,已经没有让我兴奋的东西了,接下来要暂停直播,沉淀两年,学习人工智能,两年后再选新赛道重新开始

    2024年4月16日
  • 索尼的游戏「摇钱树」,靠不住了?

    索尼的游戏「摇钱树」,靠不住了?,对XR来说,高性价比内容和硬件是撬动商业市场和大众消费的重要影响因素。

    2023年3月27日
  • 信用卡激活流程 三种激活方法随便选择

    信用卡激活流程?据悉一、信用卡客服电话激活: 1.拨打信用卡背面所示的24小时客户服务热线,输入持卡人的卡号及查询密码; 2.根据语音提示,选择信用卡激活,然后就可以激活成功。 二…

    2022年1月25日
  • HR赫莲娜首款眼周修护式抗老眼霜——黑绷带眼霜瞩目上市_行业动态

    百年奢美护肤品牌HR赫莲娜坚守尖端科技、不断开拓前沿美容疆土。再度联合瑞士蒙特勒高端肌肤抗老机构LACLINIC-MONTREUX,基于特殊…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    2023年8月2日 创投
  • 携程的短暂春天

    携程的短暂春天,携程做下沉市场,实际是在下沉市场当地做中高端的旅游产品,这些产品的服务对象其实仍然主要是一线城市的高收入群体。

    2023年6月12日
  • 暴雪要与网易再续前缘

    1月30日,暴雪宣布将与虎牙合作,在虎牙直播平台推出一档全新栏目“暴雪2024春节联欢活动”,活动时间从2月5日至2月18日。在暴雪游戏停服的这一年里,暴雪在国内的存在感越来越低,几乎消失在公众视野。这次暴雪和虎牙联合搞春节联欢,更是直接在标题里写道:“感谢坚守—期待回归”而此前,暴雪再次申请魔兽世

    2024年2月8日
  • 污水处理概念有哪些上市公司 股民不得不重视

    最近这一段时间,很多人对于污水处理这个概念都非常的看好,这篇文章就跟大家聊聊这个话题,介绍几家在A股市场上做污水处理的上市公司。 百洋股份:公司子公司鸿生源股份目前主营业务涉及生活…

    创投 2022年1月25日
  • 谁在捧杀《逃出大英博物馆》?

    谁也没想到,今年的短剧市场中真正的大爆款会是《逃出大英博物馆》。这并非是一部观众传统认知中的短剧。它由自媒体博主煎饼果仔与夏天妹妹联合制作,内容只有短短三集。作为今年热度最高的短剧之一,截至目前,《逃出大英博物馆》三集在抖音分别获赞840.1万、629万和544.4万,B站每集视频播放量达500万+

    2023年9月7日