百模大战开启，AI进入路线之争？

小多多 • 2023年8月17日下午9:00 • 创投

大模型战场再起波澜。搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品Baichuan-53B，据介绍其训练参数高达 530 亿。而百川智能也放出风声，后续还会有多款产品发布。再加上科大讯飞的星火大模型升级、马上消费致力解决金融行业大模型在落地过程中的安全可控和隐私保护、基础设施能力建设等

大模型战场再起波澜。

搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品Baichuan-53B，据介绍其训练参数高达 530 亿。而百川智能也放出风声，后续还会有多款产品发布。再加上科大讯飞的星火大模型升级、马上消费致力解决金融行业大模型在落地过程中的安全可控和隐私保护、基础设施能力建设等关键问题的大模型呼之欲出，进入八月后的人工智能大模型赛道再掀高潮。

那么，如此热闹的市场中，到底具备了哪些特质的大模型才*前景，哪些困难又是当前无法跨越的，都是当前需要好好研究的方向。

01 百模大战开启，市场要多热闹有多热闹

自从ChatGPT爆火之后，入局大模型已经成为各大科技公司的*。据《中国人工智能大模型地图研究报告》显示，截至2023年5月底，国内10亿级参数规模以上基础大模型至少已发布79个，而在下半年，包括科大讯飞、阿里等头部玩家也将发布最新产品，战场进一步升级几乎成为定局。

实际上，这轮百模大战甚至可以追溯到到2020年。当年美国就已推出了15款大模型，其中就包括GPT-3。而中国随后在2021年也推出了30款大模型，2022年更是推出了28款大模型，进入2023年，前5个月更是高达19款大模型面试，增速可见一斑。据数据统计，中国和美国大模型的数量占全球大模型数量的近90%，两极之势已经形成。

回到国内，大模型厂商几乎是当前国内*科技公司、机构的清单名录：百度、腾讯、阿里、商汤、华为迅速入局，智源研究院、中科院自动化所也步后尘，如此态势下更带动一大批腰部公司入场，集群效应显著。

大模型规模化增长之下，据IDC预测，2026年中国AI大模型市场规模将达到211亿美元，人工智能将进入大规模落地应用关键期。

因此，对于任何大模型来说，想要在乱局之下突围，都不是容易的事，打赢战役的基础之一就是粮草充足。据媒体报道，由于训练成本过高，ChatGPT的开发公司OpenAI仍然在2022年出现5.4亿美元左右的亏损。OpenAI首席执行官Sam Altman还表示，该公司必须筹集多达 1000 亿美元的资金，才能满足不断上涨的成本。

头部大模型公司烧钱尚且不足，更不用说其他玩家了。但另一方面，投资热度降低也是行业内不争的事实。根据媒体统计的数据，在国内市场，从ChatGPT发布到现在，在AI大模型赛道融资事件只有21起。其中大多数明星独角兽企业，不是入局早具有先发优势，就是有机构大佬的背书，占尽资源才没有显得过于狼狈。

另外，需要注意的是，留给大模型讲故事的领域看似很多，但真正讲好的少之又少。连知名投资人都表示，行情再火，也要捂好自己的钱包，毕竟好的标的实在难找。从实际情况看也是如此，大牌厂商力推通用大模型，力图走赢家通吃的互联网路线，当下发力在整合资源层面的模型居多；而中小厂商，主打一个错位竞争，力图通过在细分领域的深耕，分得属于自己的一杯羹。

充满朝气但混乱的大模型之争，看似热闹却也暗流涌动，套用一句台词形容，当下可谓是“风浪越大，鱼越贵”的阶段。

02 数据投喂的噱头下，绕不开成本这道难题

当前大模型想要吸引眼球，数据投喂的量级从来都是大做文章的环节。梳理大模型发展的历史，你会看到参数规模增长的夸张曲线。

在国外，2018年，谷歌提出了大规模预训练语言模型BERT，该模型是基于Transformer的双向深层预训练模型，其参数首次超过3亿规模；2019年，OpenAI继续推出15亿参数的GPT-2，但马上英伟达推出了83亿参数的Megatron-LM，谷歌推出了110亿参数的T5，微软推出了170亿参数的图灵Turing-NLG，都抢走了OpenAI的风头。

2020年，OpenAI推出了超大规模语言训练模型GPT-3，参数达到1750亿，而微软和英伟达联手跟进，在2020年10月联手发布了5300亿参数的MegatronTuring自然语言生成模型。2021年1月，谷歌推出的Switch Transformer模型以高达1.6万亿的参数量成为史上*万亿级语言模型。

在国内，2021年，商汤发布了书生大模型，拥有100亿的参数量；2021年4月，华为云联合循环智能发布盘古NLP超大规模预训练语言模型，参数规模达1000亿，联合北京大学发布盘古α超大规模预训练模型，参数规模达2000亿。

进入2022 年，基于清华大学、阿里达摩院等研究成果以及超算基础实现的“脑级人工智能模型”八卦炉完成建立，其模型参数规模突破了174万亿个，直接拉高了入局门槛。

海量数据投喂的意义在哪里？大通用性、泛化性是其追求的核心要求，那些以互联网赢家通吃思维入局的各大厂商，杀入通用大模型，也正是由于其手握海量数据，具有先天优势可以进行资源整合。

但是，对大模型来说，真的是数据越多越好吗？

*，就是成本问题。昆仑万维CEO方汉认为，“超过千亿级别的大模型，训练需要投入的人力、电力、网络支出等投入，一年至少5000万美金到1亿美金。”如果这一测算成真，那显然大模型只能是有钱人的游戏。

但其实，在当下的众多垂直领域，大模型的身影也无处不在。而这些领域的一个共性特征就是：投喂数据并非天文数字。

这是为什么？垂直领域下，行业数据更加精准，因此十亿级别参数甚至更少的数据，都可以支撑模型实现效果，自然花费的成本也更低廉。从这个角度解释，教育、法律、金融等行业大模型的出现，也是因为行业形成共识：钱在这个游戏中，并不是*的。

03 错位竞争，腰部大模型的生存要义

通用大模型走下神坛，与其表现出来的落地障碍有关，360集团副总裁彭辉总结为七点：缺乏行业深度、不懂企业、数据安全隐患、知识更新不及时、“胡说八道”、投入巨大、无法训练进大模型的核心知识的保证所有权等。

而另一边，垂直大模型却如雨后春笋一般出现。

8月9日，网易有道推出“子曰”教育大模型首次落地的硬件产品——有道词典笔X6 Pro，新增虚拟人口语教练Echo，可实现多轮英语对话。此外还有互动问答、语法精讲功能，待机时长100天，起售价1399元。

内容层面上，首次引进经典教辅品牌《五年高考·三年模拟》，不局限于查词本身，词典笔还能做全科一对一辅导。

而在网易有道之前，学而思已经宣布正在进行自研数学大模型的研发，命名为MathGPT，面向全球数学爱好者和科研机构；而在五月，淘云科技宣布推出儿童认知大模型——阿尔法蛋儿童认知大模型，为孩子在练表达、塑情商、启创造、助学习等方面带来全新交互体验。

除去教育，其他垂直领域的大模型也层出不穷：今年4月，知乎正式发布“知海图AI”中文大模型，知乎创始人、董事长兼CEO周源表示：“知乎以应用层和数据层的独特优势，将致力于为中文互联网的大语言模型添砖加瓦。”；7月，携程发布*旅游行业垂直大模型“携程问道”，携程集团董事局主席梁建章表示，希望用户从包括“携程问道”在内的产品中获得旅游行业“可靠的内容，放心的推荐”。京东紧随其后发布言犀大模型，其宣传称：“沉淀了京东在零售、物流、健康、金融等行业多年积累的知识，融合70%通用数据与30%京东数智供应链原生数据进行训练，带来了商品推荐、金融政策、理财规则、物流体验等领域的能力。”

如此种种，让我们需要好好面对一个问题：垂直大模型，为什么火？

首先，大模型变小，成本控制更容易。与通用大模型动辄万亿级别的参数投喂，垂直大模型往往在十亿量级的参数训练就能有效果，而其数据要求的专业性、精确性，也比通用大模型囫囵吞枣般的投喂要有针对和效率，进而折射出资金、算立等资源利用率的差异。

其次，垂直大模型在解决数据安全隐患、缺乏行业深度等问题方面更具优势。以AI制药行业对大模型的需求为例，由于药物研发对高精度实验数据的获取成本较高，且公开数据库中有大量无标注数据，对于通用大模型而言使用这类数据投喂，显然是“吃的是奶，产出来的什么都不是”的风险。对于需要利用好大量无标注数据，又要利用好少量高精度数据的需求，垂直大模型显然是更好的选择。

最后，垂直大模型是商业创意实现的温床。在通用大模型的模式下，大、广、全是其追求的方向，这势必造成大模型之间功能同质化问题的出现。而垂直大模型在投入上本来就低，更适合小公司切入进来。

而小公司想要在市场中立足，在没有资源、没有实力的情况，势必要从商业创业与服务上做文章，说到底，定制化的服务，只要能创造足够的价值，永远不会缺乏市场。

百模大战，看起来箭在弦上了。

AI 大模型数据投喂腰部大模型

小多多创始人

0 0

北京中产，涌向19.9元自助餐？

19.9元的自助餐，20个菜任吃。一天，我在北京朝阳区，发现家附近的美食城里新开了一家快餐店，红底白字写着这样的“开业惊爆价”。它叫“我家东北菜”，菜品繁多，炸带鱼、肉丸子、地三鲜、酸菜白肉……还有免费的水果、可乐和雪碧。我被这家餐厅的大尺度震惊。19块9，这个价格在东北、在云贵川、在广州城中村出现

小多多
2024年1月30日 • 创投
电影票房计算时间为几天其实没有大家想的那么复杂

对于经常看新闻的读者肯定都看到过某某电影票房突破多少的新闻，很多读者肯定就会想这么多的票房统计起来一定很多不知道要多少天，出品方一定能赚到很多的钱！这篇文章就给大家聊一下电影的票房…

小多多
创投 2022年1月25日
有关中国人口问题的一些看法

有关中国人口问题的一些看法,减少劳动人口的原因可以大致分为两个方向，一个是人口总数的减少，另一项则是劳动适龄人口的减少，即老龄化和少子化。

小多多
2023年6月13日 • 创投
曦域资本，七年投出一张数字产业版图

曦域资本，七年投出一张数字产业版图,2015年，身为景林股权投资基金共同创始人及主管合伙人的黄晓黎做出选择，自立门户成立曦域资本。曦域资本用七年时间跟踪了超过150个技术细分行业，调研了近4000家基础软件和数据智能公司，所有被投的40多个标的公司都是纯软公司。黄晓黎领着团队不断摸索，在数字产业赛道上悄然拼出一张规模不小的版图。

小多多
创投 2023年3月30日
面板行业的周期宿命接近消失

作为高科技行业的代表之一，如今面板正在复制煤炭、钢铁等传统产业曾上演过的“供给侧改革”。过去几十年里，面板行业本身重资产、长周期、高成本的特性被投资者所熟悉，因此这个行业的周期属性被更多关注。但其高毛利、高科技、高成长的一面，则相对较少被感知到。实际上，目前面板产业的经营环境，与供给侧改革前后的煤炭

小多多
2023年10月30日 • 创投
新品牌车主的「饭圈」大战

新品牌车主的「饭圈」大战,至少，他们的确让中国人意识到了，中国的造车新势力，在某些方面是可以打败历史悠久的BBA的。

小多多
创投 2023年8月3日
创投

苦等的年终奖，打折了

年终奖的角色变了，打工人的态度也变了。一到岁末年终，职场人关注的热门话题，非“年终奖”莫属。互联网行业飞速发展的那几年，年终奖一词几乎能与暴富挂钩，“人均60个月工资的年终奖”“人均分红140万”等新闻，一度成了互联网企业吸引人才的金字招牌。可与往年的“财大气粗”、“豪横”不同，近两年提起年终奖，打

小多多
2024年1月25日
创投

平安健康：关于猴痘，这些事情你不能忽视_行业动态

近日，世界卫生组织宣布多国猴痘疫情已构成“国际关注的突发公共卫生事件”，同时这也是世卫组织当前发布的*别的公共卫生警报。相信大家看到这则新闻的时候都有些疑惑，之前的确有看到过“猴痘”出现的新闻，怎么突然变得这么严重？那么，“猴痘”究竟是什么呢？我们又该如何预防呢？跟着平安健康一起往下看！猴痘和猴子

小多多
2023年9月7日
白领该如何合理理财？个人如何理财是个头疼的事情

白领该如何合理理财？个人如何理财是个头疼的事情，如何合理理财，如何最适合理财呢。小编为你介绍白领六大理财方法，希望能够给年轻白领提供到一些帮助。白领该如何合理理财 1、每月领到工…

时间不会说谎　　
创投 2022年3月9日
创投

中科拓达获千万级天使轮融资，深创投出手

中科拓达获千万级天使轮融资，深创投出手,「中科拓达」成立于2009年，是一家聚焦粮棉油大田作物种植增产方案的创新型农业科技公司。

小多多
2023年7月17日
创投

中关村科金携手大连西太平洋石化，智能通知升级，护航能源安全_行业动态

近日,中关村科金成功与大连西太平洋石油化工有限公司(简称WEPEC)达成合作,携手打造智能外呼通知系统,全面提升通知效率,确保生产连续性。作…” />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8

小多多
2023年4月7日
创投

美国HPC芯片大厂遭遇尴尬，中国本土产品趁势崛起

当下，高性能计算（HPC）芯片成为半导体产业发展的主要驱动力，无论是IC设计、晶圆代工，还是封装测试企业，正在将越来越多的资源和精力由手机转向HPC市场，特别是人工智能（AI）服务器芯片。目前，称霸HPC芯片市场的依然是以英特尔、英伟达和AMD这三巨头为代表的美国企业，不过，这些公司的优势主要体现在

小多多
2024年1月12日
创投

骏玖电子完成亿元A轮融资，张江科投领投

骏玖电子完成亿元A轮融资，张江科投领投,骏玖电子作为新型的汽车电子研发解决方案供应商，致力于提供：SOA整车电子电气架构设计服务、整车电子电气，车联网，智能驾驶相关的HIL测试及咨询服务、基于国产车规级芯片的基础软件和控制器量产。

小多多
2023年5月30日
创投

嘉驰国际完成亿元C轮融资，华京投资和智连资本领投

嘉驰国际完成亿元C轮融资，华京投资和智连资本领投,嘉驰国际现已横向覆盖医疗大健康及生命科学、零售及消费品、芯片半导体及电子设备、数字化及企业服务、大工业及智能制造、保险及金融服务、地产及智慧服务、汽车及零配件等热门行业及领域。

小多多
2023年7月7日
走出《漫长的季节》，腾讯视频赢得了什么？

走出《漫长的季节》，腾讯视频赢得了什么？,抛开简单粗暴的套路式方法论，在情绪与现实、细节和时代的碰撞中探索、尝试，《漫长的季节》应该只是一个开始。

小多多
创投 2023年5月10日

百模大战开启，AI进入路线之争？

相关推荐