建议阿里们，不要着急抢行业大模型的「饭碗」

小多多 • 2023年9月27日上午10:55 • 创投

近几个月，国内大模型领域一个很明显的发展态势，就是大家扎堆行业大模型。不仅各个垂直领域的企业发布多个行业大模型，而且百度、阿里巴巴、华为、腾讯、京东等头部巨头，也把行业大模型作为一个关键的发力点。具体来看，根据大模型在其战略中的比重，这些厂商又可以分为两类：百度、阿里巴巴、腾讯、科大讯飞这几家，通用

近几个月，国内大模型领域一个很明显的发展态势，就是大家扎堆行业大模型。不仅各个垂直领域的企业发布多个行业大模型，而且百度、阿里巴巴、华为、腾讯、京东等头部巨头，也把行业大模型作为一个关键的发力点。

具体来看，根据大模型在其战略中的比重，这些厂商又可以分为两类：

百度、阿里巴巴、腾讯、科大讯飞这几家，通用大模型与行业大模型并重。

一方面，他们比较注重通用大模型，并将通用大模型开放给C端用户使用。百度文心一言、科大讯飞的讯飞星火甚至做了手机端APP，来推进通用大模型的应用。

另一方面，他们也非常注重行业大模型。一般通过行业解决方案的形式，对外输出。甚至，在9月19日，百度直接推出了一个医疗行业大模型——灵医大模型，直接服务医院、患者、医药器械企业。

另外一类，则以华为、京东为代表，他们从一开始就主打产业大模型，直接面向行业应用。

华为盘古大模型一开始打出的口号就是“不作诗，只做事”，其并不热心C端应用，几乎把所有战略重心都放在行业上。

京东的言犀大模型也类似，秉承京东云“更懂产业的云”这一理念，京东在大模型领域也将重心放在行业应用上。此外，京东健康还发布了京医千询大模型，作为进军行业领域的排头兵。

可以发现，无论是“两线并重”的百度、阿里巴巴、腾讯、科大讯飞，还是几乎“单线作战”的华为、京东，都将行业大模型作为一个兵家必争之地。

笔者认为，这是有问题的。这些科技巨头，应该把重心放在通用大模型上，行业应用应该交给各个行业领域的合作伙伴去做，自己只做大模型的“基础设施”，不碰上层应用。

为什么这样说，接下来我们来详细分析其中的利弊关系。

巨头应该着眼于通用大模型的研发

通用大模型就像整个大模型产业的地基，地基是否牢固，将决定了这座大厦能够建多高。那么，现在的地基牢固么？

很遗憾，虽然目前大模型初步实现了智能“涌现”，在自然语言理解、内容生成、逻辑推理方面都有长足的进步，但是还不够好。尤其是想让大模型在各个行业领域进行商业落地，目前的模型能力是不够的。

这里说的能力不够强，不是特指某一个大模型。

即使是GPT-4，要想在商业领域落地，能力都还存在显著的不足。我们来看几个例子。

搜索引擎是大模型一个重要的应用场景，微软的必应因为接入ChatGPT，改变了原来关键词的搜索方式，打了一个漂亮的翻身仗。那么，有ChatGPT助攻的必应的真实表现如何呢？

我们试用了一下，说实话让人很失望。

以下是一个例子，让必应查找一下今天（9月26日）关于大模型的新闻，结果给出的四条新闻，点进去之后，第1、3条内容其实来自于一篇新闻文章，而且这条新闻是2月21日发布的；第2、4条内容也来自同一篇新闻，这个新闻是7月27日发布的。

也就是说，给出来的新闻是错的，我们要找今天的新闻，结果却返回几个月前的内容。而且，我们是要找大模型领域发生的重要事件，给出来的四条答案中，有两个报告、一篇新闻分析文章、一个论坛活动。严格的说，报告、分析文章并不算是重要的新闻事件，从这个角度来说，必应给出来的结果也完全不符合要求。

笔者接着往下问，让它用表格梳理一下给出的新闻内容。结果在其给出的表格中，新闻时间都变成了9月26日，而且具体到时间点，这明显就是在胡说八道嘛。

笔者曾经对必应这类新的搜索引擎怀有很高的期待，也尝试过很多次。但整体的感觉就是——基本不能用。这就是ChatGPT在搜索领域应用的实际表现，某种程度上，这已经代表了大模型所能达到了最高水平。

百度也推出了类似的功能，除了通常的网页搜索外，也可以通过对话形式来进行查询，我们迫不及待的试了一下。

相对于必应，百度对于新闻事件的理解要好一些，必应给出了几个报告，百度给出的结果是大模型发布，这些事件的新闻价值明显更高。

但是，百度给出的这些结果靠谱么？同样的，我们让其以表格形式进行统计，并给出新闻时间和链接。可以发现，时间都是5月11日的，这明显是有问题的，我们要的是9月26日的新闻，而不是5月11日的。

而且，表格里给出的新闻链接也有问题，打开对应的网页直接是“404”。当然，微软的必应也有这个问题，其给出的新闻链接要么打不开、要么不存在。

回到ChatGPT上来，其一个重要的局限就是不能联网，而且其数据没能实时更新，GPT-3的训练数据集是截止到2021年9月，GPT-4的训练数据集是截止到2022年1月。

而且，ChatGPT在复杂的数据计算处理方面，经常会出错。其宣称的文本上传、理解能力，也并不理想。

让我们来试一下GPT-4的文档理解能力。我们上传了龙芯中科的2023年半年报，试图让其来做一个简单的SWOT分析。上传文档之后，ChatGPT就开始写代码，来解析文档，好像很厉害的样子。

结果如何呢？

最终，ChatGPT没解析出来这个PDF文档，我们又试了好几次，结果都是解析不出来。

试想一下，依托这些大模型，想要在复杂的行业场景落地，效果必然不会很理想，而他们已经是现在市场上*的通用大模型了。

诚然，大模型的确出现了一些“智能涌现”，能力得到质的提升，但目前处于“小荷才露尖尖角”的初级阶段。既然发现大模型这条道路是一个有希望的方向，那现在最应该做的是快马加鞭，好好培养这个有潜力的“孩子”，而不是过早的就让其来养家糊口。

以历史经验来看，每次人工智能狂热之后都会经历一段漫长的沉寂，主要原因就是前期人们的期望值被拉得太高了，一旦发现达不到期望就会很失望。

同样的，如果现在就匆匆将大模型在各个行业领域强行落地，很快就会迎来一个问题爆发期，人们会从巨大的期待迅速转变成疯狂吐槽，这样的大起大落是不利于行业健康发展的。

所以，阿里巴巴、华为、百度、腾讯这样的科技巨头，目前最核心的任务，就是把通用大模型这个“孩子”培养好。只要能力真正提上来了，那规模化落地其实是很快的，不着急在这一时半会。

大模型领域有一条著名的智能涌现的曲线，也就是模型的表现跟参数规模并不是线性相关的，不是200亿参数的模型就比100亿参数的模型好两倍。

在这个智能涌现曲线上，有一个阈值，目前看这个阈值就是1000亿参数左右。在这个阈值之前，模型表现出的智力水平并不随着参数规模的扩大而显著变化，200亿参数的模型跟20亿参数的模型表现差不多。但是，当参数规模迈过千亿的门槛之后，模型的表现得到指数级提升。

虽然，模型规模不能代表一切，但从近十年的人工智能发展经验来看，“数量暴力”往往是一个关键的方向，更大的模型、更深的神经网络、更多的数据，会带来更好的表现。

从目前的智能涌现曲线来看，千亿级参数规模之后，又会进入一个智能瓶颈期，可能5000亿参数的模型，跟1000亿参数模型在“智力”上没有显著的差异。但是，如果我们要追求下一个“涌现阈值”，目前来看*的办法就是继续扩大参数规模。也许，等参数规模扩大到几十万亿之后，又会迎来下一个涌现阈值，大模型的能力将再上一个台阶。

当然，扩大模型规模，成本也会显著提高，所以这只能是巨头们的游戏。而且，单纯扩大模型规模，还会带来过拟合的问题。因此，模型规模的扩大还需要配合模型架构的优化调整，这才是真正考验技术能力的地方。

退一步说，现在的大模型都是基于Transformer架构，而这个架构是5年前谷歌的几个研究人员的一篇论文提出来的。那么Transformer架构真的是*的么，是否有更好的模型架构呢？这些问题，都是需要华为、百度、阿里巴巴、腾讯等科技巨头来回答的。

除了参数规模、模型架构外，大模型还需要解决“幻觉”问题、可解释性问题、多模态问题。这些问题现在都没能得到很好的解决，这是整个行业所面临的共同难题。而要解决这些问题，关键还是在于通用大模型上的底层技术突破，而不在于行业大模型。

当然，谁能真正解决这些关键问题，那市场必定会给出对应的奖励。

不要既做裁判又做运动员

之所以建议科技巨头先不要碰行业大模型，除了通用大模型的问题还没解决外，另一个很重要的原因，就是避免与合作伙伴发生利益冲突。

对于科技巨头而言，玩的是生态的游戏，分享的是基础设施的收益。

在大模型领域，其价值传导路线应该是通用大模型-行业大模型-行业客户。在行业大模型阶段，华为、百度、阿里等通用大模型厂商既可以自研行业大模型，也可以让第三方合作伙伴在自己通用大模型基础上进行研发。

通用大模型考验的是技术能力，而行业大模型的技术门槛并不是很高，其核心要素是数据和行业经验，而这两点是科技巨头们的短板。要汇聚金融、医疗、制造、零售等各个行业的优质数据集，理解各行各业的业务场景，*不是某一家企业能够做到的，必须依托生态的力量，用整个生态体系成千上万的合作伙伴去做。

当然，百度、华为、腾讯这样的通用大模型厂商，也可以两条价值传导路线都占。比如，在医疗领域，百度既可以用自有的灵医大模型去直接服务医院、患者、医药器械企业，同时也可以推进垂直医疗大模型合作伙伴体系建设。

但是，这种情况就会面临“与民争利”的问题，这犯了商业的大忌。

试想一下，某个医疗大模型企业A，建立在B企业的通用大模型基础上，把自己的核心医疗数据向B开放，训练医疗大模型。在几个月之后，A发现B企业也推出了一个医疗大模型，而且功能跟自己的差不多。在行业客户打单时，发现B企业也在竞标，自己的合作伙伴突然变成了竞争对手。如果是这种情况，A企业还愿意与B企业合作么？

在一个生态体系中，合作伙伴对于生态主的信任是黄金一般宝贵的东西。只有上层应用合作伙伴坚信生态主不会跟他发生利益冲突，不会抢他生意，他才会放心把自己的业务放在生态主构建的平台上。

这有点类似于云计算领域IaaS厂商与SaaS厂商的关系。中国很多SaaS企业之所以对阿里云、腾讯云、百度云、华为云等云厂商不放心，最关键的就是怕利益冲突。目前，IaaS云厂商的业务边界不够清晰，不仅提供IaaS、PaaS产品，还进入了不少SaaS领域，这是其SaaS合作伙伴最忌讳的。

在中国互联网的早期阶段，投资人对创业公司有一个著名的灵魂拷问——腾讯做一个同样的产品，你怎么办？

同样的道理，通用大模型厂商想构建一个应用生态，那医疗、金融、政务、制造等领域的行业大模型厂商也会问——你将来做一个跟我一样的东西，那我怎么办？

那怎样的大模型生态体系才更合理呢？可以借鉴云计算生态体系，通用大模型相当于IaaS，行业大模型相当于SaaS。

百度、华为、阿里巴巴、腾讯、京东、字节跳动、科大讯飞等几家头部通用大模型厂商，专心做好通用大模型（IaaS+PaaS），尽量不碰行业大模型（SaaS），划分好业务边界。

需要指出的是，即使不做行业大模型，底层通用大模型厂商依然可以分享到大模型的行业应用红利。就像SaaS应用会消耗IaaS资源，为IaaS付费一样，上层的行业大模型会调用下层通用大模型的能力，可以基于调用的次数和使用量，来构建合理的商业模式。

比如，百度不做医疗大模型，但在文心一言基础上有10个医疗大模型合作伙伴，每个合作伙伴服务1000家医院。假定每家医院每年付费100万元，这100万中百度分享20%。那每个医疗大模型企业每年可收入10亿元，百度的收入为10亿*20%*10=20亿元。这样一来，百度只需要服务好10家合作伙伴即可，而不是去服务1万家医院。

以此类推，如果能够构建一个繁荣的行业大模型生态体系，大模型的行业应用也可以为底层通用大模型厂商带来上百亿的收入规模。

对于百度、华为、腾讯、阿里巴巴这种通用大模型厂商而言，根本无需担心错过行业大模型应用的红利。就像云计算领域，有哪个SaaS厂商的收入能够媲美做IaaS的阿里云、腾讯云、华为云？

只要专心把通用大模型的地基打好，那以后就可以躺着卖“地皮”，而不用苦哈哈的搬砖建房子。我们回想一下房地产领域，*钱的是万科、恒大这种房地产开放商么？显然是卖地更赚钱，也更轻松。

对于垂直行业大模型厂商而言，他们最理想的状态，是借鉴SaaS跨云部署策略，实现行业大模型的跨通用模型部署，并可将业务从一个通用模型平台平滑迁移到另一个平台，这样就避免了被单个平台绑定。当然，目前行业大模型才处于非常初级的阶段，谈跨通用模型部署还为时尚早。

行业大模型的跨模型部署模式数据猿制图

综上，建议百度、华为、阿里巴巴、腾讯这类科技巨头，把注意力放在通用大模型的研发方面，而不是放在行业大模型的应用上。

一方面，通用大模型现在还不足够好，模型的智能水平不够高、幻觉问题、可解释性差、多模态融合能力差、模型训练推理成本高等问题还很突出，科技巨头应该去解决这些更底层、更具挑战性的难题。只有这些问题得到解决，大模型行业应用的根基才稳固。

在大模型行业应用层面，完全可以交给上层的垂直领域企业去完成。可以预见，每个领域都将会有成百上千家行业大模型企业竞争，最后优胜劣汰留下来几十家，这些生存下来的企业就是合格的合作伙伴。底层通用大模型厂商应该与合作伙伴一起构建一个生态体系，来共同服务行业客户。

华为大模型阿里

小多多创始人

0 0

重拾中长视频梦，抖音快手再推新App

Tech星球*获悉，近日，快手推出了一款名为“噗叽”的APP，产品定位是潮流视频社区，包含时尚、音乐、艺术、二次元等兴趣知识视频、图文内容。不久前，抖音旗下的B站版APP“青桃”，于近期更名为“抖音精选”，定位年轻人的兴趣知识视频平台。值得注意的是，这两款产品都有着相同的特点，同属年轻人的兴趣类型视

小多多
创投 2023年9月28日
创投

蕉下的野心，防晒衣装不下

蕉下的野心，防晒衣装不下,小黑伞后来让蕉下长期陷入收智商税的舆论中，“轻量化户外”的代表性产品会不会重蹈覆辙尚，就见仁见智了。

小多多
2023年6月13日
苹果游戏三十年：收租、封锁与变调

很少有人把苹果视作一家游戏公司。无疑，它和我们印象里那些名作迭出的游戏界巨头们大不相同。一直以来，苹果没有多少独立开发游戏的经验，从不以自研厂牌的姿态挑逗受众，作为硬件大厂也并未在当下推出任何一款正儿八经的主机设备。可倘若将业务营收体量与行业影响力纳入考量，又几乎没有人能忽视这家公司在全球游戏生态中

小多多
创投 2023年11月22日
创投

北京设立200亿元医药健康产业投资基金

投资界（ID：pedaily2012）消息，12月28号，北京市医药健康产业投资基金（有限合伙）在昌平设立，注册资本200亿元。据悉，2023年9月，北京市委市政府批准设立200亿元医药健康产业投资基金，100亿元人工智能产业投资基金、100亿元机器人产业发展基金、100亿元信息产业发展基金。北京市

小多多
2024年1月3日
国产软件概念股有哪些给投资者介绍以下几个

作为一个大家都非常关注的行业，很多人都想知道，国产软件概念股有哪些值得研究，这篇文章就跟大家聊聊这个话题，介绍几家相关的公司。东方通：中国中间件的开拓者和领导者,多年来保持中间件…

小多多
创投 2022年1月25日
创投

直播带货的铠甲与软肋

2021年才开始直播带货的东方甄选，凭借俞敏洪和董宇辉等人的卖力吆喝，一年卖货100亿元，帮公司创造了近10亿元的净利润。交个朋友控股和遥望科技，旗下直播带货业务，也成为公司的中流砥柱。那些直播带货领域更赚钱的一线公司，则更多地存在于财富神话中：疯狂小杨哥背后的三只羊，动辄拿出亿元现金买楼；薇娅不在

小多多
2023年8月31日
创投

福田资本运营集团战略投资AIoT企业特斯联

投资界（ID：pedaily2012）12月30日消息，近日，福田资本运营集团完成对AIoT领军企业特斯联的战略投资，以期进一步推动福田数字产业升级，为福田区经济高质量发展注入新动能。作为福田区国资局出资设立的国有资本运营集团，此次福田资本对特斯联的投资亦是福田营造数字发展生态、打造数字产业集群的重

小多多
2023年12月30日
创投

中国芯片制造关键环节跑出一个IPO，估值80亿

致力于国产替代的半导体软件公司东方晶源微电子科技（北京）股份有限公司（以下简称“东方晶源”）正式启动IPO进程。据证监会官网信息，9月1日，东方晶源上市辅导备案获证监会受理，辅导机构为中信建投。据了解，东方晶源主营业务聚焦在集成电路制造良率管理领域，以降低芯片制造门槛为使命，其自主研发的国产首台电子

小多多
2023年9月7日
创投

主动让出权益，一家百亿美金Biotech的抉择

在创新药企的发展过程中，何时该激进向前，何时又该保守发展，是一门学问。虽然，二者之间没有对错之分，但若是在该保守的时候激进了，在该激进的时候保守了，很容易让企业陷入困境之中。关于保守与激进之间的平衡之道，美国创新药企Alnylam的做法，对当下的国内创药企们颇具意义。Alnylam拥有一款临床早期数

小多多
2023年9月14日
创投

什么是顾比倒数线一个主要的交易管理工具

顾比倒数线（COUNTBACK LINE）什么是顾比倒数线？顾比倒数线(COUNTBACK LINE)被顾比先生作为一个主要的交易管理工具,简单来说,就是利用三个重要的价格条来…

小多多
2022年1月25日
创投

刚刚，1688、闲鱼「涨价了」

节点财经获悉，阿里旗下的国内批发电商平台 1688 和二手电商平台闲鱼的重要性提升，近期升级为淘天集团的一级业务。过去，1688和闲鱼，并非核心业务，如今，升级为一级业务，身价“上涨”。3月业务拆分时，之所以把1688和闲鱼留在淘天，而把高鑫零售、盒马、银泰等归入其他，不仅因为这两块业务是内部原生业

小多多
2023年11月3日
怎样看基金行情选基金的标准和技巧有哪些-财经

基金走势图，是基金市场新手入门需要了解下基础知识，只有熟悉了解基金走势图，你才会知道如何判断基金的优良，基金行情怎么看？在选基金时的标准和技巧有哪些？今天，小编就给大家介绍介绍。 …

小多多
创投 2022年1月25日
终止科创板IPO，联想讲不出“芯”故事

来源：字母榜（ID：wujicaijing）作者：彦飞编辑：王靖酝酿大半年之后，联想集团的“回A”之路戛然而止。 10月8日晚间，上交所官网显示，联想的科创板IP…

小多多
2021年10月11日 • 创投
「热锅」上的减肥概念股

市场热度高涨当前，A股减肥药板块一涨再涨，相关上市公司也按耐不住了，甚至个别高管走向台前，亲自讲述自家在研药物的“减肥奇效”。10月12日下午，在博瑞医药（688166.SH）召开的“大咖解读GLP-1全产业链系列交流会”电话会议上，公司董事长袁建栋发布了个人试用在研产品BGM0504注射液相关情况

小多多
2023年10月19日 • 创投
何猷君：「赌王之子」的电竞江湖

“亚运会电子竞技首枚金牌诞生了！”这是中国电竞史上意义非凡的一役——第19届亚运会电子竞技项目（*荣耀亚运版本）决赛，中国以2:0击败马来西亚，拿下亚运会历史首枚电竞金牌。何猷君坐在台下，从一开始的激动、雀跃，转而百感交集——电竞选手终于可以“堂堂正正”站在亚运会的领奖台，迎接国旗升起的一刻。何猷君

小多多
创投 2023年10月31日

建议阿里们，不要着急抢行业大模型的「饭碗」

相关推荐