大模型开闭源之争,怕是要有结果了?

上周,Meta发布了其最新开源模型Llama3,提供8B和70B的预训练和指令微调版本,号称是最强大的开源大语言模型。据了解,基于最新的 Llama 3 模型,Meta 的AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook等全系应用。而近日,Meta趁热打铁,又宣布向第三

上周,Meta发布了其最新开源模型Llama3,提供8B和70B的预训练和指令微调版本,号称是最强大的开源大语言模型。据了解,基于最新的 Llama 3 模型,Meta 的AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook等全系应用。而近日,Meta趁热打铁,又宣布向第三方制造商开放自家的Meta HorizonOS,允许其他公司基于其生态系统设计更多头戴显示器。联想、微软和华硕都是Meta的首批合作伙伴。

看来,这是将开源进行到底,从大模型开源,到头显设备操作系统的开放。这也类似谷歌对安卓系统的开放模式。

不过,安卓系统整体并非一个完全开源的软件,比如Gmail、谷歌地图、Google Play、Chrome等一系列谷歌自家应用就是闭源的。毕竟,由于GPL v2许可证的关系,谷歌无法将安卓作为一个软件整体进行授权收费。谷歌其实只是理论上开放安卓,然后通过其他方式赚钱。

但大模型的开源,未来的盈利路线其实是很明确的——首先吸引更多的开发者参与到开源模型的改进和优化中来,而这些优化建议同样可以在闭源大模型中复用,大模型生态建设建设好之后,Meta就可以靠提供相关的技术支持、API授权等收费。

更多企业同样看准了开源的好处,4月23日晚,微软在官网开源了小参数的大语言模型——Phi-3-mini。据了解,Phi-3-mini参数只有38亿,训练数据却高达3.3T tokens,比很多数百亿参数的模型训练数据都要多,这也是其性能*的主要原因之一。微软表示,在未来几周内还会发布70亿参数的Phi-3-small和140亿参数的Phi-3-medium两款小模型。其中,Phi-3-medium的性能可媲美Mixtral 8x7B 和GPT-3.5,资源消耗却更少。

闭源阵营对手强大,开源阵营同样正不断有强手涌入。

那么,以OpenAI为代表的闭源阵营和Llama为代表的开源阵营,到底谁会成为以后的主导?

1、开源Llama 3实力如何

对于用户来说,不管闭源开源,“抓到耗子才是好源”。

从训练的角度,Llama3对中文并不友好。在15T Tokens的训练数据,仅有5%是为非英文数据,涵盖30多种语言,其中中文就更少了。据Hugging Face第三方大模型跑分测评数据,Llama3 70B性能已经超过部分早期版本GPT4。

据国内CLUE中文语言理解测评基准最新测评,Llama3-70B在代码能力上略低于GPT-4;在中文数学能力上基础难度(1-3步推理)与GPT4-Turbo、Claude3—Opus相差不多,在4-5步数学推理任务上还有一定优化空间。测评说得比较客气,其实就是说,英文上表现不错,中文上差距还比较明显。

而Meta首席人工智能科学家杨立昆则在推特上分享,Llama-3在Arena排行榜中已经位居第五。

大模型开闭源之争,怕是要有结果了?

英伟达高级科学家Jim Fan也表示,“Llama3-400B+ 将标志着社区获得 GPT-4 级模型的开放权重访问权的分水岭时刻。它将改变许多研究工作和草根初创公司的计算方式。我在 Claude 3 Opus、GPT-4-2024-04-09 和 Gemini 上拉了数据,Llama-3-400B仍在训练中,希望在接下来的几个月里会变得更好。有如此多的研究潜力可以通过如此强大的能力释放,期待整个生态系统的建设者能量激增!”

不管是同行抬轿子,还是自己王婆卖瓜,至少看起来,Llama3实力非凡。而大模型性能只要能超过早期GPT4水平,就意味着已经具备较强智能,可以作为生产力工具,去替代人类完成各类业务流的碎片、繁杂工作。

GroqCloud还提供云支持,可以让用户在没有本地强大GPU的情况下使用Llama-3的8B和70B两个版本大模型。基于LLama3的中文微调,国内也已经有不少开发人员正在测试中,比如用Ollama来本地部署LLama3进行训练。

8B 和 70B 两个型号的模型,仅仅标志着 Llama 3 系列的开端,Meta AI首席科学家杨立昆在其社交媒体透露,在接下来的几个月,还会有更多版本陆续发布。杨立昆还转帖分享了关于Meta支持开源的真实故事。

大模型开闭源之争,怕是要有结果了?

不过,百度CEO李彦宏近日在Create2024百度AI开发者大会上表示,大模型开源意义不大,闭源模型性能会不断提升。“有了文心大模型4.0,我们可以根据需要兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,且支持精调和post pretrain。通过降维裁剪出的模型,比直接拿开源调出来的模型,同等尺寸下效果更好,同等效果下成本明显更低。”

李彦宏认为闭源才拥有真正的商业模式,能够赚到钱,能聚集人才和算力。“闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。”同时,开源大模型的模式与传统的开源软件不同,并不是众人拾柴火焰高。因此,“未来开源模型会越来越落后”,其实在大模型场景下,开源是最贵的。

而前 DeepMind 和 Meta 员工创立的初创公司 Mistral AI 尽管也是开源的大力支持者。但该团队也计划在2024年筹集更多资金,以打造除开源产品之外的消费产品。毕竟,光开源不挣钱是无法长久的,特别是对创业团队。

但周鸿祎、王小川等业内大咖对于开源大模型落后论并不认同,先后在不同场次对此提出质疑。据报道,王小川在微信群讨论中表示,“关于开闭源之争,核心是要看谁在开源?双轮驱动,是一线创业AGI公司的*解。”

第二十七届哈佛中国论坛上,周鸿祎就表示,他一直相信开源的力量,“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。”

大佬们议论纷纷,其实谁都没有给出明确的答案。

2、开源与闭源,非得做选择题吗

李彦宏说得也没错,Llama系列并不是一个真正由大家一起来协同开发的产品。

据了解,大模型开源的方式主要有两种模式, Restrict License(限制许可)与 Apache。Llama的开源属于前者,在开放源代码的同时,对使用、修改和分发该模型的行为施加一定的限制。这与完全开放的开源许可证(如MIT、Apache 2.0等)不同,后者通常允许用户在几乎不设限的情况下使用和修改软件,Mistral、谷歌的开源模型Gemma都采取了这种方式。但哪怕后者,对于训练的数据和训练过程同样并不开源。

如果开源大模型最终的商业化还是要闭源,那就得看看闭源大模型们在做什么。

就拿最近大火的闭源大模型月之暗面为例吧。据界面新闻记者从多个渠道获悉,上一轮融资完成后,月之暗面(Moonshot AI)创始人杨植麟通过售出个人持股已套现数千万美金。由于杨植麟持股比例高达78.968%,出售部分股权似乎无可厚非?但也有投资人表示,“公司成立*年就套现这么多,这种情况并不多见。”

不过,月之暗面已经回应媒体:上述消息不实,月之暗面此前已公布员工激励计划。

套现谣传暂不讨论。但月之暗面的长文本能力,也面临被追赶的问题,毕竟长文本优势难以长期独占。不过,这是月之暗面作为初创公司要面临的问题,并不是闭源大模型行业的问题。

无论开源还是闭源,国内大模型玩家,往往呈现业界每出现一次突破性的进展,其他玩家就会快速跟进的窘境——这就意味着,创新容易被模仿,最后拼的只能是血槽厚不厚。对于B端客户而言,如果对接小厂出现不确定性,转向服务更为成熟的大厂就顺理成章。当然,月之暗面至少不打算做B端,想必也是知道B端客户的多变。

反倒是C端客户,不在乎用的大模型是不是巨头做出来的,只要好用、有一些功能切中自己需求就行。

杨植麟一直是闭源大模型的拥趸。他曾在腾讯新闻、36氪的专访中表示,开源落后于闭源是个事实。因为现在开源本身还是中心化的,开源的贡献可能很多都没有经过算力验证。闭源会有人才聚集和资本聚集,最后一定是闭源更好;反而是落后者才会开源,“搅局嘛,反正不开源也没价值”。

他认为,开源和闭源在整个生态里面会扮演不同的角色,开源很大的作用是在To B端的获客,如果想做头部的Super App,大家肯定都是用闭源模型去做的,在开源模型上做C端应用很难做出差异化。

不过,不同于月之暗面、百度押注闭源,更多大模型企业选择开源和闭源并行,例如Google、阿里巴巴、昆仑万维、零一万物、百川智能等。比如百川智能开源Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其4bit 量化版本;但还有一些说明却没有“用大字”标注清楚——那就是这些开源的模型不算大,而且与百川智能的闭源模型相比性能差别较大。

开源大模型们似乎都财大气粗,不计较营收。至少生态上,基于开源模型也带来更多百花齐放的产品,比如Llama中文社区最近完成了对Llama3两个模型的中文能力优化,并推出了中文微调版供用户试用;还有更多基于Llama3的轻创业项目在启动。因为,大家节省了大量训练的成本,只需要投入少量的微调成本即可快速上线一个垂直领域AI应用。

而闭源大模型们则都为了拿到大模型落地订单、争夺客户而卷生卷死。

从性价比角度,目前在开源模型上进行相应的训练和微调比GPT3.5还是具备一定的价格优势。据了解,Llama2-70b的微调价格是4美元/100万token,而GPT3.5则要8美元/100万token。但价格是会变化的,未来闭源模型一样可以提供足够高的性价比。

那么,大模型领域的创业者们如何找到PMF(Product Market Fit)?

其实,开源和闭源都不是重点。创业者没必要二选一,完全可以全都要,从而找到最适合自己的底层模型并训练出有商业化潜力的垂直模型。甚至国内的一些闭源大模型,也是基于开源Llama的套壳,再叠加专业垂直领域数据集的训练,从而应用于细分领域。

乔布斯曾说:“我愿意把我所有的科技去换取和苏格拉底相处的一个下午。”

但对于坚持闭源或者开源大模型的大佬来说,自己立场对面的那些“讨厌嘴脸”们,应该是不值得自己用所有科技换取一个下午的。

(0)
小多多的头像小多多创始人

相关推荐

  • 巨亏47亿,降价自救!嘴硬的蔚来,这次为何服软了?

    巨亏47亿,降价自救!嘴硬的蔚来,这次为何服软了?,蔚来为何会走到降价这一步?更重要的是,降价能“拯救”蔚来吗?

    2023年6月27日 创投
  • 复旦大学-华盛顿大学EMBA二十年20人丨李菲:走“最远”的路,探索医疗行业的数字化变革_行业动态

    贴近李菲的视角,聚焦赛诺菲在中国的数字化转型,可以清晰看到她在医药行业的背景下,为打通数字与传统的流动性所做出的一系列创新性尝试。这位现任赛诺菲大中华区的资深人力资源管理者致力于运用敏捷管理赋能团队,“让大象起舞”。而在复旦大学-华盛顿大学EMBA项目的求学经历也让她拥有面对压力与变数的底气,让她

    2023年9月15日 创投
  • ChatGPT救不了云知声

    ChatGPT救不了云知声,但从上面各大人工智能企业的动作不难看出,虽然在前几年都曾坐过“冷板凳”,但在今年春天,整个AI行业都在跃跃欲试,想要重振旗鼓重新提交上市申请,难道新的机会已经来了?

    2023年4月13日
  • 私域运营新法之四:商协会数字化转型和私域增收的成功秘诀!_行业动态

    商协会的主要目的是通过集结企业力量,促进行业内的合作与发展,为会员提供服务和支持,并代表会员的利益和声音与社会个界进行对话和交流。商协会通常会组织各类活动、培训、研讨会和展览等,提供信息、资源和市场机会,并促进会员之间的业务合作和网络建立。商协会在推动行业发展和维护会员权益方面具有重要作用,同时也

    创投 2023年8月17日
  • 凶猛的拼多多,着急的马云,以及袭来的白牌时代

    11月28日拼多多发布了大超市场预期的Q3财报后,其市值来到1847亿美元,离阿里的1954亿美元市值仅一步之遥,而京东市值仅相当于四分之一个拼多多。紧接着在昨晚,拼多多市值一度超越阿里巴巴,短暂成为美股市值*中概股。截至当天收盘,拼多多股价涨幅收窄,现涨1.96%,总市值1883亿美元,低于阿里巴

    创投 2023年12月1日
  • 如何用支付宝还信用卡 相关方法和路径介绍

    如何用支付宝还信用卡?据悉用支付宝还信用卡,首先打开支付宝网站输入支付宝账号和密码,登录,如果忘记支付宝账户的话,可以选择右上角红色标注区域,使用淘宝账户登录;进入支付宝首页之后,…

    创投 2022年1月25日
  • 《数字中国发展报告(2022年)》发布,能链助力能源领域数字化转型_行业动态

    5月23日,国家互联网信息办公室发布《数字中国发展报告(2022年)》。报告中提到,2022年数字基础设施建设取得显著成效,工业互联网、车联…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    2023年5月24日
  • 赛陆医疗完成数亿元A轮融资,深创投、前海母基金、博远资本共同领投

    投资界(ID:pedaily2012)12月1日消息,深圳赛陆医疗科技有限公司(以下简称:赛陆医疗)于近日宣布完成数亿元A轮融资。本轮融资由深创投领投,前海母基金和博远资本共同领投,邦勤资本、敦行资本、崖州湾创投跟投。融资资金将用于赛陆医疗自主知识产权的基因测序平台和空间组学产品的持续研发和注册申报

    2023年12月1日
  • 研究生多到无宿舍可住

    导读壹 ||2019年,复旦大学和同济大学几乎同时联系到林凡所在的宿舍型长租公寓企业,希望租赁公寓作为研究生和留学生的宿舍。此后几年,仅上海就陆续有7所高校与其沟通,希望租赁长租公寓做宿舍。贰 ||包括上海松江大学城、奉贤大学城、北京良乡高教园区、北京昌平区沙河高教园区、南京仙林大学城等,均建设

    2024年2月28日
  • 正浩户外电源引领户外生活新篇章_行业动态

    随着户外活动的普及和人们对高品质生活的追求,户外电源的需求也越来越高。为了满足这一需求,正浩在睿系列的基础上推出了更加轻质小巧的睿RIVER 2系列户外电源,睿RIVER 2系列以其*的充放电性能和便捷的使用体验,上市后就成为了市场上的焦点。正浩标志性的 X-Stream 闪电快充技术可提供行业内

    创投 2023年12月26日
  • 年轻人沉迷刮刮乐?一文看懂彩票生意经

    年轻人沉迷刮刮乐?一文看懂彩票生意经,无论是买彩票还是刮刮乐,年轻人将彩票作为一种消遣方式,享受的就是开奖过程中期待和惊喜的感觉。刮卡开奖的过程,也成为了年轻人解压的过程。

    2023年7月17日 创投
  • 李宁,真急了

    商界导读:火柴棍能否成为李宁的“始祖鸟”?2月1日,安踏集团旗下、始祖鸟母公司亚玛芬体育(Amer Sports)正式登陆纳斯达克,成为龙年*个中概股IPO。从递表到上市,亚玛芬只用了28天。上市之后,安踏市值高达1886.5亿港元,远高于李宁的424.8亿港元和特步的105.9亿港元。就在始祖鸟上

    2024年2月26日
  • 今年的618静悄悄

    今年的618静悄悄,提振消费还需要打组合拳。不仅要千方百计增加居民收入,进一步优化就业、收入分配和消费全链条良性循环促进机制,同时还要积极增加优质供给,做好基本消费品保供稳价。

    2023年6月30日
  • 利物浦都在用的AI教练,真能拯救国足吗?

    不久之前,在亚洲杯一场未胜之旅结束后,国足又又又一次陷入了选帅争议。而国足新帅伊万科维奇两场主胜客平新加坡,成绩也实在谈不上亮眼。这种情况下,广大球迷又开始争论,究竟哪位教练才能拯救国足。至少要止住目前一路下跌,不知何时才是谷底的颓势。而这时候,一条新闻映入了球迷眼帘,说是英*队利物浦,已经从三年之

    2024年4月16日
  • 一夜暴涨2亿,连亏5年的户外老大被哈尔滨救了

    哈尔滨的富贵人设全面爆发。在南方小土豆的热情下,泼天的富贵雨露均沾到各个行业。冰雪大世界成功挑战吉尼斯世界纪录,获得“世界*的冰雪主题乐园”称号。中央大街的马迭尔冰棍,3天就卖了10万支。哈尔滨当地的住宿、餐饮企业收入同比增长129.4%。不仅如此,哈尔滨的旅游热还传到了二级市场,多个冰雪概念股被引

    2024年1月9日 创投