马斯克为何要作开源「秀」

3月11日周一,马斯克发推文说要在一周内开源Grok。众多开发者等着盼着过了一周,到周日Grok才正式将代码推到了开源社区。开源的Grok-1是一个基于Transformer架构的自回归模型,参数规模达到3140亿参数,是目前参数量*的开源模型之一,Grok-1与主流开源大模型一样免费可商用。在开源

3月11日周一,马斯克发推文说要在一周内开源Grok。众多开发者等着盼着过了一周,到周日Grok才正式将代码推到了开源社区。

开源的Grok-1是一个基于Transformer架构的自回归模型,参数规模达到3140亿参数,是目前参数量*的开源模型之一,Grok-1与主流开源大模型一样免费可商用。

在开源之前,Grok*的亮点是直接调用X中的实时数据和“幽默”。

但开源版本的Grok已经打了折扣——在开发者手里,Grok不可能调取X的数据。从本次开源的信息来看,2023年11月Grok上线以后调用过的X数据,也没有被作为训练数据沉淀到Grok中。

除开源打折外,Grok本身的性能也并不占优。刚上线时,Grok的评分就远落后于当时的Palm 2、Claude 2和GPT-4。最典型的问题是,其支持的上下文长度只有8192个token。

Grok取得的关注(上线3天在GitHub收获3.9万Star),似乎很大一部分都来自马斯克本身的流量热度。开源Grok被马斯克说成是为了践行“AI造福全人类”的目标,但在与OpenAI的官司期间开源,有观点认为,Grok 开源的目的之一,就是为马斯克起诉、声讨OpenAI提供的事实依据——这是一场由马斯克亲自操盘的“AI 大秀”。

开源Grok是作秀?

开源是一场让企业与开发者跳双人舞的“社区游戏”,但Grok这个“舞伴”,完全不是普通开发者所能掌控的。

在Grok-1之前,很多开源大语言模型(LLM)的参数量只有70亿,LLaMA-2开源的*参数量也只有700亿。

而马斯克直接开源了自家尺寸*的3140亿参数模型,据估计Grok-1需要约628 GB GPU内存才能勉强运行,普通开发者几乎不可能在本地尝试Grok-1,对于云服务用户来说,至少需要8张80GB显存的A100或H100 GPU。

在Grok的GitHub讨论区有用户留言表示:谷歌云上80GB A100的4卡服务器每小时运行成本是20美元,这不适合我。(GCP instance with 4 A100 80GB; it cost around $20 per hour; this is not for me LOL.)

马斯克为何要作开源「秀」

Grok开源之后,笔者也加入了一个关于Grok的开源讨论群,但到了第二天,群内的讨论焦点,已经转向了只有40亿参数的Qwen-1.5。

不过,Grok-1也支持8bit量化,一些开发者认为,如果模型可以量化到160GB,“可玩性”会大幅提高。算力不太宽裕的开发者,可以等到官方或者其他开发者发布量化版本后再尝试。

至少从短期来看,开源Grok对普通开发者并不是很友好。那么开源对于Grok本身来说,有什么帮助呢?从传统的开源视角来看,也很难说。

一些人认为开源模型可以汇聚更多开发者力量,帮助优化模型。但今天的开源AI与传统的开源软件逻辑几乎完全不同。代码开源对于AI大模型的促进作用,并不像过去的开源软件那样明显。

传统软件开发过程中,一款系统、工具或软件开源以后,开发者可以基于共享代码直接修复bug,优化程序。然而今天的多数AI模型本身就是一个很大的黑盒,要从中找到问题,并对模型的底层算法进行训练、调优并不容易。

“AI大模型训练是一个很‘集中’的工作。”生数科技CEO唐家渝表示,AI大模型很难通过“分布式”的开源来收集开发者的“贡献”。闭源反而是更能集中包括智力的资源、算力的资源,去做不断地迭代的。

一些开发者认为,对于开源AI模型的作者来说,*的好处是打响知名度——以Grok目前的模型能力来看,只有吸引一批开发者、公司、机构对模型进行试用、开发,逐步建立起对模型的认可,才能稳固其在AI大模型领域的“江湖地位”,提高这款既不太新,也不太强的AI大模型的影响力。

闭源Grok把路走窄了?

从AI行业角度来看,Grok的受关注度不高。由于模型跑分不高,过去几个月中发布的AI大模型,在对比评测数据集得分时,几乎很少有人对标Grok。

从业务视角来看,Grok在X平台中的表现也不理想。

Grok上线到X后,与ChatGPT Plus一样采取订阅制,但ChatGPT的GPT-3.5免费开放,而Grok则一刀切,只提供给X Premium会员。X Premium会员的订阅费用是16美元包月,168美元包年。

由于一开始就设置了付费门槛,Grok没有吃到X庞大用户基础的红利。

数据网站SimilarWeb的统计显示,2024年2月,x.com的总访问量为1.04亿次,平均访问时长只有24秒。对比其他几家主流闭源AI的同期流量,chat.openai.com访问量为15.5亿次,平均访问时长是7分33秒;gemini.google.com访问量为3.161亿次,平均访问时长6分22秒;相对小众一些的claude.ai访问量为2086万次,平均访问时间为5分48秒。

马斯克为何要作开源「秀」

X与三款AI对话网站流量  数据来源|SimilarWeb

虽然影响网站流量的因素很多,且x.com网站的受众、属性与其他几家也有明显差异,直接对比流量并不能完全说明问题,但访问时长的巨大差异,也侧面反映了X用户大概率没有跟付费的Grok聊太多。

马斯克最早给Grok的战略定位,可能更多是考虑促进X的Premium会员销售,以补贴X的广告收入。然而,如今Grok在X中发挥的作用很可能并没有达到马斯克的预期。与其一直在X Premium中“躺平”,开源Grok或许能给马斯克和x.AI打开新局面。

开源激起千层浪

在AI大模型热潮中,靠开源大模型树立行业地位的公司并不少见,包括MistralAI以及国内的智谱,阿里的通义千问等。

深陷元宇宙泥潭的Meta更是依靠开源LLaMA模型打了一次翻身仗。在2023年中,全球市场*的变数是AI大模型,而Meta*的变数就是开源了一款AI大模型。

通过开源LLaMA,Meta展现了其在大型语言模型(LLM)领域的技术实力和开放创新的姿态,这在一定程度上帮助公司缓解了市场对其元宇宙战略的担忧。由此Meta的股价也在一年内翻了几番,市值从3155亿美元涨到1.2万亿美元,涨出了19个京东。

LLaMA的开源,特别是其成本效益高的特点,对Meta而言具有战略意义。与Google和Microsoft等竞争对手的AI大模型相比,LLaMA的小巧和高性能使得Meta能够以较低成本部署高效的AI模型。这不仅提高了AI技术的普及率,也为Meta未来在各种应用和用例上的广泛部署提供了可能。有分析人士认为,基于Meta的业务范围,从聊天机器人到游戏,再到未来的生产力软件,生成式AI预计将带动一个价值超过500亿美元的市场。

虽然LLaMA最初的开源一直被业界传说是无意间的“泄露”,但其最终的结果却为Meta在AI大模型行业奠定了技术和市场的领导地位。

“开源”的战略逻辑,对于马斯克来说并不陌生。

2014年,马斯克开放了特斯拉的350多项电动车专利技术。当时马斯克在接受采访时表示,“特斯拉的首要目标是加速全世界向可持续能源转变”。事实证明,马斯克大公无私的“开源”,在后来使得他自己成为了*的受益者。

特斯拉开放专利的做法,一举将全球汽车市场的水搅浑。大量新能源车企借助特斯拉的专利异军突起,直接激活了整个新能源汽车市场。而特斯拉作为行业领军企业,则借助长期积累的行业口碑和技术开发实力,持续保持了行业的*地位。

虽然开源Grok大概不会像特斯拉开放专利那一石激起千层浪,改变整个AI行业的格局,但对于目前的x.AI来说,应该也会产生一些积极的影响。

(0)
小多多的头像小多多创始人

相关推荐

  • 茅台瑞幸联名的真谛

    昨晚瑞幸为了自证咖啡里确实加了茅台,把流水线生产视频都放出来了。当我刷到大学调研时认识的和尚大哥,朋友圈定位归元禅寺,都开始晒“酱香茅台”的时候,我陷入了“酱香拿铁里到底有没有茅台”的沉思:这到底是“酒肉穿肠过佛祖心中留”的洒脱?还是“出家人不打诳语”的禅意?但是大哥说自己就不喝了,闻闻酒香就行。以

    2023年9月5日
  • 抖音和腾讯,不再跟钱过不去

    抖音和腾讯,不再跟钱过不去,同为内容平台,抖音与腾讯四处开战,这次停战的长视频版权可能是受到较多关注的领域,但在长视频之外,抖音和腾讯的连天炮火仍然没有停息之势。

    创投 2023年4月10日
  • 村民靠农业发家致富如今还有巨额分红 你猜一年领多少

    如今当农民真的好过当白领啊,近日南昌某村村民分红270万引发关注,村民变成股民,这里面到底有何玄机呢?村民靠农业发家致富如今还有巨额分红,简直令人羡慕不已。 村民分红 曾经很多人都…

  • 俞永福卸任,85后开始挑起阿里大梁

    掌舵阿里本地生活板块两年半后,48岁的俞永福退下来了。俞永福此前担任阿里本地生活集团董事长兼饿了么CEO,为整块业务的一号位。3月1日,阿里集团CEO吴泳铭发布内部信,宣布俞永福将于阿里本财年结束时(3月31日)卸任在本地生活集团的管理职务。本月底卸任后,俞永福将转向阿里eWTP科技生态基金,以投资

    2024年3月4日
  • 快递没有「最后一战」

    中国快递行业一直有个未解之谜:“最后一战”到底什么时候来?五年前,一场巨头围猎中小快递的价格战打响时,市场大多相信,快递的终局将诞生在四通一达+顺丰的“6进3”之间。但五年过去,价格战打了一轮又一轮,参赛选手换了一茬又一茬,景象越发热闹起来。上半年先是顺丰宣布出售丰网、又一次宣告进攻电商件无果;后有

    2023年9月11日 创投
  • 国产运动品牌能学「lululemon」的贵吗?

    问问大家:双11大家都买了啥?对此,我的美女同事表示完全没有购物欲望,她的购物清单是,健身房再续费一年。近几年,随着女性收入水平逐步上升,以及健身意识的提升,女性运动人群快速增长,成为运动健身的主力军。据统计,2022年,keep女性用户数量占比为60%。连锁健身机构乐刻发布的《当代女性健身洞察报告

    2023年11月8日
  • 追觅科技闪耀登场CES展,引领智能家电新趋势_行业动态

    1月9日,2024年国际消费类电子产品展览会(CES 2024)在美国内华达州拉斯维加斯正式启动。全球*的智能家电科技公司——追觅科技,携其全品类智能家电产品惊艳亮相,引发海内外媒体的高度关注。作为一家全球化智能家电科技公司,追觅科技凭借高速数字马达、智能算法及运动控制等三大核心技术创新优势,一直

    创投 2024年1月12日
  • 太湖湾科创城科创基金矩阵来了,规模超百亿

    投资界(ID:pedaily2012)消息,1月29日,太湖湾科创城正式发起设立总规模30亿元的太科城科技创新产业母基金,并分别组建相应行业方向子基金,打造超百亿规模太科城科创基金矩阵。太科城科技创新产业母基金发布母基金由无锡太湖湾科创城产业发展集团出资组建,按照“政府引导、市场运作、科学决策、防范

    2024年1月30日
  • 知识产权入园惠企,助力企业高质量发展_行业动态

    为提升企业知识产权保护及管理、知识产权成果转化方面的能力,推广及宣传知识产权质押融资政策,广州开发区产业服务有限公司积极组织“知识产权入园惠企,助力企业高质量发展”系列活动。2023年6月15日至8月15日,于广州开发区科技企业加速器、广州开发区总部经济区(广州科创金融服务基地)举办了3期入园惠企

    创投 2023年8月18日
  • 涨价,是大厂给共享单车亮出的一张「黄牌」

    涨价,是大厂给共享单车亮出的一张「黄牌」,共享单车涨价仍旧是长期趋势,毕竟平台已经做好了开源节流过苦日子的打算,共享单车也得跟上脚步,降本的刀不砍到用户身上,就会落在自己头上。

    创投 2023年6月12日
  • 什么是外国政府贷款 指一国政府向另一国政府提供的优惠贷款

    外国政府贷款是指一国政府向另一国政府提供的优惠贷款,为国家主权债务,其贷款对象一般是经济比较落后或缺乏资金的国家。它具有利率低、期限长、附加条件较多的特点。政府贷款的主要形式是混合…

    2022年1月25日
  • 精准对接招商不停,瑞谷云企持续组织政企实地考察交流_行业动态

    近期,瑞谷云企持续推动组织合作政府与各地企业开展了数十次线下实地考察交流,深入参观企业生产工厂和政府园区载体,就企业的投资计划、产业布局,政…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年4月20日
  • star vc投资了哪些项目?

      最近根据中国基金业协会披露,由任泉、黄晓明、李冰冰三人投资的明星私募star vc正面临三个棘手的问题,唯一高管无从业资格、注册办公地无法联系、没有备案产品。如果Star VC…

    2022年3月31日
  • 映辉医药完成数千万元A1轮融资,盛元智本投资

    投资界(ID:pedaily2012)3月11日消息,据动脉网报道,苏州映辉医药科技有限公司(简称”映辉医药”)成功完成数千万人民币的A1轮融资。本轮股权融资由盛元智本独家投资。融资资金将用于映辉医药的溶瘤病毒产品YH01的I期临床研究。苏州映辉是国内具有溶瘤病毒设计、构建、验证、工艺开发和大规模生

    2024年3月11日
  • 按揭的房子可以贷款吗 可以再抵押贷款

    按揭的房子可以贷款吗?据悉1、按揭的房子是可以贷款的,目前有多间银行是可以再抵押贷款的。随着银行审批房贷政策的进一步放宽,中信、农行等多家银行推出的“房抵贷”方式逐渐升温,高额度可…

    2022年1月25日