OpenAI坐不住,说明中国大模型路走通了

国产大模型在春节期间的一轮轮产品更新,终于让OpenAI坐不住了。北京时间2月1日,OpenAI加急上线了o3-mini新推理模型,且首次向ChatGPT免费用户开放。来自国产大模型的这波竞争压力,甚至重新让部分海外同行担忧起美国AI的竞争力问题。近期,前OpenAI高管、AI初创巨头Anthrop

国产大模型在春节期间的一轮轮产品更新,终于让OpenAI坐不住了。

北京时间2月1日,OpenAI加急上线了o3-mini新推理模型,且首次向ChatGPT免费用户开放。

OpenAI坐不住,说明中国大模型路走通了

来自国产大模型的这波竞争压力,甚至重新让部分海外同行担忧起美国AI的竞争力问题。

近期,前OpenAI高管、AI初创巨头Anthropic创始人达里奥·阿莫迪 (Dario Amodei),罕见发布了一篇万字长文。在肯定DeepSeek-R1模型在特定基准测试中已逼近美国*水平之外,阿莫迪认为DeepSeek的突破,更加印证了美国对华芯片出口管制政策的必要性和紧迫性。

而这轮国产AI力量中,在DeepSeek发布DeepSeek-R1模型的几乎同一时间,月之暗面也推出了Kimi k1.5新模型。

上述两款推理模型,均全面对标OpenAI o1完整版。其中,Kimi k1.5凭借同时支持文本和视觉推理的特性,成为*可以比肩o1完整版水平的多模态模型。

尽管OpenAI展现了下一阶段大模型的技术演进路线,但直到DeepSeek-R1和Kimi k1.5发布之前,国内一众大模型厂商均尚未推出能够对标OpenAI o1完整版的模型。它们的出现,成了国产大模型攻破OpenAI技术黑匣子的又一次实力展示。

更重要的是,相比OpenAI o1模型付费使用的限制,无论DeepSeek-R1,还是Kimi k1.5,都支持用户免费无限调用。

堪比OpenAI o1完整版的模型性能,加上免费调用的差异化竞争优势,DeepSeek-R1和Kimi k1.5新模型,成了春节期间国内大模型对OpenAI发起突然袭击的两把尖刀。

借助春节舞台,完成某种后来居上式的战略调整,已演变为中国科技公司的保留节目。

2014年春节前夕,微信首度推出红包功能,未能掀起太多水花。转折发生在2015年,借助与春晚合作,斥资5亿元推出“摇一摇”红包的微信,在除夕当天使得微信红包收发总量超10亿次,并在2天内完成了支付宝此前花费10年完成的工作——2亿张银行卡绑定。

微信红包的此番逆袭,后来被马云在阿里内部称为是对支付宝的一场“偷袭珍珠港”,并促使阿里在2016也开始重金赞助春晚,通过“集五福”的形式大撒红包。

现在,被DeepSeek-R1和Kimi k1.5新模型突袭过后的OpenAI,也不得不调整了自己的新品发布节奏。

在国产大模型的快速技术迭代和模型性能追赶压力之下,即便是OpenAI,恐怕也受不了几次这样的突袭了。“我们会开发出更好的模型,但我们不会像往年那样保持那么大的*优势了。”OpenAI CEO奥特曼在o3-mini发布后的问答环节中说道。

01

DeepSeek-R1和Kimi k1.5新模型一经发布,便在海外用户群中引发热议。

英伟达AI科学家Jim Fan*时间发帖总结两大模型的相似之处,认为两者都简化了强化学习框架,同时提升了推理性能和效率,并评价两家公司所发表的技术论文,都堪称“重磅”级别。

OpenAI坐不住,说明中国大模型路走通了

伯克利人工智能博士,Huggingface机器学习科学家Nathan Lambert、科技大V AK等也纷纷试用kimi,还有不少业内人士对这两款来自中国的产品进行了测评。

OpenAI坐不住,说明中国大模型路走通了

与DeepSeek-R1一样,Kimi k1.5新模型同样展现出了详细的思考过程。

北京时间1月31日,苹果发布了新一季度财报,以此为契机,选中Kimi k1.5推理模型,输入提示词“写一篇苹果财报分析稿,其中尤其要关注中国市场的变化,以及苹果AI何时在国产iPhone中上线的情况”。

经过一段时间思考,Kimi给出了苹果2025财年*财季的业绩报告数据,并特意指出其中大中华区营收为185.13亿美元,同比下降11%。

除了给出联网参考的94个网页信息之外,Kimi还列出了自己的详细思考过程。

OpenAI坐不住,说明中国大模型路走通了

如果将大模型看作一个数学家,没有加入推理功能之前,大模型在证明了一个新的定理,或者解了一道新的数学题时,只会把答案写出来,不会把思考的过程写出来。但是,有了推理功能的加入,现在大模型就可以把原本只存在于数学家个人头脑中的思考过程,给尽可能完整呈现出来。

Kimi k1.5推理模型的思考过程,颇有点“授人以鱼不如授人以渔”的作用,将其用来指导学生学习,或者辅助程序员编写代码等,都有了更强的实际用途,大模型从有用,逐渐变得真正好用起来。

更重要的是,相比DeepSeek-R1,Kimi k1.5还是OpenAI之外*实现o1完整版水平的多模态模型。

在Kimi k1.5推理模式下,上传一张苹果最新一季财报的数据图表,并给出提示词“给出图中大中华区的营收情况,以及同比变化,并分析大中华区营收占比”。

Kimi不仅读懂了图片中的营收数字,还通过列出数学公式的方式,准确算出了大中华的营收同比下降了11%,且营收占比也从去年同期的17%,下降至今年的15%。

OpenAI坐不住,说明中国大模型路走通了

杨植麟曾在一次采访中解释道,长文本就是某种意义上的长推理,“如果我们想让AI从完成一两分钟的任务变成完成长周期的任务,那必然要在一个很长的context(上下文)里,才有可能真正把AI进一步往下推进。”

加入图片识别等多模态功能,在某种程度上也可以看作是对长文本准确率的一种提升,这种提升,未来还可能随着无损压缩视频多模态的融入,变得更加强大。

02

对人才的重视和培养,成为DeepSeek和月之暗面能够率先做出对标OpenAI最新模型o1的共性之一。

在DeepSeek目前约150人左右的团队中,大多是一帮Top高校的应届毕业生、没毕业的博四、博五实习生,以及一些毕业才几年的年轻人。

从2023年初成立至今,月之暗面更是长期被视为中国大模型创业公司中,技术人才密度最高的玩家之一。

在Kimi k1.5中,月之暗面团队找到了一种提升推理效率的原创技术,即Long2Short高效思维链。

在o1模型中,OpenAI一般依赖于逻辑链条(Chain-of-Thought,CoT)来逐步推导出解决方案,这是一种用时间换取精准答案的方法。

月之暗面团队开发的long2short技术途径,把长思维链(复杂的推理过程)的推理结果“教给”短思维链(简单高效的推理过程),两者进行合并,最后针对“短模型”进行强化学习微调,从而达到提升token利用率以及训练效率的目的。

在Short CoT(短文本)模式下,Kimi k1.5的能力同样大幅*GPT-4o和Claude 3.5,*幅度高达550%。

OpenAI坐不住,说明中国大模型路走通了

良好的产品使用体验正在给Kimi带来用户量的增长。根据SimilarWeb 2024年12月的数据,Kimi在web端排名全球前五,仅次于ChatGPT、Google Gemini、Claude和Microsoft Copilot。

03

在DeepSeek和Kimi们的突袭之下,来自OpenAI等对手的一轮新竞争,已经在赶来的路上。

奥特曼预告中的OpenAI 新模型o3-mini紧急上线,甚至新一代高级语音模型也发布在即,为了在追求AGI道路上走得更快,奥特曼更是联手软银孙正义,搞起了5000亿美元的算力开发大计划。

可以预见,追赶的压力,或许很快便会再次来到国产AI们的头上。

但通过DeepSeek-R1和Kimi k1.5新模型的这番突袭,一个值得关注的新变动是,国产大模型正在向外界越来越多地证明其自主创新能力,甚至不排除有一天完成对OpenAI的真正超越。

近期,Meta首席AI科学家杨立昆(Yann LeCun)在达沃斯“技术辩论”会议上再次提醒道,“我认为当前LLM(大语言模型)范式的生命周期相当短,可能只有三到五年。五年内,任何清醒的人都不会再使用它们了,至少不会作为AI系统的核心组成部分……我们将看到一种新的AI架构范式的出现,它可能不会有当前AI系统的那些局限性。”

对于任何立志于实现AGI的大模型玩家而言,追赶OpenAI都绝不是公司成立的初衷和目标,OpenAI与国产大模型之间的差距,正在逐渐缩小已是不争的客观现实。

斯坦福大学计算机科学系客座教授、谷歌大脑联合创始人吴恩达(Andrew Ng)近期发文指出,DeepSeek的讨论让许多人认识到一些显而易见的重要趋势,其中之一便是中国在生成式AI领域正赶超美国。

OpenAI坐不住,说明中国大模型路走通了

2022年11月ChatGPT刚刚推出之际,美国在生成式AI领域远远*中国,这一*差距被业内认为在2-3年之间。但经过两年发展,OpenAI对国产大模型的*优势已经被收缩到6个月。

通过Kimi、DeepSeek等模型的持续突破,“中国企业展现出强大的创新能力,在视频生成等特定领域甚至已经实现了局部*。”吴恩达点评道。

国产大模型在技术上的快速迭代能力,甚至引得奥特曼在o3-mini的问答环节中,也不得不正视道,OpenAI的*优势不会再像往年那么大了。

归根结底,大模型所蕴藏的无限技术创新空间,为国产大模型玩家们,在打造产品差异化方面提供着无限机遇。

更广阔的AI创新前景,也将孕育出更多国产大模型的奇袭时刻。

(0)
小多多的头像小多多创始人

相关推荐

  • 单日跌了200亿,宁德时代不香了?

    7月26日晚,宁德时代发布了2024年中报。综合来看,宁德时代上半年实现营业收入1667.67亿元,同比下降11.88%,实现归母扣非净利润200.54亿元,同比增长14.25%。尽管净利润依然维持稳健增长,但资本市场似乎并不买账,7月29日开盘后宁德时代股价一度急跌近5%,最终以下跌2.55%收盘

    2024年7月30日 创投
  • 4S店时代还剩最后一道光亮

    2023年,中国汽车销量突破3000万辆,创下历史新高,汽车产销连续15年保持全球*。硬币的另一面,却是汽车经销商在生死边缘挣扎,半数以上的4S店亏损,倒闭、暴雷、跑路的新闻不绝于耳。一边是海水,一边是火焰。奋斗在汽车产业最前线的经销商,不仅没有跟随行业大势走向繁荣,反而陷入前所未有的泥沼冰窟,这着

    2024年2月22日 创投
  • 华安宏利天天基金怎么样(华安宏利基金净值)

    华安宏利混合型证券投资基金(简称:华安宏利混合,代码040005)03月05日净值上涨2.92%,引起投资者关注。当前基金单位净值为5.4194元,累计净值为6.0394元。 华安…

  • 朱啸虎喊了一句话

    伴随DeepSeek掀起全球风暴,一群年轻的中国创业者走向台前。一夜之间,华尔街集体唱多中国资产。一篇名为《China eats the world》的研报更是广为流传。报告强调,低估中国的时代即将结束,2025年是中国全面超越的“斯普特尼克时刻”。这段时间,港股连续上涨,恒生指数收复22000点大

    2025年2月17日
  • 企业年金每月交200退休拿多少 其实还取决于基金的收益

    作为一个非常受大家关注的话题养老问题一直就是一个热点,那么不少人都聊过的职业年金是什么?如果每个月交200的话退休能拿多少钱呢?接下来的文章里就跟大家简单的聊聊大家都关心的话题! …

    创投 2022年1月25日
  • 艾科达完成数千万元A+轮融资,山东新动能基金领投

    投资界(ID:pedaily2012)9月1日消息,山东艾科达生物科技有限公司(以下简称“艾科达生物”)顺利完成数千万元A+轮融资。本轮融资由山东新动能基金领投,这是继毅达资本和中信医疗基金共同投资,艾科达生物完成A轮融资后快速完成的新一轮融资。本轮融资主要用于扩大产能、研发科技创新、新产品开发等。

    2023年9月1日
  • 跨国药企大变局

    从时间上来看,跨国药企已进驻国内市场三十余年,但严格意义上来说,关于如何拥抱中国市场,它们处于探索阶段。2023年,跨国药企调整的*传闻,从最懂中国市场的阿斯利康开始。今年6月份,据《英国金融时报》报道,阿斯利康做出了一个新决定:阿斯利康已拟定计划,将剥离其中国业务,在香港或上海单独上市。事后来看,

    2023年12月25日
  • 如风般去旅行,北欧三国联合马蜂窝发起可持续旅行推广计划_行业动态

    以可持续的方式探索世界,正在成为年轻人的旅行新潮流——据《2023年可持续旅行报告》显示,有89%的中国旅行者表示会在未来一年里选择更为低碳、环保的旅行方式,在追逐远方的同时,守护永续之美。为顺应“绿色可持续”的发展趋势,保护和延续旅游目的地的自然资源及人文风貌,9月21日,丹麦国家旅游局、芬兰国

    创投 2023年9月22日
  • 海立集团BI项目正式启动ABeam中国助力实现以数据之力驱动经营管理_行业动态

    9月2日,由德硕管理咨询(上海)有限公司作为实施合作伙伴的海立集团BI项目正式启动,海立集团党委书记、总经理缪骏、ABeam大中华区董事长兼总经理中野洋辅出席了项目的启动仪式。BI(Business Intelligence)暨商务智能,是指通过搜集和整合分布在海立各个系统中的海量业务数据,结合企

    2024年9月12日
  • 半导体公司,谁最挣钱?

    在当今高度数字化和智能化的时代,半导体作为信息技术的基石,其重要性不言而喻。半导体产业涵盖了从原材料供应、设计、制造到封装测试等多个环节,构成了一个复杂而精密的价值链。01芯片设计,占半壁江山根据Nuvama数据显示,在半导体整个价值链中,芯片设计占到了50%,晶圆制造占到了36%,封装和材料分别占

    2024年7月4日 创投
  • 穿越周期,勇立潮头!吾尚食品全渠道增长年会胜利召开!_行业动态

    “2023年,我们为活下来而努力奋斗着,实现了在量贩零食渠道突破爆量,逆势增长。未来,吾辈尚新立潮头,吾尚将持续引领中国乳酸菌行业向上发展!”——杭州吾尚实业有限公司、杭州吾尚食品有限公司董事长 倪永康2023年12月1日,“吾辈尚新立潮头”——中国乳酸菌饮品向上盛典暨吾尚食品全渠道增长年会在南京

    2023年12月4日 创投
  • 中国食品2023年净利润13.86亿元:盈利能力提升加快培育新质生产力_行业动态

    3月19日,中国食品(HK:00506)如期发布了2023年业绩报告。在成本控制和供应链整合方面的*表现,推动了中国食品业绩的稳健增长,并促使利润持续向好。报告期内,公司销售收入达到了214.46亿元(单位:人民币,下同),相较于去年同期增长2.3%,经调整EBIT与EBITDA分别同比增长10.

    2024年3月19日 创投
  • 80后复旦女学霸,接管超7000家咖啡店

    星巴克中国业绩下滑之时,刘文娟的职位则如火箭发射般上升。今年9月30日起,刘文娟将正式接任星巴克中国CEO一职,这距离她2023年升任联席CEO仅过去了一年;实际上,2021年,她才刚刚晋升为星巴克中国首席运营官(COO)。这也是星巴克中国3年间的第四次高层变动。2021年8月,王静瑛卸任CEO,交

    2024年9月27日
  • 英特尔被低估了吗?

    安迪·格鲁夫在《只有偏执狂才能生存》中写道[1]:战略转折点的“点”字是误用。它不是一个点,而是漫长的、艰辛的奋斗。这句话的背景是80年代,英特尔的DRAM业务在日本人的狂轰滥炸中节节败退,格鲁夫和戈登·摩尔主导了公司向微处理器的转型。格鲁夫是英特尔历史上多位传奇CEO之一,发明过一个“10倍速变化

    创投 2023年9月21日
  • 电影票房计算按多少天 每一部影片还都不一样

    很多的读者朋友对于电影之类的都是非常喜爱的,平时大家也都能看到类似哪个哪个电影票房又达到了多少的新闻,那么这些票房都是如何统计出来的呢?一般一部电影的话票房都统计多少天?接下来的内…

    创投 2022年1月25日