学校进军大模型,旧赛道玩出新花样

大模型热度持续提升,不仅企业推出数十个大模型,数据猿注意到多个高校也在陆续推出大模型。那么,高校研发大模型的出发点是什么呢,他们的做法跟企业又有什么不一样?本篇文章致力于搞清楚这个问题。01 大模型的竞赛,高校是一个重量级选手在中国市场,企业界目前已经推出了上百个大模型产品。然而,在这场竞赛中,有一

大模型热度持续提升,不仅企业推出数十个大模型,数据猿注意到多个高校也在陆续推出大模型。那么,高校研发大模型的出发点是什么呢,他们的做法跟企业又有什么不一样?本篇文章致力于搞清楚这个问题。

01 大模型的竞赛,高校是一个重量级选手

在中国市场,企业界目前已经推出了上百个大模型产品。然而,在这场竞赛中,有一个别样的参赛选手容易被忽视——高等院校。

事实上,中国已经有多个学校陆续推出了自己的大模型。北京交通大学与中国计算机学会智慧交通分会以及足智多模公司合作,发布并开源了国内*综合交通领域的大型模型,命名为TransGPT·致远。这一模型的推出为智能交通领域的研究和应用提供了有力支持。

北京大学推出了ChatLaw大模型,哈尔滨工业大学发布了“本草”大模型,复旦大学的“moss”大模型也在研究领域取得了突出成就。清华大学的“chatglm-6B”大模型、上海交通大学研发的“兆言”大模型以及东北大学的“TechGPT”等等,都是国内大学在大型模型研究方面的杰出代表。

这些国内大学的大型模型不仅在自然语言处理领域有重要应用,还为各个领域的研究和实践提供了有力工具。它们的开源和分享精神也有助于促进科学界和工业界的合作,推动了中国在大型模型研究领域的发展。

以下是对国内高校大模型进展的不完全统计:

学校进军大模型,旧赛道玩出新花样

近日,来自苏州大学的一个研发团队最近发布了一款名为OpenBA的开源seq2seq模型。OpenBA是一款具有150亿参数的双语非对称seq2seq模型,也是中国开源模型社区迎来的*大型语言模型变体。根据相关论文的介绍,研究人员采用了高效的技术,并采用了三阶段的训练策略,从零开始构建了OpenBA模型。

OpenBA模型的亮点有以下几点:

1、该模型为中文开源社区贡献了一个有代表性的编码器解码器大型语言模型。而且,该模型的训练过程,包括数据的收集与清洗、模型的构建与训练,都已完全开源,使其能够广泛地被研究和应用。

2、数据方面,OpenBA模型所使用的数据均是公开可获取的,这一特点增强了模型的透明度和可用性。

3、为了提升模型对中文指令的理解能力,研究团队基于开源的标注数据构建了大规模的中文Flan数据集,并完全开放了数据集的构建方法。

4、令人印象深刻的是,尽管OpenBA模型仅使用了380亿个标记的训练数据,但在多个中英文下游任务上表现出色,超越了许多参数量更大、数据量更多的模型。

02 同样的赛道,不一样的玩法

同样是做大模型,高校与企业相比,有什么不一样呢?

通过综合对比,我们发现,高校研发大模型技术产品,跟企业相比,在以下几个方面存在明显的区别:

1、目的不同,高校是为了出学术成果,而不是商业成果。

高校的研究主要追求学术探究,他们致力于探索大模型的理论基础、算法优化以及应用拓展,旨在推动学科发展。研究者追求的是发表高水平论文,提高学术声望,为学术界贡献新知。

相比之下,企业的目标是商业化应用,他们关注的是如何将大模型技术转化为具体的产品和服务,实现商业价值和盈利。

因此,在研发的深度上,高校可能更侧重于技术的原理和探讨,而企业更关心技术的实际应用和商业可行性。

这种目的的差异也影响着研究者的动力和方法,高校研究者通常追求创新和突破,他们可能会更加开放地探索各种可能性,包括不太成熟的或者风险较高的方向。

而企业研发团队则需要更加务实,他们要考虑市场需求、竞争态势,更倾向于在已有基础上进行改进和优化,以确保产品的可靠性和市场竞争力。

2、高校的理论研发能力强,但产品化能力弱。

很多高校拥有世界级的*科学家和研究团队,他们在前沿理论探索方面具备*的能力。这使得高校能够在大模型的算法设计、深度学习理论等方面取得*地位,甚至在某些领域超越企业界。然而,尽管拥有强大的研发能力,高校在产品化方面的能力相对较弱。

由于缺乏工程化和产品化的经验,高校团队开发的大模型往往难以直接转化为商业产品。产品化需要考虑诸多因素,包括稳定性、性能优化、用户友好性等,这些要求对工程团队的技能和经验提出了更高的要求,而这是高校研究团队所缺乏的。

3、资金实力较弱,算力不足,模型规模较小。

高校在大模型研发中普遍面临着资金实力较弱、算力不足的挑战,这限制了他们在模型规模上的发展。相较之下,企业通常拥有更充足的财力,能够投入大量资源进行研发,尤其是在高昂的算力需求方面。

大模型的训练需要庞大的数据集和超级计算机集群,这往往需要花费数以千万计的美元。然而,高校的研究预算相对有限,难以承担这样的高昂成本。

这种资金和算力的短缺使得高校往往只能开展规模较小的大模型研究,他们可能会聚焦于百亿参数规模以内的模型,而千亿参数规模以上的大模型则较为困难。这种限制影响了高校在大模型研究领域的深入探索,因为更大参数规模的模型往往能够更好地捕捉数据的复杂关系,具备更强的泛化能力。

4、高校的大模型产品具有浓厚的实验性质,后期持续迭代不足。

大模型的研发不是一次性任务,而是需要不断迭代和升级,以适应不断变化的需求和挑战。然而,由于高校研究项目通常以发表学术论文为主要目标,一旦论文发表,后期持续迭代模型的动力和资源支持就显得不足。这导致了许多高校推出的大模型往往只是昙花一现,缺乏持久的影响力和实际应用。

03 高校*的价值,在于其是理论探索的先锋队

既然高校有这么多缺陷,但为什么还要凑这个热闹呢?高校研发大模型到底有什么价值呢?难道就是为了研发团队发几篇论文?

在数据猿看来,虽然高校有多种缺陷,但在推进大模型发展方面,有其独特的价值。

首先,在大模型前沿理论探索方面,高校具有不可替代的重要地位。

大模型技术的发展正处于快速探索和创新的阶段,其中充满了未解之谜。例如,大模型的“幻觉”——模型在没有真实理解情况下“假装”理解的问题,这是一个需要深入探讨的理论难题;多模态融合则涉及将来自不同传感器或源头的数据进行融合,需要开发新的理论和算法以更好地处理这种复杂信息,这些理论难题都需要高校的前沿探索。

大模型的伦理安全研究也是一个备受关注的领域,高校可以通过深入的伦理研究,探讨大模型的应用边界、道德责任和社会影响,为未来的技术发展提供指导。

在前沿理论、技术探索方面,与企业相比,高校通常拥有丰富的学科背景和跨学科研究资源。大模型技术的发展不仅仅依赖于计算机科学,还需要涉及心理学、认知科学、生物学等多个领域的知识。高校研究者可以自由穿梭于不同学科领域,推动多领域知识的融合,为大模型的发展提供跨学科的理论支持。这种综合性的研究视角有助于拓展大模型技术的应用领域,推动科技的交叉创新。

此外,高校在学术研究中更容易进行高风险高回报的研究。大模型技术的发展充满了不确定性和挑战,探索新的理论和方法可能会面临失败的风险。而高校由于其学术性质,通常具有较高的学术自由度,可以承担更多的风险,去尝试那些可能具有革命性意义的理论突破,这种高风险的探索为大模型技术的未来发展带来了更多的创新可能性。

需要注意的是,高校与企业并不是完全割裂的,而是可以紧密合作。事实上,不少企业就在与高校联手进行大模型技术研发。而且,企业与高校在人才方面是相通的,经常有人才流动。比如,高校为企业源源不断的输送人才,是企业研发的重要后备力量。另一方面,企业高级人才也可能回到高校做研发、任教。这样的双向人才流动,将大大促进人才市场的活跃,而这是大模型理论和技术发展不可或缺的催化剂。

企业推出的大模型产品,往往具有排他性,甚至会申请专利保护。而高校的技术成果则具备更多的公共资源属性,一般会将成果向社会开放。一些小型团队,可以在高校研究成果的基础上,进一步产品化、商业化,这降低了他们创业的门槛。以美国硅谷的成功经验来看,高校的研究成果往往是创业团队的发源地。在高校实验室中,有一些隐藏的“金矿”,等待创业团队去挖掘。

(0)
小多多的头像小多多创始人

相关推荐

  • 清华系大模型公司「生数科技」完成新一轮数亿元融资,启明创投领投

    投资界(ID:pedaily2012)3月12日消息,生数科技完成新一轮数亿元融资。由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投,华兴资本担任独家财务顾问。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品创新及市场拓展。生数科技成立于2023年3月,是全球

    2024年3月12日
  • 建设银行信用卡进度查询 至建设银行的营业网点查询

    建设银行信用卡进度查询?据悉如果想要查询建设银行信用卡的申请进度,可凭本人身份证原件至建设银行的营业网点查询,或者登录建设银行的信用卡网站进行查询。 1.建设银行信用卡申请进度网上…

    2022年1月25日
  • 陆家嘴国泰人寿泰享福2.0:让居家养老更便捷_行业动态

    随着我国人口老龄化的日益加剧,居家养老成了一个亟待解决的社会问题。传统的养老方式已经无法满足现代社会快速变化的需求,特别是在信息化、智能化的大背景下,如何创新服务体系来破解居家养老难题,已经成为一个热门话题。陆家嘴国泰人寿秉持“以客为尊”的服务理念,推出泰享福2.0服务,其中涵盖多项服务内容。针对

    2023年12月26日
  • 矛头直指英伟达,史上最强芯片战来了

    半导体产业,从来不缺故事。1993年,当韩国人倾尽全力,想要打败日本半导体产业霸主地位时,美国密苏里州,一对年轻的夫妇,给自己8岁大的儿子,买了一台苹果电脑。30年后,这个小男孩发起一个7万亿美元的芯片计划,震惊了世界。芯片新战7万亿美元,是什么概念?它比整个芯片产业历史上所有投资加起来,还要多一个

    2024年2月29日
  • 「这年头,谁出门还请导游啊?」

    自打有了独立出行的经济能力,“导游”就是我*个PASS掉的旅游产品。毕竟谁也不想总被赶羊式地赶过景点,出门一趟,除了几张剪刀手照片,只能塞回来一肚子流水线生产的稗官野史。然而最近,“导游”再次回到了我的出行筹备清单,并且占据了重要位置,因为一种“导游仙人”出现了:他们很贵,但贵得值回票价。01 “吃

    创投 2023年9月21日
  • 巨轮转向:恒瑞医药的2023

    巨轮转向:恒瑞医药的2023,投资者根本不需要关心谁是所谓的创新药“一哥”,也不需要期待SHR-A1811的进展,我们关心的只有一个,那就是恒瑞医药能不能放弃“传统思维”,拥抱未来。恒瑞医药这艘巨轮的航迹已经改变,希望管理层的战略转向还来得及。

    2023年4月24日
  • 番茄想跳出「字节宿命」

    在大文娱的赛道上,字节跳动放弃了游戏,但选择在影视领域更进一步。11月22日,番茄小说IP衍生负责人戴一波发布了“和光计划”。用番茄小说的官方表述来说,和光计划就是平台、网文作者、影视制作公司合力为创作打一束光,让优秀作品站到聚光灯下。为此,番茄小说将通过开设创作培训、设立创作赛事、提供流量扶持等一

    2023年11月30日
  • 香港600亿基金公开招人

    香港600亿基金公开招人,作为港府的开创性尝试,香港投资管理有限公司一直备受关注。此次公开招聘,意味着这个超级投资平台正在落地。

    创投 2023年8月6日
  • 奇瑞捷豹路虎揽胜极光L引领英伦出行新风尚_行业动态

    有人说,世界上只有两种豪车,一种是奇瑞捷豹路虎,另一种是其他。现如今,伴随着奇瑞捷豹路虎揽胜·极光L的震撼上市,奇瑞捷豹路虎又进一步巩固了它…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    2023年5月19日 创投
  • VC悄悄杀入服装赛道,红杉、高瓴、GGV密集入局,连B站也来了

    来源:东四十条资本(ID:DsstCapital) 作者:曹玮钰 传统行业,还会有大的新机会吗?比如服装。 服装行业历来不算个“性感”赛道,加之近几年增长趋缓,服装已成“夕阳行业”…

    创投 2021年10月25日
  • 土豆面包被爆炒,消费者排队抢购

    一款外形酷似土豆的面包,彻底火了。在各大社交媒体上引来网友们的关注,一度冲上了热搜,在线下超市更是引起了抢购,刮起了一阵“挖土豆”旋风。面包土豆价格直接被炒高了十倍,原本仅售不到20元,如今价格被代购炒到80元,甚至还有代购者加价至10倍。01 土豆面包遭抢购,价格暴涨这款土豆面包是款普通面包,由大

    创投 2023年10月20日
  • 中国车企的「诺曼底时刻」

    中国车企的「诺曼底时刻」,过去,中国一直被看作是市场换技术,但现在中国车企已成为技术输出方,成为大众的「师傅」。

    创投 2023年7月27日
  • 请给中国创新药一点时间

    暴涨是被压抑的狂欢,回落是冲动后的冷静。因为一纸文件,压抑近三年的创新药板块全线爆发,但随着BIO(美国生物技术创新组织)剔除药明康德消息的传出,疯狂看多的资金逐渐出现了分歧。这不禁让长期关注医药产业的投资者黯然神伤,难道一切只是一个“故事”?答案当然是否定的!割裂的市场走势,实则暗喻着整个中国医药

    2024年3月15日
  • 辛巴再怼东方甄选,图啥?

    “还搁这教课呢,你们做个人行吗?光明磊落一点不好么?”不怕惹事的辛巴,又双叒叕站上了舆论风口。这一次,辛巴再度将矛头对准了自己的老对手——东方甄选。除了重提“谷贱伤农”事件,辛巴还质疑东方甄选卖烤肠的利润高达70%,并质问野生大虾后续的处理进展。值得一提的是,“假燕窝”事件后辛巴曾硬刚抖音及其平台主

    2023年9月7日
  • 今年最火的医疗赛道来自这里

    现时此刻的中国医疗创新行业,比过往任何时候都期待一个确定性。一方面,2023年急转直下的融资环境,让不少企业遭遇巨大挑战,砍管线、卖厂房、大裁员事件频现,给整个行业蒙上了一层阴翳。另一方面,医疗创新行业又似乎站上了一个崭新的时代交界口——不断汹涌的出海潮、BD潮、并购潮正在显露——但如何理解它们,入

    2024年3月5日 创投