医院需要怎样的大语言模型?

ChatGPT的出现重构了人们对于AI的想象。一时间内,做模型的,做应用的,一拥而出。适才三个季度,市面上垂直于医疗的大语言模型,数量已经达到两位数。不过,医疗异于其他产业。回顾过往医疗科技的发展足迹,一项新兴技术能否规模化地应用于医疗机构,不在于市场参与者的数量,而在于随技术而生的产品,能否真正与

ChatGPT的出现重构了人们对于AI的想象。一时间内,做模型的,做应用的,一拥而出。适才三个季度,市面上垂直于医疗的大语言模型,数量已经达到两位数。

不过,医疗异于其他产业。回顾过往医疗科技的发展足迹,一项新兴技术能否规模化地应用于医疗机构,不在于市场参与者的数量,而在于随技术而生的产品,能否真正与医生的工作融为一体。

问题便在于此。

对于大模型而言,什么是医院的真实需求?怎样才能满足医院的真实需求?

1、大模型之于医疗的意义是什么?

具备商业化潜力的AI通常具备两个特征:一是高频,二是提效。

所谓高频,是指医疗大模型在各个场景中被频繁应用。在卫宁健康总裁王涛看来:在医疗领域,基于生成式AI而衍生出的医疗应用或将成为医务工作者离不开的贴身助手,它将作为一个超级大脑而存在,不仅能高效地调度和整理数据资源,甚至能引发自主思考,提升医务工作者的工作效率、医疗质量,并做到有效的辅助决策。

其次是提效,即为算法的购置方带来实打实的收益。一个理想的医疗大模型应该能够实时质控医院各个医疗流程;以最小成本满足政策对医院提出的IT需求,进而为医院的发展运营带来新的可能性。

医院之中符合此类特征的场景非常多。举两个例子,医患沟通、病历书写都是AI应用的经典需求。

先谈医患沟通。不同于其他第三产业,医生与患者之间的“交点”非常频繁,贯穿整个诊疗流程。但由于医患信息的不对称性,大量无效交流穿插其中。

对于本已供不应求的服务提供方医护人员而言,大量碎片化、重复的交流贯穿工作之中,不仅源源不断地产生压力,亦挤压了诊疗与科研时间。对于患者而言,部分医护人员因压力所迫,无法进行详尽的交流,在不同程度上会影响就医体验,甚至可能成为引燃医患矛盾的导火线。

再谈病历书写。在前不久召开的一场医疗IT大会中,多位院长、卫健委领导都积极谈论了大模型及其相关技术的未来:能不能使用大模型来辅助质控流程?能不能使用生成式AI来自动书写病历?他们认为,在医生的日常工作中,病历的理解与书写是一个极为重复耗时的过程,只有将医生从这些繁琐的工作中抽离,才能帮助其实现更大的价值。

因此,大模型之于医院的意义,在于找到医院场景中的高频环节,辅助医护人员高效完成高重复度的工作,进而发挥医护人员的比较优势,助其专注于诊疗与科研,进而推动医院整体能力的良性发展。

但也有人会问:如此陈旧的需求,自然语言处理(NLP)不是早已能够解决吗?可以,但又并非完全可以。

2、大模型强在哪里?

90年代初,技术人员便开始尝试用IT手段辅助医生诊疗,降低医生的工作强度。但那时的成果“专家系统”存在缺陷,仅以简单的数据映射或简单算法难以应对并不复杂的医学问题。

毕竟,医学诊断讲究“望闻问切”,需要医者通过多感官多渠道的信息获取,检验检查等多种辅助手段,加之医学知识和逻辑的综合判断,才能进行有效诊断。只是通过患者简单的主诉,而不能将患者年龄、身体状况、既往病史等进行综合判断,这样的“诊断”不过是碰碰运气。

因此,“专家系统”并未真正从理论走到实践。直到二十一世纪的第二个十年,传统基于规则或统计方法的NLP的出现,才重新唤起了人们对于智能技术的憧憬。近几年来,基于NLP的病案质控、CDSS等系统已普遍应用于管理、临床。

不过,这类NLP也有其局限性。

“尽管早先基于规则或统计方法的NLP技术强化了人工智能的分析能力,但它没有脱离通过‘输入信息-关联数据库-搜索结论’的逻辑。”卫宁健康CTO赵大平在采访中表示,“这种推理的方式只考虑了‘上文’,忽视了‘下文’。相比之下,医生的推导过程不仅会囊括各类报告给到的数据,还会根据过往经验推断数据之外的可能。”

严格意义上说,大模型同样是NLP 的一种形式,但相比较基于规则或统计方法的NLP,知识数据驱动的大模型更具备了自我进化的能力。

具体而言,进化能力的本质来自训练神经网络时采用的随机梯度下降算法,这种算法让程序沿着一定方向一代又一代地随机摸索,一定程度上等效于物种的基因突变。

强大的生存压力下,错误的摸索被淘汰,而正确摸索被积累,久而久之,某些高阶的功能就这么涌现出来了。这些涌现出来的高阶能力不仅能够自动提取重要信息,理解和生成信息;也可融合模型内的知识补全不完备的信息,形成完整的推理。

这样的能力在医疗场景之中尤其珍贵。譬如在辅助医生解读医学影像这一场景中,基于大模型的人工智能不单单是基于给定的影像信息进行辅助诊断,还能通过过往学习结合知识处理影像之中的瑕疵,以更快的速度给出更为精准的辅助诊断结果。

此外,LLM的沟通能力在ChatGPT中的应用也为世界所见证。迁移至垂直领域后,经过预训练和微调的模型能够有效用于医患交流,优化智能导诊、智能问诊、智能随访等应用。而对于更为复杂的病历书写,它能帮助AI脱离模板,像一个真正的资深医生一样理解、生成电子病历。

3、医疗大模型落地,最难的挑战在哪里?

颠覆式的潜力之下,大量互联网企业、头部医疗IT公司涌入大模型赛道。但要使得大模型触及临床,模型训练已经何其艰难,模型落地还要再添挑战。

在理解大模型落地之难前,我们不妨先看看英国文学家艾略特提出的DIKW知识模型。简单来说,该模型将广义上的知识分为 Data(数据) – Information(信息) – Knowledge(知识) – Wisdom(智慧) 四层金字塔结构。

医院需要怎样的大语言模型?

DIKW知识模型与如今的人工智能

传统的逻辑下,我们将数据不断提纯,升维成知识甚至智慧,进而作为应用的基础。而在人工智能时代,我们着重对第二层的信息流进行处理,一方面去粗取精,升维取得知识,构建智能化的基础;另一方面标准化处理,降维得到数据,形成数字化的基础。拥有知识、数据后,再辅以算法与算力支持,一个大模型就完成了。

王涛在采访中对两种模式进行了对比,他认为:从完全的升维到大模型时代的一升一降,其实质是思考逻辑的转变。将这种变化其置于医疗系统之中,便是要将“技术支持应用”的系统架构改写为“技术应用并行”。

因此,大模型的落地,亟须解决的是医疗信息系统对于大模型的兼容问题。

目前能够提供“技术应用并行”式医院信息管理系统的医疗IT企业不多,仅头部数家企业在深度学习大热之时便看到系统架构变更的必要性,打造了能够保障AI*运行的医疗管理系统。

以卫宁健康为例,其新一代医疗管理信息系统WiNEX在设计之初便已经考虑到了对“智能化”(Intelligence)的架构支撑,其内涵的EA+AI智能架构保证了在每一层中都能支持AI的运行。

医院需要怎样的大语言模型?

卫宁健康EA+AI智能架构

WiNEX的创新架构非常适合大数据在院内场景下的迭代。为保障大模型在应用过程中的流畅性与在学习过程的持续性,只考虑在信息化流程中数据记录远远不够,还需要考虑数据计算的架构,需要业务流程与技术流程随时互动。因此,相较于传统EA企业架构,EA+AI智能架构的根本变化是对业务和技术进行了重构,将基于GPU计算的架构和CPU架构并行,使其共同支撑业务,筑起了大模型系统环境的基底。

有了智能化的架构作为支撑,卫宁健康在开发大语言模型时便得心应手许多。实际上,卫宁健康为其自主打造的医疗大模型建立了一个智能服务层。这一层位于业务应用与数据处理之间,使得大模型能够实时与业务、数据完成交互,实现任一流程数据的升维与降维,反哺大模型的迭代与升级。

医院需要怎样的大语言模型?

卫宁健康医疗大模型WiNGPT技术框架

当然,系统问题只是诸多落地问题的一个重要分支,要让大模型稳稳运行于医院,开发者们还需要注意一些细节。譬如要尽可能实现“无感”,让医生无需频繁切换便能快速应用大模型的功能。

这一看似常规的要求,却是互联网公司们的一大考验。由于没有HIS、PACS等业务系统,大模型往往以外挂的形式存在。

虽然外挂的形式不会对模型的性能产生过多影响,但对于医生这一使用者而言,每次调用系统便需切入大模型界面进行启动,大模型的体验及工作的流畅程度都将大打折扣。

相比之下,医疗IT公司们显然更具优势。拥有WiNEX作为支撑,卫宁健康能让各科室的医生在完全不改变业务系统操作流程的前提下享受大模型内涵的诸多功能,已在落地环节拔得头筹。

4、大模型便是越大越好?

在讨论通用模型时,模型的参数量很大程度决定了它的知识学习能力与复杂任务处理能力。因此,国内互联网巨头推出通用模型参数量都在千亿级,GPT系列的参数则达到了万亿级。

但在医疗这类垂直领域,模型的量并非越大越好。有的时候,过大的模型,反而会成为限制其商业化的负担。

由于临床相关的数据不能脱离院区,大模型的落地只能通过封装之后入院运行。但现阶段大部分医院现有资源环境基本是以面向通用计算的CPU,很少有医院有面向图形处理和并行计算的GPU资源,缺乏大模型的部署环境,因而需要在购置应用的同时配备GPU运营大模型应用,并保证足够的存储和高速的网络连接。如果模型过大,医院的配置成本也将因此直线上升。

为了解决上述问题,卫宁健康一直尝试保证应用质量的前提下控制参数规模。赵大平表示:“卫宁健康现有的大模型WiNGPT已经可以实现大部分医疗场景需求,它的参数量为130亿。对于这样一个大模型,单个科室GPU及硬件配置成本控制在10万元之内。而在全院应用大模型,也可以采用更多企业级的GPU并行的方案,配置费用也不过百万元。”

那么,什么量级的参数才能完整覆盖医院的整体需求呢?

根据WiNGPT现有的表现,王涛认为:中文医疗大模型的参数可控制于150亿左右,包含语言与多模态影像的大模型参数可控制于500亿内。WiNGPT的目标参数量是130亿,而在即将推出的第三代大模型——医学影像多模态模型中,300亿参数已经可以满足垂直领域的众多需求。

5、医疗大模型需要

一个“杀手级应用”?

到目前为止,许多企业已经在大模型的基础上推出了多个应用。同样以卫宁健康为例,其文书生成可以自动提取重要信息,理解和生成电子病历、出院小结等文档,形成病历章节,减轻医生的工作量;其医学影像解读能够辅助医生解读医学影像,例如X射线、CT、MRI等,生成影像报告、体检报告,提高诊断的准确性和效率……

粗略一看,大部分企业围绕大模型做的仍是传统场景下的应用,没有找到一个杀手级的应用场景,推动大模型的落地。

但这样的形势或许打开一条新的路径。在王涛看来,医疗大模型的定位本就应是“Copilot”(副驾驶),作为医生的智能化助手与医生一起成长,一起解决诊疗科研中的难题,这也是卫宁健康打造大模型的愿景所在。

医院需要怎样的大语言模型?

在未来的理想时代,所谓的“杀手级应用”,便是每一个医生都拥有一个符合自己风格、与自己精准匹配的大模型。

(0)
小多多的头像小多多创始人

相关推荐

  • 愿支付80%预付款,印度想挽回信誉,比亚迪要有危机感

    愿支付80%预付款,印度想挽回信誉,比亚迪要有危机感,一个在印度崛起的新能源汽车产业链,对国产厂商不是好事,考虑到印度市场的特殊性,要懂的制定自己的商业规则与策略,要有危机感以及最坏情况下的退路。

    2023年7月20日 创投
  • 南方基金账户查询(南方基金的钱如何拿出来)

    基金在赎回时要先确定好赎回的金额,明确是全额赎回还是部分赎回。确定好赎回的金额后,进入购买基金的银行账户,查看银行账户内的基金资产状况(主要查看盈亏情况)。 如果银行账户内的基金出…

  • 周鸿祎不甘当配角

    周鸿祎不甘当配角,53岁的周鸿祎学会了谦虚:“我们不是BAT那种一线互联网企业,但360作为二线企业中的领军者,还是有自己的核心优势。”

    2023年4月3日
  • 最「杀马特」运动,凭什么迷倒中国人?

    今年,毫无疑问是全民运动大年。亚运会虽然结束,但在工位上憋疯的年轻人,从未停止创造各种网红运动。中午刚进行City walk,晚上又开始在城市里躲猫猫。到周末,连80岁大爷都出来跑马拉松。现在出门运动,你可能也见过这样一个场景:几个人在羽毛球场打得火热,然而手上却拿个乒乓球拍。一时间竟以为自己错入了

    2023年10月10日 创投
  • 充满套路的「降价」,让3月车市哑火了

    充满套路的「降价」,让3月车市哑火了,目前,新能源汽车的渗透率已进一步超过35%,对燃油车的替换效应更为显著,一旦超过50%,新能源汽车将成为市场主流。

    2023年3月30日
  • 运动鞋服业的2023:国潮失灵

    2023年,运动鞋服业迎来“冰火两重天”的发展态势。一方面,国货运动品牌们借助国潮加速提升认知度,行业渗透率与市场规模也都在稳步提升。中金企信研究报告显示,我国运动鞋服行业渗透率已从2016年的8.8%提升至2022年的13.6% ;行业市场规模由2017年的2215亿元增长至2022年的4157亿

    2023年12月29日
  • 拼多多「总部迁移」疑云

    拼多多「总部迁移」疑云,狂奔数年之后,拼多多有了减速的迹象,海外扩张步伐则全方面加速。

    创投 2023年5月9日
  • 腾讯游戏转身

    昨天,逆水寒手游更新了一条*微博。*的原因是自己超越了原神和*荣耀,登顶IOS下载榜总榜。玩手游的读者朋友们大概能明白在整个游戏行业,《*荣耀》意味着什么。简单评价就是,*。背靠腾讯的社交生态,它拥有着最多的玩家,DAU最高一度突破1.4亿;也成为了腾讯最恐怖的印钞机:从2022年2月开始,《*荣耀

    创投 2023年8月19日
  • 私募投资基金监督管理条例发布

    私募投资基金监督管理条例发布,《私募投资基金监督管理条例》(以下简称《条例》),自2023年9月1日起施行。公布

    2023年7月9日
  • 网购体验大提升上二三良作“逛逛”吧_行业动态

    足不出户,也能体验“逛街”购物?如今,网购已是人们生活中不可或缺的一部分,衣食住行各方各面的用品或服务,只需要动动手指就能购买获得。常规网购…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年7月6日
  • 微信版花呗,再搞一次「珍珠港」?

    试水多年的微信分付尚未搞出名堂,又一款顶着微信名号的消费分期产品来了。近日,据镭射财经等多家媒体报道,微信正在测试一款名叫“微信分期”的新产品,入口位于微信钱包中,埋藏较深。实际体验后发现,用户在使用微信支付时,可以通过微信分期付款,但不能用于发红包或提现。根据用户资质不同,可获得的总额度约为数千至

    2023年9月7日
  • 菜鸟IPO在即,联合阿里私有化百世集团

    11月6日晚间,百世集团披露,公司董事会已接到签署日期为2023年11月3日的初步非约束性私有化提案。买方联盟包括大股东阿里巴巴及旗下物流公司菜鸟等。具体而言,此次私有化提案来自百世集团创始人、董事长兼CEO周韶宁,公司首席战略和投资官周韶建,Denlux Logistics Technology

    2023年11月8日
  • 基诺浦,冠军儿童的成长伙伴_行业动态

    有基诺浦出现的地方,就会吹过一阵风。这阵风,是流行风,快乐风,还有倚梦追风。529爱足日,基诺浦邀请三位品牌体验者,讲述儿童追梦的故事。儿童…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    2023年6月2日 创投
  • 微信零钱限额开通微众银行安全吗 答案是这样的

    微信零钱账户每年是有额度限制的,当一年微信零钱账户的交易额达到20万元,那么用户就无法继续使用微信零钱来进行付款、转账交易的,当然微信零钱账户的资金还是可以提现至银行卡账户来进行消…

    创投 2022年3月31日
  • 青海省50亿母基金招GP(2023-2024年)

    投资界(ID:pedaily2012)消息,11月底,青海首个政府投资母基金——青海省高质量发展政府投资基金(简称“青海省母基金”)在中国证券投资基金业协会完成备案,标志着青海省母基金全面完成发起设立,具备对外投资条件,正式进入实质运营阶段。青海省母基金由省级财政出资设立,由青海金财私募投资基金管理

    2023年12月7日