清华大学“手搓”智能体,只需几天,速成医学专家

前段时间,有关“鸭嘴钳”的讨论,在互联网非常热闹。

作为一种妇科检查工具,有人称它是“当代女性刑具”,有人称,这和医生的操作手法有关系。

当然也有人说,每天那么多人排队等着做检查,医生追求结果精确,可能会忽视了医疗过程中个体的感受。

500

大家争来争去,有一个绕不开的关键是,中国的医疗资源,目前还处于相对紧张的状态

2022年,全国执业(助理)医师的数量为443.5万人, 每千人口的执业(助理)医师为3.15人。

这个数字并不算少,但北京、上海的医疗资源,肯定比18线小城市要好,三甲医院的医疗水平,显然也高于社区医院。

这会导致很多人有个头疼脑热,都倾向于去大城市的三甲医院,进一步导致大医院医护人员日均诊疗人次更多。

500

2022年,全国医师日均担负诊疗人次为6.2人次,而北京医师日均担负诊疗7.9人次, 黑龙江公立医院医师日均担负诊疗4.2人次

一边是患者挂号难、就诊慢,排队两小时,看病2分钟。

另一边则是医生门诊工作、收治病人、科研项目等齐头并进,忙到飞起。

500

500

国家卫健委发布的《关于深化卫生专业技术人员职称制度改革的指导意见》明确提出,医生需要完成 400 个单元(每4个小时接诊不少于 15 位患者为 1 个有效单元,即接诊 6000 个有效患者)才能申报副高,完成 600 个单元才能申报正高。

这样的供需不平衡,很容易成为矛盾发生的窗口。 

同时,一些中小城市的基层医疗单位,则可能陷入“无病可看”的境地,进一步导致其医疗设备更新慢,诊疗方法落后,患者对基层医生的信任度不足,宁愿去三甲医院排队挂号,也不愿在家门口就近治疗。

看病贵、看病难,归根结底,是医疗资源分配不均、优质医疗资源稀缺的问题,解决办法除了医保改革,现在还有一个新的可能——

AI医疗。

AI虚拟医院

最近,来自清华大学的研究团队,把医院搬到了AI世界

500

《智能体医院:一家可以自我进化的医疗智能体的模拟医院》

论文链接:https://arxiv.org/pdf/2405.02957

他们设计了一个模拟医院,其中的医生、护士、患者全部由大语言模型驱动,可以自主完成发病、分诊、挂号、问诊、检查、诊断、开药、康复以及患者随访全过程。

500

研究结果发现,AI 医生在几天内,就完成了数以万计的病例的治疗。

而同样的情况,人类医生大约需要2年时间(按照一周治疗约100名病人计算)。

更重要的是,在诊疗了上万名虚拟病人后,AI 医生在MedQA数据集呼吸道疾病子集上,达到了93.06%的准确率

注:MedQA数据集是一个专门用于医学领域的问答数据集,通常用于训练和评估自然语言处理(NLP)模型在医疗问答任务上的性能。

要知道,中国培养一个医生,基本沿用“5+3”模式,即5年本科,3年规培(住院医师规范化培训),至少8年时间,才能成为一名合格的专科医师。 

而清华大学这个虚拟医院,在几天内就让AI智能体成了呼吸道疾病专家,还是7x24小时全年无休的那种。

这种AI医生去哪里找?

根据论文说明,手搓一个虚拟医院,大致可以分为三步。

第一步,先来个“全家福”。

GPT-3.5生成医生(14名)、护士(4名)、居民的全部信息,且可以无限扩展

如下图所示,借助大语言模型生成的人物,从左向右、从上到下分别是:

1号患者肯尼斯,35岁,患有急性鼻炎和高血压病史,主诉腹泻、持续呕吐、淋巴结肿大、反复发烧等。

2号内科医生伊莉斯,32岁,富有同理心,擅长与病人沟通,主要职责是为患有急性、慢性病的成年患者提供诊断、治疗和预防保健服务。

3号放射科专家赵磊,58岁,主要通过X光、MRI、CT等各种医学图像,作出诊断。

4号接待员法图玛塔,48岁,负责预约安排、患者登记等工作。

500

 

第二步,去生病,去治疗。

在这个虚拟世界里,居民会随机出现生病症状,并成为患者。

1号患者肯尼斯出现皮肤病症状,他先在分诊台咨询,这个症状应该挂哪个科室,随后登记挂号。

紧接着他被安排由皮肤科医生进行问诊,该医生询问过简单问题之后,安排他进行检查,再根据检查结果做出诊断,并开具药方,最终肯尼斯在吃药恢复之后,再回到医院完成随访,是为完成诊疗。

500 

整个过程,完全复刻了一个人在医院就诊的流程——该挂哪个科,医生会根据询问以及验血、CT等检查结果,判断患者病症,并提出治疗方法。

第三步,进阶的AI医生。

从一个医学生进化为一个合格的医生,需要跨越从医学知识到临床实践的高山。

因为同一种症状,可能对应着不同的病灶,只会照本宣科完全不够,丰富的临床经验才更宝贵。

此前在训练医疗大模型时,通常是先把医学数据(生理学、病理学、各种专科知识、病例等)“喂”给大模型,再借助检索增强生成(RAG)、高质量的人工标注进行迭代,让AI医生可以“按图索骥”。

这种训练方法的“别扭”之处在于,医疗大模型可以提升效率,但失之毫厘,差的可能就是一条命;而要是加入人工标注,效率又成了绊脚石。

不过,清华大学这个虚拟医院,采用的是一种MedAgent-Zero(无参数策略)的自我进化方法。

即从患者发病,到医生诊断,再到最后的治疗结果,整个过程不依赖人工标注数据,AI 医生只需要通过学习(阅读医学文献)和实践(与虚拟患者交互,作出诊疗决策,并从治疗成功或失败中积累经验)就能不断“进化”,提升医疗能力。

500

这意味着,AI医生也能积攒“临床经验”了。

但这样的AI医生,能代替真实的医疗专家吗?

AI医疗的想象力

先说结论,眼下的医疗大模型,主要集中在疾病预防、辅助诊断、健康指导等生病的前期和后期

到生病的时候,AI只能打辅助,真正的问诊、治疗,还需要人类医生来进行。

原因除了医疗大模型需要人为干预和标注来提升准确度之外,患者这边,对AI医生也缺乏足够的信任,好比你在互联网搜索肚子痛,各路专家给出的答案可能是受凉了、吃多了,也可能是肠胀气、阑尾炎,最后还得去医院挂个号给医生瞧瞧才放心。

500

而清华大学这个可以自主进化的AI医生,也有一定的局限性。

从训练数据集来看,这个AI医生的“知识库”,主要来自第八版《传染病》中8种呼吸系统疾病的数据,包括每种疾病的症状、实验室检查、检查结果和治疗计划,共计大约10000条记录。

还有一些从医学新闻网站、默克手册网站搜集的医疗文献和案例,以及后续患者的反馈,相当于“经验库”

这些数据集将该AI医生框定在了呼吸系统疾病领域,病人只会得呼吸道疾病,这大大简化了实际的医疗过程

因为有时候,头疼不一定是头的问题,也可能是颈椎的问题,或者心理的问题。

500

所以这个虚拟医院,其实更像一个理想条件下的专科医院。

但研究提出的MedAgent-Zero自我进化机制,再加上更为庞大的医疗数据集,假以时日,AI医生或许真的可以做一些基础的问诊工作,为人类医生留出更多时间和精力,做更高深的研究,提供更有人情味的医疗服务

 

其实,除了清华大学的虚拟医院,AI在医疗领域的应用,或许已经超过了很多人的认知。

 

疾病预防领域,AI算法可以根据电子病历、基因数据等,预测心脏病、中风风险;一些糖尿病之类的慢性疾病,AI还可以提供实时监控和动态建议,用于个人健康管理。

 

在影像学领域,AI分析X光片、CT扫描、MRI等,不仅效率更高,还能更准确地检测到异常,如肿瘤、骨折、脑出血等,提高早期病变的检出率。2020年,谷歌DeepMind开发的乳腺癌AI筛查系统,就在发现乳腺癌方面,准确率超过了医生,登上了Nature。

500

还有AI加码的基因编辑,已经可以改写人类的DNA;Alphafold3的问世,更是为新药研发按下了快进键。

500

图为初创公司Profluent发表的论文,AI设计的OpenCRISPR-1首次成功地精确编辑人类基因组。

甚至有的AI生成病例、AI心理治疗等等,比人类的效率还要更高,效果也更好。

虽然现阶段,AI在医疗领域的应用,还存在隐私、伦理以及人类信任度等等问题,但不可否认的是,AI正在以前所未有的方式,重塑着医疗健康领域。

当人人都有电子健康档案,当大数据能够更早发现身体病变,当AI医生能更准确、更体贴地给出治疗方法,相当于人人都可以拥有自己的家庭医生,甚至私人医生,那么医疗资源的不均衡或许就能被打破。

当新药研发更快,当基因编辑技术可以解决基因缺陷导致的病变,当智能机器人可以辅助人类完成更精细的手术,甚至是远程外科手术,那么,人人都健康地活着,或许也不再是奢求。

当然,这一切都是完美的设想。

但随着AI技术的日渐成熟,随着老龄化不可避免地到来,随着人们对高质量健康的不断追求,这一天的到来,或许并不遥远。

全部专栏