当AI学会“不编造”,医生们终于可以放心用它了

500

  对于一款AI工具而言,只有让医生们敢于信任,才能真正被使用。

  撰文 | 凌骏

  在人工智能席卷全球的这两年,几乎每个行业都在思考同一个问题:AI能为我做什么?

  医生群体也不例外。如今,医学知识正以前所未有的速度更新迭代:一名肿瘤内科医生想要跟上领域进展,可能每天都要研读顶刊上发表的最新研究;一位急诊科医生在处理复杂病例时,也常常需要在极短时间内查阅文献,以做出关键决策。

  然而现实是,大多数医生既要应对繁重的临床工作,还需兼顾科研与学习。AI工具的出现本被寄予厚望,但当医生们真正尝试后,却发现了新的问题——不少通用型AI存在“幻觉”,会一本正经地编造文献,虚构数据。

500

  在此背景下,一款定位于“循证、低幻觉”的一站式信息整合的医学AI助手——阿里健康“氢离子”,进入了医生们的视野。它试图解决的,正是医生最核心的顾虑:既要提升效率,更要确保信息的真实可靠。

  一个“有出处”的AI,真能帮上忙

  “效率提高太多了。”提到使用“氢离子”后带来的改变,急诊科主任医师温医生给出了他最直观的感受。

  温医生就职于一所三甲医院,身兼临床、科研与教学多职。在急诊科,患者病种繁杂、病情瞬息万变,医生必须在有限时间内做出决策。因此,检索文献、共识和指南,是他日常工作中不可或缺的一环。

  温医生告诉“医学界”,以往遇到疑难病例或需要准备科研资料时,他得先在PubMed检索英文文献,粗略判断相关性,找到合适文章后再进行全文翻译,并对照英文原文精读、提取关键信息。

  “整个过程至少涉及三四个不同的工具平台,非常繁琐。”温医生说。

  直到去年年底,作为内测用户,温医生开始使用“氢离子”。最让他印象深刻的,是文献检索与翻译功能的整合。“它能根据我的需求,快速列出关联度高的临床证据,并精准翻译成中文,极大提升了效率。”

  更关键的是,在使用“氢离子”的过程中,温医生没有发现“编造信息”的情况。当输入临床问题后,系统不仅能给出相对全面、清晰的回答,还能给出真实可查的参考文献。“这一点是最让我放心的。”温医生表示。

  有类似体验的,还有北京某三甲医院肿瘤内科的住院医师卢医生。

  与急诊科不同,肿瘤内科医生面临的挑战,是临床证据的快速迭代、新药与新疗法层出不穷。“肿瘤学日新月异,几乎每隔一阵就有新的临床试验结果公布。顶刊上的新发现,可能直接影响明天的治疗策略。”卢医生告诉“医学界”。

  此前,卢医生也曾尝试使用过不同类型的通用型AI工具,但在医学场景下,她发现这些工具存在一个严重的问题——虚构文献。

  “它们给出的结论未必准确,而当我想查看原文、复核数据时,即使明确要求提供准确的DOI号,也经常发现链接是错的,点开完全是另一篇文章。这不但没节省时间,反而增加了验证成本。”卢医生说。

  2025年6月,经导师推荐,卢医生开始尝试“氢离子”。她发现,“氢离子”在保持与通用AI相同搜索便捷性的基础上,进一步强化了结果的真实性与可溯源性,这解决了她使用AI时面临的最大痛点。

  卢医生告诉“医学界”,如今,她已形成了一套熟练的工作流程:当准备学术汇报时,先用更擅长“写作”的通用型AI工具,生成大纲和初稿,调整后再用“氢离子”搜索所需的权威文献,翻译、精读、提炼总结。

  为什么“不编造”这么重要

  事实上,医学领域对AI工具的使用,有着比其他行业更严苛的要求——医疗决策关乎生命,容错空间极小。

  通用AI的“幻觉”问题,在日常生活中或许只是带来不便;但在医学场景中,一个虚假的文献引用或一条错误的用药建议,都可能造成严重后果。

  这也正是许多医生至今仍对AI工具持谨慎态度的原因。“不编造答案,是医生能放心使用AI的基础。”温医生强调,对医生而言,宁愿AI给不出回答,也不能接受虚假信息。

  “宁可不说,也不乱说”——“氢离子”的产品逻辑正是直击这一痛点。不仅是上述两位医生,多名参与内测的医生都反馈,“氢离子”在循证问答、证据整合与分析总结等任务中,表现出更高的准确性。

  “医学界”了解到,在开发过程中,“回答有据可查”是研发团队的首要目标。

  实现这一目标的关键在于,“氢离子”不依赖互联网上质量参差不齐的信息,而是基于千万级国际顶尖期刊文献、3万余部国内外权威临床指南与共识,以及超过6.4万份药品说明书所构建的专用数据库,从而确保信息源的可靠与权威。

  在临床与科研场景下,医生对AI工具的真正期待,不止是简单的循证,标注上“参考文献”,还要确认:这一证据是否仍被当前指南认可?是否已被新研究推翻?是否适用于当下患者?换言之,信任的关键不只是“有没有来源”,而在“这个来源此刻是否依然成立”。

  在最新版本里,氢离子上线了“动态证据定位”新功能。该功能可精准定位原文中直接支撑观点的具体语句,并同步校验时效性、权威性与逻辑一致性。相当于把过去AI回答中“模糊引用一段话”的做法,升级为“精准指出哪句话、为什么可信、此刻是否依然有效”。

500

  除了循证问答,内测医生点赞最高的是智能搜索功能,与传统医学数据库不同,医生无需构建复杂的英文检索式,只需输入中文自然语言,系统即可精准捕捉意图、匹配相关文献并提供核心总结。

  考虑到国内大部分医生研读英文文献不便利。“氢离子”内置了翻译功能,不仅支持在线文献的全文中英对照翻译、阅读,还可对上传的PDF英文文献进行翻译和智能总结,帮助用户快速把握核心内容。

500

  简而言之,“氢离子”更像是服务医生临床决策循证与科研检索提效的一站式平台,覆盖从问题提出、信息检索、内容研读到证据验证的完整工作流。

  技术底座与迭代

  “氢离子”能实现这些功能,源于阿里健康在医学AI领域的长期积累。

  据介绍,为推进医学AI工具研发,阿里健康深度整合了其在中文临床术语集、疾病和药物知识图谱方面的能力积淀,以及互联网医疗平台沉淀的亿级医疗健康知识。

  在此基础上,研发团队进一步融合千万级医学文献、诊疗指南及权威数据,汇聚500B的医学数据进行专业训练,打造了医学垂类大模型。而“氢离子”,正是该模型能力的首个产品化体现。

  更值得一提的是,“氢离子”的产品迭代并非闭门造车,而是与医生群体深度共建。

  阿里健康CTO祥志曾介绍,“氢离子”的研发配备了专属医学团队,同时也邀请了上百名外部临床医生参与优化。团队每周至少组织一次医生交流会,内容既包括医学知识科普,也围绕实际产品体验展开讨论,收集反馈。

  氢离子的产品团队向“医学界”坦言,当下依旧是产品迭代的关键阶段,希望更多临床、科研一线的医生下载体验,每一个反馈都将成为氢离子的“磨刀石”。

  正是这种“从医生中来,到医生中去”的迭代方式,让“氢离子”除了表现出更高的回答准确度,在临床、科研语境下的智能检索和中英文献研读方面,也更贴合中国医生的使用习惯。

  医学AI的“信任”竞争

  卢医生对“医学界”坦言,事实上,她并不认为AI能替代医生的核心临床判断与深度科研工作,其本质,仍是一种辅助工具。

  “我觉得它(氢离子)的信息来源是真实的,这是最重要的一点。”她表示,只有保障了信息的真实性,AI才能真正成为一种可靠的辅助工具,实现其提升效率的价值。

  而从更宏观的视角看,如果更精准的AI医学工具能广泛普及,其意义可能远超提升个体工作效率。

  温医生认为,如果基层医生也能以便捷的方式,获取高质量的临床证据,那对他们的帮助会很大。换言之,当顶级医院、国际前沿的最新诊疗规范与进展,能通过AI工具快速、准确地传递到基层,医疗资源的“同质化”或许能向前迈进一步。

  而这也正是阿里健康试图进一步发力的方向。

  祥志在此前接受采访时表示,在当前的医疗体系中,实际承担着最广泛的患者诊疗工作的,是中腰部医院的医生。

  “如果他们能通过氢离子,用更高效的交互方式获取更高质量的临床证据,比如国内外顶刊的科研成果、基于循证逻辑的病理分析、更多的病例参考,最终让基层医生的诊断结果和头部三甲医院的主治相当,帮助医生群体水平整体提升一点点,也能让大多数患者获益。”祥志说。

  据了解,目前氢离子已在手机各大应用商城开放下载,网页版(ali-doctor.com)同步上线,现在还推出了新春福利:下载氢离子后在首页输入口令“一马当先”,即可免费领取半年VIP,畅享最高阶产品体验!

  氢离子的产品愿景,是“解决中国医生一切医学问题”。诚然,这个目标或许还很遥远,但至少,它正在朝着正确的方向迈进——先让医生们敢于信任,然后才能真正被使用。

站务

全部专栏