AI驱动组织变革 |张文宏和王小川的理念交锋

最近,中国最知名的医生之一,复旦大学附属华山医院感染科主任、国家传染病医学中心主任张文宏医生,跟计算机科学家兼企业家、致力于医疗大模型的百川智能的创始人王小川先生,发生了一次关于人工智能应用的观点交锋,这对我们思考AI如何带来组织变革非常有启发。

500

张文宏在一次论坛上公开表示,他拒绝AI系统性地进入医院病历系统,他说自己虽然也用 AI,但是不允许医生从工作开始,就使用AI来写病历以至于做诊断,“没经过系统的训练,就不能知道AI对还是错”。

我理解他的关注点是年轻医生的专业成长与医生的职业根基,担忧医生由于“认知外包”导致思维萎缩,参见我前段时间这两篇文章:

 AI 让人变蠢并淘汰弱者吗?

AI组织变革 | 人脑分包意愿

针对张文宏的观点,王小川在一次内部沟通中表示,“医生的成长不能以当下的患者作为成本。”

我理解王小川的观点是基于患者的利益与系统安全性,他认为基于海量数据训练的大模型通过技术改进,能够基于循证医疗原理精准地找到准确的医学资料,在知识处理能力上超过人类医生。因此,不应该是人监管AI,恰恰相反,是AI辅助人、指导人。如果医生拒绝使用更先进的工具来规避人为错误,是让病人承担了不必要的风险。

我认为二位的观点其实并不对立,他们分别站在了AI对于组织行为影响的不同维度上:

王小川将AI看成是组织用来提升效率和效能的工具,而张文宏则关注组织中的人类认知的形成以及可持续性发展。

从短期的医疗效率来看,王小川观点似乎符合逻辑,技术应当服务于当下的生命救治,有利于降低误诊率,实现医疗普惠;而从医疗学科的长期发展看,张文宏更符合发展规律——AI只是在学习人类,如果没有了高质量的人类临床思维,AI训练的数据源头终将枯竭。

医生群体对 AI 持怀疑甚至是抵制态度一直存在,过去几年曾经导致了医疗 AI 的鼻祖IBM Watson Health 的失败。

IBM 可以说是这轮全球 AI 热的启幕者,然而起了个大早,赶了个晚集。

IBM 在21 世纪初因为参与了当时认为会影响人类科技进步的基因测序,就将医疗领域视为战略增长点,参见我在《华为/IBM 的 BLM 的真相》的历史回顾;到2016 年,IBM 将公司战略定位于 All in AI,而 AI 业务则聚焦在医疗领域。

IBM 重注AI 医疗跑道,对医疗数据资源和AI技术进行了百亿级美元的收购,专门成立了医疗 AI 事业部——IBM Watson Health,试图开辟利用人工智能协助医疗专业人员进行诊断、制定治疗计划以及开展医学研究的新行业。

然而事与愿违,到2022年初,在大模型技术井喷的前夜,IBM 以约 10 亿美元代价剥离了该部门大部分资产,成立了一家独立运营的公司,意味着重注几百亿美元的战略尝试失败。今天,尽管 IBM 还在医疗保健和生命科学里提供通用性企业级 AI 应用服务,但是已经退出了此前 Watson Health 提供的特定医疗诊断工具。

医疗领域是个高度专业化的领域,在美国社会,可以说医生的社会地位及其受到的专业尊崇,要远高于计算机工程师们。因此,被医生的怀疑和抵制,对IBM Watson Health 的技术产品是致命打击。

IBM Watson Health的服务提供包括若干 AI产品, 是和美国的顶级医院合作或者基于其收购的病历数据库研发出来的——包括与纪念斯隆-凯特琳癌症中心(MSKCC)合作开发肿瘤诊断、与梅奥诊所(Mayo Clinic)等合作开发的为患者临床试验匹配,以及用于药物管理的循证临床决策支持工具等。

500

美国医生们对AI的怀疑,很大程度上源于这些系统在临床实践中的表现不佳,具体来说:

训练数据偏差:基于MSKCC的专家经验和假设性病例训练出来的肿瘤AI,其非真实的、全量的患者大数据,难以适配全球不同地区的诊疗环境。

难以理解复杂数据:尽管IBM宣称Watson具备强大的自然语言处理能力,但它在学习医生手写病历、缩写,和复杂的患者病史以及病史自述时,难以支持符合医学原理的输出。

提供错误建议:Watson曾多次给出错误甚至危险的治疗建议,这直接摧毁了医生的信任基础。

医生们拒绝使用AI技术,还来自于基于AI的信息系统实施的业务流程变革问题:医生发现使用AI工具输入数据极其耗时,且AI提供建议又往往与现有基于电子病历系统的临床工作流程脱节;医院要为每位患者支付高达数百至上千美元的AI使用费,却难以证明该技术的投入产出比,尤其是在系统无法显著改善患者预后的情况下。

IBM强大的营销部门显然是过度营销了,他们将Watson Health定位为能够取代人类专家的超级医生,而实际产品只能提供标准教科书级别的治疗方案,而无法解决复杂的、罕见的医学难题时,医生会觉得该工具价值有限。顶级医学机构如MD安德森癌症中心在投入6200万美元后,发现系统无法临床部署,这种负面案例在医疗界产生了连锁反应。

值得注意的是,尽管美国的顶级医院对Watson持否定态度,在医疗资源匮乏地区,如印度的一些医院,部分医生还是认为Watson能提供标准化的第二意见,起到对医生的教育和辅助作用。

当前AI 技术已经跟 IBM 时代有了巨大进化(参见《人工智能的企业应用场景,可能早被IBM想完了》)。主流人工智能采用的大模型技术是基于既有数据来学习的,然而,数据源污染造成的模型错误被放大,以至于造成模型崩溃,使得专业严谨性自我要求非常高的医生们可能对大模型技术持审慎态度。

2024年7月由牛津大学等研究者发表在《Nature》上的一项关于“模型崩溃”的研究表明,当前互联网上的数据越来越多本身就是由AI生成的,而这些数据又用来继续训练下一代AI的话,这些数据属于被污染的数据,模型会发生不可逆的崩溃——它会丢失对现实世界中低概率事件的感知,导致错误被逐代放大,最终生成荒谬的内容,这在医疗中,往往是罕见病或特殊体质。

2025年1月,纽约大学格罗斯曼医学院的研究团队在《自然·医学》上发表了论文《医疗大语言模型极易受到数据中毒攻击》(Medical large language models are vulnerable to data-poisoning attacks)。研究人员通过模拟实验发现,攻击者只需要在海量的训练数据中,掺入极少量的医学错误信息——比例低至0.001%(即 10 万个单词中只有 1 个被篡改),就足以让原本表现良好的大模型在特定的诊断或用药建议中给出严重错误的回答。

研究发现这些被“数据投毒”所污染的模型在通过标准的医学考试(如美国执业医师资格证测试)或性能基准测试时,得分依然很高。在实际应用场景中,模型给出的错误医学建议通常被包裹在非常专业、逻辑通顺的语言框架下。即使是专业医生,如果不去核查最底层的循证证据,仅凭直觉和阅读经验,极难识别出这些看起来很对的错误。

张文宏与王小川的争议不仅存在于医疗领域,在所有依靠经验、逻辑与直觉驱动的专业领域,都存在这样的辨析,使得每位专业人士思考AI带来的组织范式转换——坦白说,我个人认为这些领域专业人士对严谨性的自我要求,都不如医生们高:

程序员:程序员使用 AI写代码,能够真正提高软件开发组织的工程能力吗?从张文宏的视角看,编程的难点不在于代码生成,而是将代码调通、能运行,初级程序员如果不经历手动撸代码以及查错的过程,就无法建立对软件底层架构的认知。而王小川的观点是编程工作,人类正在从搬砖进化为指挥,AI 处理了 80% 的模板代码,让开发者有精力关注架构设计、安全边界和业务价值。

律师:用 AI 来生成合同等法律文书,是否会导致律师机构对条款中微小差异的法律嗅觉退化?张文宏的视角是,法律的精髓在于其适用的上下文情境,年轻律师在手工文书中磨练用词,是对法律后果的敬畏感,而如果让王小川式看, AI 能瞬间比对数万份案例和过往判例,人脑会疲劳、会遗漏,所以 AI 生成的文书比人类更精准。

艺术:美术生用AI 画画,学生用 AI写作文,是否会导致审美平庸化,扼杀人类的艺术天性?如果从张文宏的视角,艺术的灵魂就在于卓尔不群,而基于概率预测的AI 产出的永远是最符合大众预期的平均值;从王小川的角度出发,AI 恰恰是降低了画笔、文字等艺术的技术性门槛,让个人创意而非工具技法,成为稀缺品。

管理咨询:作为中国管理咨询行业的老兵,我其实有这张文宏类似的忧思:咨询的价值在于PPT文章之外的组织气氛,如果年轻顾问习惯了用 AI 快速拼凑逻辑框架,他们会倾向于接受 AI 给出的通用方案,而忽略了企业内部权力结构、文化阻力等无法被数据化的信息。

我在去年初提出过一个AI促进组织变革的三阶段发展模型:

500

如果将组织的整体看成一个以效率、效能和合规等多重目标并重的系统,那么这个系统中的AI和人的关系经历三个阶段的发展,即AI驱动人,人驱动AI,以及人和AI相互监管、基于信任或目标优化的交互式合作,参见《AI重塑管理 |技术驱动组织变革,一直在颠覆,从来没成功》。

张文宏和王小川的争论,反映了人类组织正在经历人类对机器的“认知权让渡”,保守派和激进派正在开展理念交锋。医生将人类的独立思考视作职业尊严,这和技术激进的工程师以及商业化价值观浓厚的律师、咨询顾问们产生了巨大分歧。

我个人认为,对专业人士来说,至少在当前使用AI要秉持这样的态度:“在个人成长阶段,听张文宏的忠告,在服务交付阶段,依靠王小川的辅助”,即:

对专业新手:必须保持某种程度的AI禁区,通过高强度的手动实践,在脑内建立起对领域规律的深刻映射,形成专业知识的肌肉记忆。

对专业老手:感谢王小川这样的工程师不断在改进AI技术,老手可以利用AI作为自己决策的监督员,进行双重校验,防止个人认知的局限带来的系统性风险——实际上张文宏也不反对这样,他自己也是这样做的。

站务

最近更新的专栏

全部专栏