人类幻觉比AI要严重多了

本文来自微信公众号:波波夫同学,作者:波波夫

500

人们很容易对deepseek、元宝、ChatGPT这些AI产品吹毛求疵,批评最多的就是AI幻觉,通俗说就是你问AI一个问题,对方回答振振有词,看似严丝合缝,但其中有的内容是捏造的,弄得你对它半信半疑。

要了解AI幻觉为何产生,先得了解AI模型主要是通过从数据中寻找规律来学习进行预测。按照谷歌对AI产生幻觉的官方解释,其原因主要有两条:

最核心的是训练数据的质量和完整性。如果训练数据不完整、有偏差或存在其他缺陷,AI 模型可能会学习不正确的模式,导致预测不准确或出现幻觉。比如,基于医学图片数据集训练的 AI 模型可能会学习识别癌细胞。但是,如果数据集中不包含任何健康组织的图片,AI 模型可能会错误地预测健康组织会癌变。

另外一点是,AI 模型可能难以准确理解现实世界的知识、物理属性或事实信息。缺乏依据可能会导致模型生成看似合理的输出,但其实是不正确、不相关或无意义的内容。这甚至还包括编造指向从未存在过的网页的链接。例如,用于生成新闻报道摘要的 AI 模型可能会生成包含原始报道中未包含的详情的摘要,甚至完全虚构信息。

如果说AI模型回答问题的准确性,主要依赖于训练数据的质量和多样性,但他们又不能主动验证信息的真实性,那么从理论上来讲,人类可以通过批判性思维和多源信息验证来评估信息的准确性,但事实果真如此吗?

声誉良好的Vectara在2025年3月对目前市场上主流的AI大模型测试发现,大部分主流大模型产品的幻觉率大都处于一个较低的水平, Gemini-2.0-Flash-001,以0.7%的低幻觉率位居榜首,显示出其在处理文档时几乎没有引入虚假信息。此外,Gemini-2.0-Pro-Exp 和 OpenAI 的 o3-mini-high-reasoning 模型分别以0.8%的幻觉率紧随其后。

500

这样的幻觉率已经远低于我们人类中的专业精英了。当前顶尖大模型在知识密集型任务和结构化场景(如代码生成、合规审查)中已超越人类专家,只是在开放性创造(如文学创作)和现实经验依赖型任务(如复杂伦理判断)上仍有差距。

以医学为例,世界卫生组织曾公布,临床医学的平均误诊率为30%,其中80%医疗失误是思维和认识错误导致的。另据《中国罕见病综合社会调查》2020-2021数据,国内罕见病平均确诊需要4.26年,误诊率高达42%。

医学是人类幻觉的一个缩影。从宏观上看,人类的认知偏见和误解比大模型要严重多了。这其实是与我们人类的大脑处理信息的方式、认知偏见以及外部环境的影响有关,也是我们生物局限性的必然。人类产生幻觉的原因比AI幻觉的病根要多得多。

首先,人类倾向于寻找、解释和记住支持自己已有信念的信息,同时忽视或低估相反的信息。人类依赖于容易想到的信息来判断事件的可能性或频率,可能导致对事件概率的误判。我们在做决策时过于依赖最初获得的信息(锚定效应),即使后续信息可能更为重要。泰坦尼克号被认为是“永不沉没”的船只,船员和管理层对冰山警告未给予足够重视,不幸在它的首次航行中撞上冰山沉没,导致1500多人丧生。

其次,当面对大量信息时,人类可能难以有效处理和筛选,导致信息误解或错误判断。1986年,前苏联切尔诺贝利核电站的操作人员在进行安全测试时,忽视了多项安全协议和警告信号,导致了历史上最严重的核电站事故之一,造成大量辐射泄漏,事故发生后至今,普里皮亚季和切尔诺贝利一直被形容为一座“鬼城”,2000多平方公里范围接近无人区。

还有,人类时常波动的情绪状态及个人动机会影响信息处理和决策。例如,焦虑可能导致对风险的过度评估,而乐观可能导致风险低估。2003年,美国及其盟国基于错误的情报判断,认为伊拉克拥有大规模杀伤性武器,于是发动了对伊拉克的军事入侵,导致长期的地区不稳定和大量人员伤亡,最终未能找到大规模杀伤性武器。

即使是拥有巨大权力和影响力的人物,也可能因为认知偏见、错误判断或忽视警告而导致严重后果。欧洲猎巫、纳粹屠杀,以及美国总统特朗普最近发起的关税战,就是很典型的人类幻觉所引发的一系列危机。

特朗普在演讲中曾表示:“多年来,当其他国家变得富有和强大时,辛勤工作的美国公民被迫袖手旁观,其中大部分是以我们的利益为代价……现在轮到我们繁荣发展了。”

这样的言论,就连美国的铁杆盟友英国老牌的《经济学人》杂志都忍不住要批评几句:“他(指特朗普)方便地忽略了两个事实:全球化为美国带来了前所未有的繁荣,美国一直是支撑国际贸易的规则的主要制定者。现在,如果特朗普得偿所愿,那么二战后缓慢而稳步建立起来的经济秩序将被埋葬。相反,特朗普赞扬了 19 世纪末美国的繁荣,当时美国比今天贫穷得多。”

位高权重如美国总统也无法从自我认知偏见中爬出来,信息差更大的普通人的幻觉程度又当如何?就像神经科学家达马西奥所说:“人不是可以感受的思维机器,而是可以思维的感受机器。”这句话读起来绕口,但你多看两眼,就会察觉这句话的精妙之处。

参考文献:

1. 谷歌对AI幻觉的详细分析可以看https://cloud.google.com/discover/what-are-ai-hallucinations?hl=zh-CN

2. 你可以在这里参看Vectara的最新测评https://github.com/vectara/hallucination-leaderboard

站务

全部专栏