雷军34年前论文AI率超标,教授论文“高度疑似AI生成”,如何看待AI检测乱象?
小米创始人雷军1992年发表于国家一级学报的一篇论文,在当下的AIGC检测系统中,测出了可能“不合格”的结果。这个看似荒诞的场景,却是当下高校毕业生的普遍遭遇。

一项本意良好的“查AI”新规,正因标准和技术的双重问题,让学生、导师和学术评价体系都感到头疼。
雷军旧文“被AI”,检测系统可靠性存疑
记者选取了雷军于1992年发表在《计算机研究与发展》的论文《计算机病毒判定专家系统原理与设计》。该文是雷军在武汉大学求学期间的成果,因其前瞻性,至今仍被业内称道。该论文发表于34年前,通用型人工智能技术尚未出现。
然而,记者将该论文原文输入市面上四款主流检测平台,得到的AIGC率结果差异明显:两款平台显示为0%,一款为4.12%,而另一款市场占有率很高的平台则给出了23.8%的“AI率”。

若以部分高校“AIGC率低于20%”的硬性规定来看,这篇论文或将无法通过审核。
原创内容被系统误判在这两年频繁发生。据《中国青年报》报道,中国人民大学有副教授耗时三年手写的论文,也被平台标注为“高度疑似AI生成”。
记者梳理发现,四川大学、南京工业大学、广西师范大学、河北工程大学等高校已相继发布通知,要求本科毕业论文须进行AIGC检测。其中,四川大学要求文科类毕业论文AI生成内容占比不超过20%;南京工业大学则要求各学院自行制定检测标准。
问题在于,各校采用的检测平台并不统一,也缺乏公认的行业标准,这使得学生在选择检测平台时感到无所适从。学生们普遍反映,同一篇论文在不同系统上的检测结果,差异可能高达20个百分点以上。
为找合格报告花费700元,
论文质量反受影响
“学校要求AIGC率低于20%,我的论文在一个平台上初检结果是21%。”大学生李千帆(化名)告诉记者。他并未立即修改论文,而是将同一篇论文上传至其他多个检测平台,希望找到一个能给出合格报告的系统。
为了找到一份能“过关”的报告,李千帆仅在不同平台的反复测试上,就花费了近700元。他向记者表示:“我只是想证明我的论文是我自己写的,但这个成本太高了。”

在反复测试无果后,一些学生找到了新的“解决方案”,即购买“AI降AI”服务,但这往往以牺牲论文质量为代价。
“学生会用AI降AI,市面上的工具都是收费的,学生们为了达标会花钱买这个服务。”中南大学商学院管理科学与信息管理系副教授郑博雯告诉记者。她发现,经过机器“降重”的论文,许多严谨的学术表述变得非常口语化,已经给答辩评审带来了很大的困扰。
比如,一句“本文旨在探讨其内在逻辑与现实影响”,可能会被改成“这篇文章就是想说说它里面是怎么回事,对大家有什么影响”。郑博雯在论文答辩时曾遇到过此类情况。“我问学生,为什么你的论文写得像聊天记录?学生回答说,不这样就过不了AI检查。”
专家:评价应回归“人”,而非依赖机器
“问题的根源在于,高校有检测的需求,但自身没有可靠的技术。而市场上的商业平台抓住了这个机会,它们的算法不透明,标准也不统一,这就造成了现在的乱象。” 北京师范大学政府管理研究院副院长、研究员宋向清在接受采访时分析。
他进一步指出,这种局面下,最大的获利者是商业检测平台,而最终的买单者是学生和整个学术生态。“这形成了一个‘上有政策、下有对策’的循环。学校要求查,学生就想办法降,平台则两头收费,既提供检测又提供降重服务。这完全背离了学术诚信的初衷。”

“这种乱象不仅增加了学生的经济负担,更严重的是,它会让学术评价变味。当一个学生的主要精力从研究内容转向研究如何降低AIGC率时,学术的初衷就被扭曲了。这等于是在鼓励学生去学习如何‘骗’过机器,而不是如何做研究。”
宋向清建议,在当前技术尚不成熟的背景下,AIGC检测结果只应作为辅助参考,而不应是决定性的评判依据。学术评价的核心,最终还是要回归到导师、评阅人、答辩委员等“人”的专业判断与学术裁量上来。
————————————
来源:大河报







