
2026-06-24
毕业季临近,高校面临着论文中“AI 味”过浓的新挑战。今年,除了传统的查重、盲审和答辩,大学毕业生在撰写毕业论文时,又增添了一道程序——AIGC(人工智能生成内容)检测。
设想一名毕业生,其论文的AI生成内容比例为62%,远超学校设定的15%上限47个百分点。随后,他使用一个大型语言模型,输入“请将这篇论文修改得像人写的”指令。修改完成后再次检测,AI生成内容的比例竟飙升至94%。这种情况并非孤例,近期不少毕业生都遇到了类似的问题。
中央电视台新闻频道今日介绍了检测论文“AI率”的技术原理。首都师范大学教育学院副院长蔡海龙解释道,传统的查重是通过比对论文语句与语料库中的语句,来判断重复性并做出确定性结论。而AI检测则是利用AI系统分析人类撰写的文本,评估其在语义和表达风格上是否与AI写作存在重叠,其本质上是一种基于概率的分类方法,而非基于证据的确定性判断。
当前AI检测技术的核心难点在于“以AI检测AI”,这使得难以明确区分文本是由人类作者还是AI生成,并且无法提供明确的解释,这是技术瓶颈的关键所在。
此外,中文语言表达的丰富性和多样性,使得人工智能系统在检测人类作者撰写的语句时,容易产生歧义,增加检测难度和降低准确率,这也是导致误判的重要原因之一。
鉴于AI生成内容检测目前尚未达到高度精准,教育工作者建议在论文审核过程中,应建立透明且可追溯的AI使用标注制度,而非简单地设定AI生成内容的“红线”。在判定机制上,应推行以人工评审为主、AI检测为辅的“人机共判”模式。
目前,许多高校在对学生的论文设置“AI率”检测上限,但不少学生反映,学校检查论文AI生成内容的准确性,依赖于指定的检测平台和算法模型分析。
通常情况下,当前主流高校多采用知网、维普、万方等平台的AIGC检测模块。央视记者就“AI大模型如何检测一篇文章有多少内容由AI生成”的问题,向多个大模型提问,并总结回答,其基本原理是通过“困惑度与突发性”等特征进行判断。AI生成的文本通常表现得更为“平滑”,而人类撰写的文本则波动性更大。
大型语言模型解释,困惑度是指文本的“可预测性”,越是包含人类特有的、出乎意料的、打破常规的表达,就越倾向于被认为是人类所写。突发性则关乎文本的节奏波动——人类写作的节奏如同心电图般起伏变化,而AI的输出则相对平稳,如同直线。这种判断方式是否准确?
对此,专家向记者表示,除了困惑度和突发性等指标外,AI文本生成是基于预测下一个最有可能出现的词语的概率来逐步构建文本,这本质上是一种概率统计。因此,目前检测AI生成内容的准确率无法达到100%,误判的情况也时有发生。



