
采写/孙瑜
编辑/计巍
系统判定AI率的“标准”到底是什么? 供图|视觉中国
AI率(或称AIGC率),是指内容被检测工具判定为“人工智能生成”的比例。为规范学生使用AI生成内容,保障论文原创性,自2024年11月28日起,复旦大学、江苏师范大学、中国传媒大学等多所高校开始将毕业论文的AI率纳入毕业论文的资格审查环节,并设定比率红线,未通过检测者不得进入答辩。
2025年毕业季,该项检测规定首次在部分高校开始正式实施。
今年毕业的付思齐在毕业前十天陷入了“AI率检测”的困境:同一篇文章在不同平台的检测结果相差46%,在同一品牌的平台自测与学校检测结果也不同。
这并非她是的个别遭遇。在深一度采访的十多位来自不同高校的2025届毕业生中,多数人经历了类似的问题。除了不同平台的检测结果不同之外,学生们还发现,人工修改后的AI率不降反增,在数次尝试未果后,一些学生不得不删改论文的学术表达甚至核心内容,有人的论文因此“面目全非”。
如果把AI率超标的论文交给专门的降AI率系统去改,有些时候学生会得到一篇充斥着大量“呢”“啊”“呀”等突兀语气词的论文——这似乎是AI眼中“人”写的论文。
在这场与AI率的战斗中,大部分学生最终都能从中“突围”,但他们并不能从中得到可靠的经验,他们仍苦恼于:系统判定AI率的“标准”到底是什么?为何一段完全由自己写作的致谢段落会被判定为100%由AI生成?在降AI率的过程中,究竟依据什么去修改?还有没有按照自己的语言习惯去写论文的可能?
付思齐的毕业论文在学校系统中的检测结果“超标”
同一文章,不同网站,不同结果
2025年本科毕业答辩前约十天,江苏一所高校新传专业的学生付思齐,接到学校下发的通知:论文AI率不得超30%。
“通知挺突然的,不过检测AI率是大趋势,我没想过会被卡。”虽然从选题、开题报告、撰写、修改到最终定稿,付思齐在论文写作的各个环节都借助了AI工具,但她依然充满信心。
这份信心源于论文正文的摘要、理论基础、研究假设与实证分析等70%的核心部分都由她亲笔完成。“AI考虑很全面,我会用它搭建框架,水一水‘对策与建议’这些部分,但肯定不能拿来写论文的主体部分。”
付思齐自认对AI的使用较为谨慎。在选题阶段,她利用AI辅助理论分析:先将相关理论与初步选题提供给AI工具,并下达诸如“用此理论分析案例”之类的指令。她描述道:“AI会输出很多废话,得花时间切磋,慢慢磨,可能淘出一两条有用的。但如果找到了,对我帮助确实很大。”
她举例说,有一次在用AI分析论文中一关键词时,AI提到“情感反应的工业化操控和消费主义的声音钩子在隐形地重构着认知框架”,“这句话特别拗口,纯粹是概念的堆砌,不可能直接搬到论文里。但我认为其中‘操控’和‘消费主义’这两个观点值得借鉴。”遇到这种情况,她会进一步指示AI:“请从具体的现实问题出发,探讨其中涉及的因素,挖掘现象背后的本质。”
除此以外,在思维疲惫、写不动时,付思齐也会与AI围绕论文主题进行随意对话,希望能获得零星的启发,尽管“多数回复都没什么用”。
5月24日,论文定稿后,付思齐在知网和维普平台进行了AI率检测。知网结果显示AI率仅为1%,而学界较普遍使用的维普系统显示为26%——两份报告均低于学校的30%门槛。被标红的“AI特征显著”段落集中在摘要和文献综述,标黄的“AI特征疑似”则较为分散。“我没当回事,过了就行,没修改就直接提交到学校‘维普论文检测系统AIGC检测’的‘初稿’板块了。”她回忆道,“三万多字,提交后就想安心准备答辩。”
没想到,5月24日下午导师的一通电话带来了坏消息:她的论文AI率高达31.96%,超过了学校30%的标准。“检测界面显示是‘维普系统大学生联合对比库’,我不清楚这和自查的维普官网有什么不同,但结果就是不一样。”付思齐说。面对她的申辩,导师表示理解并承诺向学校争取复查机会,但也明确告知,初稿AI率超标可能影响评选优秀毕业论文。
在多所学校,AI率与优秀论文的评选关联密切。福州大学官网显示AIGC全文检测值应≤20%、校级优秀毕业设计(论文)的AIGC全文检测值应≤15%。江西师范大学则对本科生毕业设计(论文)疑似AIGC全文占比数值超过(含)30%的,通报到学院,并由学院根据实际情况督促整改;超过(含)20%,且无正当理由,不能参与“十佳百优”毕业论文(设计)评选。
此时,距离付思齐5月28日的论文答辩仅剩五天。
同样的困惑也出现在其他学生身上。6月13日,山西某大学工程造价专业的莫首桦,其本科论文被检出高达60%的AI率。其中她自己亲手撰写、充满个人情感的致谢部分竟被标注为100%AI生成,“难道因为我喜欢用有条理地分点叙述,喜欢排比句,就不能是‘人’了吗?”
在重庆,某高校传播学专业25届毕业生陈桂发现,她论文的摘要和导论经导师修改后,句子变长了,措辞更严谨了,AI率却从“疑似AI生成”上升为“AI特征显著”。而另一边,四川大学软件工程专业的吴识却发现一个“怪象”:他仅做微量改动的AI生成函数段落,检测AI率反而显示为0。
某检测平台提供的降AI服务
人工修改后,AI率反而提高
当天下午,付思齐在宿舍开始了第一次修改。
她点开社交媒体上收藏量高达2万的降AI教程,逐句调整。“先把句号全部替换为逗号,当有连续的顿号时,最后一个顿号换成‘和’。把‘不久’改成‘很快’,‘即使’改成‘就算’。”再将主语后置、宾语前置,转换主被动语态,甚至直接删除了部分“改不动”的内容。
对于无法舍弃的核心段落,她在AI工具中输入特定指令要求复写,力求保留原意。“我有点完美主义,既想降AI率,又不愿牺牲逻辑和表达。”她回忆道,这场人工精修与AI复写的混合“改造”持续了12小时。
次日凌晨四点,她在维普支付了20元进行自查——AI率升至41.3%。
“在我手动修改之下,这个AI率不降反增?”此时,距离答辩还有2天零20个小时。
第二次手动修改后,付思齐在维普平台检测显示AI率为26.91%,考虑到不同平台差异较大,她不敢把此次修改后的论文直接提交到“定稿”板块,而是花30元购买了某平台“AI无限改”的“降AI率”服务。
然而结果令人失望:修改后的论文不仅充斥大量“啊”、“啦”等突兀的口语化表达,连核心概念都被改得面目全非。
深一度了解发现,包括该平台在内的多家检测平台已形成了“AIGC检测—降AI率服务—再次AIGC检测”的服务链条闭环,其价格梯度分为:普通版千字5元,至尊版千字8元,声称能不限次数对论文在线降重、润色、扩写直至满意的“AI无限改稿”则为59元。
此外,各个社交媒体上也有着包括工具开发者、个人接单和专业机构在内的“降AI率”服务提供方。
购买相关服务后不满意的案例也有很多。同是今年毕业的陈宁,她把人工修改怎么也降不下来、反复被标注为高度疑似AI生成的摘要给某付费平台修改,虽然AI率下降了,但论文的第一句话就让她哭笑不得,“哎呀,在快速变化的社会环境下呀,高校体育教育可要跟上时代步伐啦!”甚至连论文的关键词都被改成了:“社会环境变迁呀;高等学校啦;体育教育呢;适应性发展呀;教育改革啦”。
付思齐仍继续在社交媒体上寻找方法。虽然大部分经验帖指明最快的方法是直接删去标红的部分,但出于把论文投刊发表的打算,付思齐不愿损害原文的论证。于是她选择更温和的方式,按照经验帖的教程将论文中标紫的片段从中文翻译成德语,再从德语翻译成韩文,从韩文翻译成日文,最后从日文翻译成中文。然而,效果仍不显著,检测结果显示只上下浮动1、2个百分点。
虽然对将毕业论文交给一个完全不懂自己专业的陌生人充满顾虑,但她还是把论文交给了一个在社交媒体上主动联系她的“降AI咨询”的服务人员并支付了50元修改费,对方保证会降到10%以下,并承诺改到满意为止。“从他联系我到交稿,我一直在担心被骗。”付思齐说,“网上踩坑、避雷的帖子很多。”
一位从事降AI率服务的汉语言专业研究生告诉深一度,他手上有三十多个客户,从专科生到博士生都有。”他发来的视频里手指上下滑动着一单单交易,“自己降,很难降下来的。”
然而,经过付思齐与外包人员的两次商讨和返工修改后,AI率仍卡在19%左右,无法突破。她与对方理论,对方拒绝退款,也拒绝再次返工修改,仅同意退还十元。
这次修改后,因检测而产生的开销已经超过200元,她决定再次利用某检测平台的免费机会进行检测。结果令她愕然:AI率竟飙升至71.85%。
此刻,距离答辩日仅剩不到10小时。“我说不上来自己当时是什么心情,只感觉一直绷着的那根弦,‘啪——’断了。”她回忆道,“我拨通了妈妈的电话。第一次,在她开口前,我说,妈,我可能要延毕了。”
修改后,莫首桦论文中致谢部分的AI率仍为70%
被AI“屈打成招”
“还好我看到帖子说,这些免费平台往往会虚报AI率,特别是测过一次两次后,AI率会越来越高,就为了让你焦虑,花钱买他们的降AI率服务。”付思齐说。
就在答辩前一天,付思齐从一个论文博主的评论区发现了一个降AI率的网站。抱着“死马全当活马医”的心理,她花费20元充值。这一次,网站成功将论文AI率在维普系统中压到了2%。当她提交到学校系统的“定稿”板块后,检测结果又变成了6.19%。不过,这场与AI率的战斗总算结束了。
但仍令她困惑的是,校方系统检测结果并不稳定。她发现,同一段文字在初审时被标注为“AI特征显著”,但在原文未做任何改动的情况下复查时,AI率竟变成了0%。
北京某高校农林专业学生仇真真也遇到了相似情况。“我的毕设以实验操作和实验结论为主,全文都是自己独立完成,我压根就没想过会AI率不合格。”仇真真第一次选择了免费的检测平台,想先初步筛查再付费检测。首次结果显示AI率为10%。但是,当仅修了改结论部分200字内的表述后,该平台的检测结果却升至46.04%。即便按照网上教程删改连接词后也并无改善。但当她花了22元在学界认可度较高的知网进行检测时,结果显示——AI率是0。
山东一高校的王宁则直接在知网上付费检测。4月16日晚上,她在知网上花费148元进行了两次检测。论文正文的内容一字未改,检测时间间隔两个小时,唯一的区别在于第二次检测时多了参考文献表和封面,AI特征值就从27.2%下降到0.5%。王宁说:“之前免费查的结果不敢相信,现在在知网花钱查的结果也不敢相信了。”虽然轻松通过了学校的AI率检测,但她仍对AI率的检测标准感到困惑。
中国知网官网的CNKI科研评价与诚信建设系统指出其检测原理:“以知网结构化、碎片化和知识元化的高质量文献大数据资源为基础,按照预训练大语言模型的算法逻辑,首次提出‘知识增强AIGC检测技术’和若干检测算法,从语言模式和语义逻辑两条链路,用AI对抗AIGC,最终实现了快速、准确识别学术文本中的AI生成内容。”
除不稳定的检测结果外,是否需要为了检测达标而改变自身的写作风格成了学生们面对的另一个问题。“用AI测AI,就像‘套娃’,我为什么要为AI率妥协?”这是莫首桦的困惑,她曾尝试与老师沟通,希望保留其因分点叙述和排比句风格而被误判为AI生成的致谢,然而,最终因导师及身边同学“不必太较真”的劝说,加上担心影响毕业,她选择了妥协。在她看来,因“不像人类”而“蒙冤”,却为了“过关”而让步,是一种“屈打成招”。
莫首桦认为,如果学校的AI率检测系统没有一个清晰、可操作的文本判定标准,相应地,也不应该设立一个硬性“达标”规定。她把原致谢的第一段和第三段扩写并着重修改了排比句。虽然调整后这一部分的AI率仍在70%左右,但整体在要求范围内,她就没有再改,“毕竟是自己写的”。
对此质疑,某科技公司AIGC安全部的算法工作人员解释道,主流的AI检测工具其核心技术框架与大语言模型(后简称LLM)同源。用LLM生成文本时,生成每个词会基于词汇表中所有可能词的概率分布。而它最终选择的词汇是受训练数据和参数影响的,这就使它呈现出一种“用词惯性”。
而检测系统则可以看做是一个经过特殊训练的“侦探型”LLM,它负责发现并计算这种惯性,从而判断使用AI生成的概率。例如:LLM在表达“首先”时,后续出现“其次”“最后”的概率远高于人类,因为人类的写作中,可能用“接下来”、“另一方面”、“总结来说”等灵活一些的表达。所以有时可能需要改掉固定的句式结构,以及某些词语来降低(AI率)。
“思想不仅是在表达时产生的,也是在表达中完成的。但现在,我失去了用偏好的方式来表达的权利。”传播学专业的陈桂修改两次后把AI率稳定在了2%,但她仍对为了通过检测,不得不改变自己习惯的写作方式感到遗憾。
莫首桦尝试与导师沟通,论文已经因为降AI被改得面目全非
“AI写,AI测,AI改”
“用AI写,用AI测,用AI改。”当被问及论文写作的过程,付思齐说,“搭建框架、提供思路、填充过渡内容,现在应该没人完全不用AI。”
数据佐证了这一趋势,在第三方机构“麦可思”一项对2024年中国高校师生生成式AI应用情况的调研显示,近六成高校师生每日或每周多次使用生成式AI,仅不到10%的中国大学生”从未或很少”使用。
未来智库2025年6月3日的报告指出,62.9%的学生在遇到学术难题时会首选向AI提问,这一比例已超过咨询导师(51.3%)和同学讨论(48.7%)等传统方式。
自2024年起,多所高校相继出台针对生成式AI使用的毕业论文规范。复旦大学于2024年11月28日发布了《复旦大学关于在本科毕业论文(设计)中使用AI工具的规定(试行)》,明确本科毕业论文(设计)实行“六个禁止”:禁止在研究设计、数据分析、论文正文撰写、语言润色与翻译等任何核心环节使用AI;违规者将取消学位申请资格或撤销学位。
一些大学设立了明确的指标,如天津科技大学规定,若本科生毕业论文中生成式AI检测的结果超过40%,学院将向学生发出警示,并要求其自查自纠。有的大学则更注重对AI使用的过程性把握。中国人民大学官网指出,学生须保存AI生成完整记录(输入指令、输出结果、时间戳),而中国传媒大学学生需在论文终稿提交页面填写人工智能使用情况说明,明确标注使用方式、工具名称及版本等信息。
但是检测AI率过程中,系统间的差异与检测标准的模糊促使了学生继续与AI工具的合作——用AI降AI,同时不能被AI发现。许多学生开始“用魔法打败魔法”。众多降AI指令应运而生,如“将这段文字通俗化,但不要有语气词,保留学术性,并降低AI痕迹”,社交媒体上,这类经验帖也常常收藏过万。
“降AI率的操作几乎全都是毕业生们自己摸索出来发到互联网上互帮互助得到的碎片信息。”付思齐说。
清华大学生物医学工程专业的大三学生于纬担心的是:“我不知道它会往哪方面发展。一篇论文让AI检测,用AI改写,再把这篇论文收录进数据库,这样用于训练AI的数据会不断积累,那会不会导致查得越来越严格,人能说的话越来越少?
中国传媒大学副教授杨洋在接受深一度采访时表示,当前AI率检测技术虽不完善,但将其与毕业挂钩具有合理性。他认为高等教育是打基础阶段,学生需扎实掌握基本功,若依赖AI完成本应自主完成的学习过程,将导致基本功缺失。
“现在的AI率检测也只是作为论文评价的参考要素之一,”他指出“一篇文本是人写的还是用机器写的,对我们老师来讲凭经验大致还是能有个判断,有的甚至一眼就能看出来。”杨洋副教授认为人工智能生成的文本质量还是不及人脑思考后的创作,特别是在创造创新方面,有时甚至还有错误,而且毕业学位论文的质量还要由查重率、盲审专家评分、答辩委员会评议等多项因素来决定。
复旦大学英语语言文学系副教授秦文娟则对学生用AI“辅助”写作持有更开放的态度。她指出,当前人机协作的边界已日益模糊,限制“机器仅可润色语言不可输出内容”的政策并不现实。另外,目前市面上还没有任何一种算法或者工具,可以准确地诊断出一篇论文中的AI率究竟是多少。
在检测AI率的实践中,秦文娟也发现很多同学论文中原创的部分被诊断为“AI语言”。“尤其是那种比较专业、比较学术的语言,更容易被误诊为AI生成的。”秦文娟说,“我们鼓励学生发声,不少学生撰写了申诉信,对误诊内容进行说明,以供导师及教务老师参考,再由导师判断内容原创性。若导师认可无需修改,则学生不必调整论文,也不需二次检测。”
当前,秦文娟副教授正在与复旦大学外文学院的老师们开展专项研究,希望推动相关政策优化。
付思齐也建议:“希望AIGC的审查能够有更具体的判断依据,哪里像AI,为什么像,怎么能不像,而不是只提供一个结果。如果目前技术无法达到的话,至少增加官方认可的免费或低成本检测机会,来减少学生的经济负担。”
收到研究生录取通知后,付思齐尝试再次登录那个最终帮她成功将AI率降至达标的网站,却发现网页已无法访问。这给她在“上岸”的庆幸之余带来了新的忧虑:“(现在)已经开始为研究生论文担心了。”
(应受访者要求,文中付思齐、仇真真、吴识、莫首桦、陈桂、王宁为化名)