“用魔法打败魔法 ” 南开大学最新研究成果让AI“识破”AI
中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。
图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图) 近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。
据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。
图为AI生成内容检测示意图。(南开大学 供图) 多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。
为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”
“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。
为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。
“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。
团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。
“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。
在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。
“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。(完)
-
即将进入假期返程高峰,复杂天气将给公众出行带来哪些影响?这个假期仿佛“捅了台风窝”!返程路上将遇上“烤验”还是“秋冻”?中国天气网讯 这个国庆假期,天气舞台格外“热闹”!秋台风接二连三,“麦德姆”今天(10月5日)下午登陆广东徐闻,第22号台风“夏浪”又在西北太平洋生成。与此同时,冷空气对北方的影响...
-
从“中国游”到“中国购” 外国游客在中国都有哪些“心头好”央视网消息:今年国庆中秋假期,我国消费市场繁荣兴旺,而随着免签、退税以及支付便利化等政策措施的不断优化,大批外国游客来华旅游,“China Travel”在这个假期持续火热,这么多外国人来到中国,他们喜欢吃什么?玩什么?接下来,我们就跟随记者的镜头去...
-
假期返程客流持续高位运行 多方联动优化运力保障旅客顺畅出行央视网消息:10月7日是国庆中秋假期的第七天,返程客流明显增长,交通部门在热门线路增加运力,保障旅客顺利返程。10月7日全国铁路预计发送旅客1905万人次10月7日,全国铁路预计发送旅客1905万人次,计划加开旅客列车1880列,其中长三角铁路计划加开列车399列。...
-
台风预警:“麦德姆”今夜将在广西防城港至中越边界一带再次登陆中国天气网讯 中央气象台10月5日18时发布台风橙色预警:今年第21号台风“麦德姆”的中心已于今天(5日)下午2点50分前后在广东省湛江市徐闻县东部沿海登陆,登陆时中心附近最大风力有14级(42米/秒,强台风级),中心最低气压为965百帕。下午6点钟其中心位于广东省雷...
-
饼大如月盘、皮薄馅足……连苏东坡都夸的大月饼,你吃过吗?中秋明月夜,合家团圆时。餐桌上一盘金黄诱人的月饼,是中国人中秋佳节不可或缺的传统美食。在广西北海市合浦县,这里出产的大月饼大如月盘,轻轻切下一块,可见皮薄馅足,松软香甜,放入口中,色泽澄黄的饼皮油而不腻,让人回味无穷。翟李强 摄 合浦...
-
“麦德姆”继续影响广西云南 南方多地高温持久北方秋凉加重中国天气网讯 今明天(10月6日至7日),台风“麦德姆”及其环流将影响广西、云南等地,部分地区雨势强劲,需注意做好防范措施。四川盆地和华北地区等地也是降雨频繁,北方多地叠加冷空气影响,未来几天气温明显下降,公众国庆中秋假期返程请注意防雨、保暖。...