2026-06-01 10:03 点击次数:176


本文来自微信公众号:数字人命卡兹克,作家:数字人命卡兹克,原文标题:《看到目下的毕业生被 AIGC 查重折磨,我有话想说。》,题图来自:AI 生成
我其实一直齐很唱和 AI 的快速发展,很少会看到,让我眉头一皱的 AI 利用场景。以致会有点出离了大怒。
因为可能容或是好的,然而这个步调,却把好心,酿成了一个让我高出烦懑却又以为无奈的事件。
这个事情便是,立地毕业季了,好多的学校,为了整治学术歪邪活动,是以对学生们的论文,除了正本的查重检测除外,引入了 AIGC 检测。
或者便是用一些所谓的 AI 检测器具,来检测你的论文里,AI 生成的含量有些许。
淌若你的 AIGC 检测比例,淌若高于一定的缠绵,就会无法毕业。

开始我以为这种仅仅一些驳诘的图,在我推行查证之后,我发现,是确凿。
照旧有多所大学,启动了 AIGC 检测,况且有明确的缠绵。
比如 4 月 9 日,四川大学教务处发布的《对于开展 2025 届本科毕业论文(想象)学术歪邪活动检测职责的示知》中,就明确提到了,20% 和 15% 这两个比例。

不啻一个,还有好多。
淌若你去 Google 上搜一个关节句:对于 2025 届本科毕业论文(想象)试行 AIGC 检测的示知。
你就能看到,或者有哪些学校,在启动践诺 AIGC 检测了。

你淌若去小红书在望望,搜索关节词:AIGC 论文。
能搜到一大堆的吐槽贴,还有掺杂在内部想捞一笔的所谓几款降重的告白。
我不知谈你们看完这些学生们的吐槽以后是什么嗅觉。
我能感受到的,惟有大怒、烦懑、还有无奈。
说真话,我一直是 AI 刚毅的复旧者。
我写 AI、策划 AI,见证 AI 从最启动粗劣到如今绝大大齐东谈主无法看到上限的全历程,我比 99.99% 的东谈主,齐更确信它的将来。
但我从没想过,它会以这样一种凶残、疏远、失控的神态,误伤那些本该最被保护的东谈主。
因为知谈 AIGC 检测旨趣的东谈主,就会知谈,这玩意,在论文场景上,根柢不靠谱。
它的最底层旨趣其实很浅陋,说白了就一句话:"用另一个 AI,去判断这是不是 AI 写的。"
也便是说,咱们开云kaiyun体育目下在干一件极其很是的事情。
"让 AI 审判 AI,临了把服从扣在东谈主类头上。"
这事简直太特么蠢了。
它不懂你是什么布景,不知谈你是不是彻夜写的,不知谈你有莫得复查文件、洽商措辞、修改逻辑,它只看语料、作风、用词概率。
只消你写得太通顺、太范例、太有逻辑,不好兴味,可能就会被判成 AI 写的。
它岂论你是不是东谈主肉手写,只消你像是模子生成,它就把你打成 AI。
那我想稳稳,什么才不是 AI 呢?那到底什么才是"东谈主"写的呢?
是我这种上不了啥台面的,错字连篇的公众号著作吗?是跟我相同的东谈主类撰写声明吗?是惟有打错字、病句频出、念念路跳脱才算一个东谈主吗?
我确凿很想问一句:这临了要的,到底是东谈主类的念念维,如故 AI 的缺点?
这不是一个浅陋的误判。
这使我以为,好多学校的训诲系统、时代系统、贬责系统,对 AI 证据的深度诬告与潦草销耗。
我莫得那么懂时代,然而凭证我我方往常的学问和有限的了解,目下主流的 AIGC 检测器具,依赖的核默算法,我或者会归为 3 类,这 3 类,在检测文本是不是 AI 生成的上,各有各的问题。
第一类,叫困惑度与熵值分析。

这套逻辑其实迥殊搞笑。
它的底层逻辑是这样的:AI 模子生成翰墨,通常很顺,因为它是从一堆可能性中挑概率最高的词来生成。
在专科术语上,跟困惑度联系的叫文本熵值,便是基于信息论的恐怕度量。
一个文本的熵不错通过字词散布来诡计。是以,AI 生成的文本可能在某些统计特征上熵较低,过于均匀或格局化,而东谈主类文本熵值更高或者散布不同。
是以,淌若你写得也很顺,谈话平滑、逻辑清亮、用词当然,这个系统就以为你"哦,这过于不让东谈主困惑"了,那没跑了,你一定是 AI。
相背,淌若你写得跌跌撞撞、断断续续,错别字连篇、语法造作频发,让东谈主满脑子困惑,卧槽,那这才像东谈主啊!
这就好比你去应聘一个岗亭,答得太好被质疑背稿了,答得磕巴反而以为你有灵魂。
这检测逻辑,离谱得很离谱。
第二种,是我以为最能无语的,机器学习分类器。
他们会喂给 AI 一个大数据集,内部有东谈主写的和 AI 写的例子,然后锤真金不怕火它去别离你是哪边。
说真话,这步调在表面上没问题,但推行用起来,简直是过于操蛋了。
你写得像锤真金不怕火集里的 AI,它就以为你是 AI。
而且你别指望它告诉你为啥判你是 AI,它不会说,"因为你这句话太 GPT 了",它只会说:"我嗅觉你好像有内味。"
一个黑箱模子对你的整篇论文说:"你让我感到很 GPT。"
你告诉我,这是什么判决依据?是超才能吗?那我说我嗅觉你像有十个私生子的东谈主,你就有十个私生子吗?这不搞笑吗。
临了一种,叫句法和作风特征建模。
除了统计层面的困惑度,还不错从句法结构和写稿作风出手建模东谈主类与 AI 的区别。
东谈主写著作嘛,有时辰写死鼻子老长的长难句,有时辰短句。
灵感上来了写得多事之秋文风跟妖孽相同,没灵感时写得跟新闻稿相同。
是以东谈主类写稿的作风是突突突、停,波动大的。
AI 呢?它可爱适应输出,平平滑滑没啥高下转动。
于是,之前 GPTZero 引入了一个缠绵,叫突发度(Burstiness),用来预见整篇著作中句子之间困惑度的变化进程。
除了突发度除外,还不错索求更多句法和文学特征,比如平均句长、从句使用频率、常见通顺词的密度、主动被迫语态比例、学术词汇占比等等。
然而,那我想问了,你见过几个熬夜赶毕业论文的东谈主,是一边写一边保握文学激越的吗?
从新到尾齐是神之一手、李白附体,全篇齐是《滕王阁序》那种文笔?从古于今有几个那种至人啊?
然而等等,关节那 AIGC 检测,说《滕王阁序》的 AI 生成度疑似 74% 啊。

以致能不啻 74%,还能给你拉满。

咋地,王勃穿越者实捶呗?在 2025 年用 DeepSeek 生成了一篇《滕王阁序》,吃着暖锅唱着歌带回了公元 675 年了呗?
是以,除了无语,如故无语。
步调便是这些步调,推理资本就目下这样,天下也齐有个数。
你就按 DeepSeek R1 参考,百万 Token,也便是或者 75 万字,8 块钱东谈主民币。

你再望望知网的 AIGC 检测劳动。

1 千字 2 块钱。

我想问问,这是在拿 24K 纯钛合金的英伟达 H888 在推理吗?钱到底进了谁的口袋呢?
很是,极端。
而我最烦懑的是,大部分使用这些检测器具的学校、导师、贬责者,他们可能根柢不知谈这些事情。
他们只看到" AI 率:74% ",就当成铁证。一句话,把一个学生的勤苦打成零分。
一个彻夜写稿的晚上,一个用 Word 改了几十次的版块,一个在藏书楼趴在桌子上睡着的凌晨。
不是 AI,是东谈主。
是东谈主。
但你没看东谈主,只看了分数。
而且,这种" AI 率 =AI 写的"的推理,自己就站不住脚。
咱们要明晰小数:
生成模子恒久逾越检测模子一代。
就像病毒传播,恒久快于疫苗策划。它只可或者给出像不像,恒久给不出是不是。
但目下,好多东谈主居然把这个像不像的服从,酿成了你有莫得舞弊的判据。
这不是时代问题。
这是咱们的信任危境。
我写 AI,是因为我但愿 AI 让咱们更解放,不是但愿 AI 让东谈主更猬缩;
我用 AI,是因为我但愿它成为抒发的延迟,不是但愿它成为古板的锁链。
而这局势谓的 AIGC 查重,推行上是:
东谈主类用 AI 造了一个火,然后发怵它,临了用另一个 AI,去逼平淡东谈主承认他们也生气了。
淌若你非要说,问我对这个表象怎么看?
我只可说一句:
这不是 AI 的错,这是东谈主类使用 AI 的神态,错得离谱。
用概率,盖过东谈主格。
用模子,替代东谈主性。
淌若有一天,一个学生的泪水、他的悲惨、他的勤苦,敌不外一个模子的"百分之七十四的判断率"。
淌若有一天,一个东谈主要靠摄像监控我方来解说是我方写的不是 AI 写的。
那咱们这代东谈主,也许确凿,活成了 AI 眼中的幻觉。
因为淌若再这样下去,你我终将活在一个更刻薄的版块里。
不是咱们被 AI 误伤,而是:
咱们,不再敢写字了。
Powered by kai云体育app官方下载app最新版本-kai云体育app官方登录入口 @2013-2022 RSS地图 HTML地图