AI 文字的恐怖谷

2025-02-15 (Sat.)

最近在互联网上读到不少疑似 AI 生成的文字。

一类破绽百出,有着无比整齐的小标题、用两个星号围起来的强调词,夸夸其谈,说着乍看合理实则食之无味的大真话。复制时整理一下 Markdown 格式应该并不难,然而他们并不会做,更不会去整理文字中的重复信息,验证数据是否产生自幻觉。要是不幸碰上了这种文章,就像误入了洗手间,连忙捏着鼻子返回。

而另一类亦真亦假的就十分令人困惑了。隐约觉得文笔不太对劲,再读一遍,越来越像 AIGC。这些文字极其流畅却信息不足,感情丰富却有些机械。字里行间藏着 DeepSeek 的影子,但我却没有证据。我只记得一个月前人们不太写 “赛博流动”,更不会突然来个 “量子迷宫”。我于是无法分辨,我所感受到的情绪波动是否真实。这种波动到底来自屏幕对面的另一个人,还是只是来自一个概率模型的序列预测。

这也许就是 AI 文字的恐怖谷。互联网上人类文字和机器文字的边界逐渐模糊,机器通过爬取学习人类,人类也在从 AI 这里重新学习如何说话。我感到沮丧,以致于最近看到 2022 年之前出版的书籍 / 论文 / 博客时,有一种原始的安全感,因为我知道这些内容绝对不是 AI 生成的。

当我为 AI 生成的华丽文字感到震惊与赞叹时,我突然意识到,我应当赞叹的不仅是模型本身,更应是全世界中文文字的智慧结晶。那些历史上最优秀的作家用最波澜壮阔的经历和最真挚深刻的情感,写出了最具表现力的文字,赋予了现代 AI 模仿人写作的能力。然而,这些文字最打动人心的从来不是字符本身,而是你和作者类似的成长经历或心路历程、你感受到的榜样的力量或安宁的慰藉、你头脑中混乱的思绪被作者理顺的那一个瞬间。这是梯度下降无法学习到的人性,也是你不应该再用 AI 来写人文向的文字的原因。

AI 时代,更要对文学保持敬畏。不是 AI 写的太好,而是我读过的太少。

© 2019 - 2025Juntong Chen || Dark Mode || RSS