AI 文字的恐怖谷

最近在互联网上读到不少疑似 AI 生成的文字。

一类破绽百出，有着无比整齐的小标题、用两个星号围起来的强调词，夸夸其谈，说着乍看合理实则食之无味的大真话。复制时整理一下 Markdown 格式应该并不难，然而他们并不会做，更不会去整理文字中的重复信息，验证数据是否产生自幻觉。要是不幸碰上了这种文章，就像误入了洗手间，连忙捏着鼻子返回。

而另一类亦真亦假的就十分令人困惑了。隐约觉得文笔不太对劲，再读一遍，越来越像 AIGC。这些文字极其流畅却信息不足，感情丰富却有些机械。字里行间藏着 DeepSeek 的影子，但我却没有证据。我只记得一个月前人们不太写 “赛博流动”，更不会突然来个 “量子迷宫”。我于是无法分辨，我所感受到的情绪波动是否真实。这种波动到底来自屏幕对面的另一个人，还是只是来自一个概率模型的序列预测。

这也许就是 AI 文字的恐怖谷。互联网上人类文字和机器文字的边界逐渐模糊，机器通过爬取学习人类，人类也在从 AI 这里重新学习如何说话。我感到沮丧，以致于最近看到 2022 年之前出版的书籍 / 论文 / 博客时，有一种原始的安全感，因为我知道这些内容绝对不是 AI 生成的。

当我为 AI 生成的华丽文字感到震惊与赞叹时，我突然意识到，我应当赞叹的不仅是模型本身，更应是全世界中文文字的智慧结晶。那些历史上最优秀的作家用最波澜壮阔的经历和最真挚深刻的情感，写出了最具表现力的文字，赋予了现代 AI 模仿人写作的能力。然而，这些文字最打动人心的从来不是字符本身，而是你和作者类似的成长经历或心路历程、你感受到的榜样的力量或安宁的慰藉、你头脑中混乱的思绪被作者理顺的那一个瞬间。这是梯度下降无法学习到的人性，也是你不应该再用 AI 来写人文向的文字的原因。

AI 时代，更要对文学保持敬畏。不是 AI 写的太好，而是我读过的太少。