下一部伟大的小说会由人工智能写成吗（你能分辨出来吗）？

随着关于大型语言模型（LLM）使用的控诉在文学和媒体界引发轰动，语言学家解释了人类语言和机器语言之间真正的区别，同时包括詹妮弗·伊根和珍妮特·温特森在内的小说家反思在ChatGPT时代的小说的未来。以下是来自三个不同酒店评论的三个段落。你能分辨出哪些评论是人工智能生成的吗？“这家酒店的位置非常好，周围有很多地方可以吃喝。酒店本身总是热闹非凡。位于底楼的酒馆绝对是必去之地。食物、服务、价格和氛围都很棒。”“这是一家不错的酒店，虽然房间的比例就像一个装修得很好的电梯。睡得很好，淋浴非常不错，工作人员友好。早餐虽然繁忙但服务还算得当。会再次入住，但可能不带很大的行李。”“作为伦敦之行的绝佳基地。房间安静，床舒适，一切都运作良好。工作人员很乐于助人，但又不令人感觉压迫。整个入住体验从开始到结束都很顺畅，简洁。”你觉得自己判断得怎么样？兰卡斯特大学的法医语言学教授克莱尔·哈达克（Claire Hardaker）表示，大多数人对这种判断的正确率仅为60%。她的在线测试“机器人或不是”要求用户在15条评论中识别虚假评级。这个中等成功率可能会让那些确信自己能在50步外识别出人工智能写作的人感到惊讶。今年5月，关于杰米尔·纳兹尔（Jamir Nazir）获奖短篇小说真实性的问题提出质疑，社交媒体用户迅速对其进行谴责。“如果你知道，那你就知道，”有一位评论者如此说道。哈达克表示，她的受访者往往依赖几个简单的法则来识别人工智能语言，包括陈词滥调的存在和破折号的使用。“三原则”（rule of three），即将词语或短语安排成令人满意的三组合形式，也被认为是一个常见的特征。“人们已经学会了一些非常简单的规则，现在随处疯狂应用。”然而，有个问题：这些“特征”同样是人类写作所特有的，毕竟，制作这些文本的大型语言模型（LLMs）正是基于人类写作进行训练的。“你可以追溯到查尔斯·狄更斯，告诉他他也是人工智能作家，因为他也使用了破折号。”而演讲者自朱利叶斯·凯撒说过“我来了，我看见，我征服了”以来就已经了解了三原则。在我们的酒店评论示例中，只有第一个是可信的。你发现了吗？或许因为很难确切知道，怀疑已经成为当今的主流。在文学界，关于人工智能使用的指控现在使作家感到困扰，且这些指控的合理性各不相同。一部处女恐怖小说《害羞的女孩》在出版商哈谢特（Hachette）因网络上流传的关于作者依赖人工智能的传闻而被撤回，作者对此表示否认；史蒂文·罗森鲍姆（Steven Rosenbaum）的书《真相的未来》（The Future of Truth）是一部关于“人工智能如何重塑现实”的严肃研究，但发现文中存在许多虚假的引用，作者在道歉时对此表示了承认。媒体机构，包括《卫报》，接到了越来越多关于所谓人工智能生成文本的投诉。这些投诉包括对某些短语的直觉判断，以及关于拼写错误和语法错误的评论。在一个案例中，句子中的单词“after”不小心重复了。“我无法想象人类编辑/校对者会漏掉这样的东西，”一位读者写道，展示出对我们编辑能力的可爱信任。问题在于，人工智能不仅在于人类写作的基础上进行训练，此外人类的风格也受到人工智能的影响，这种相互作用创造了一种语言的镜子大厅。没有作者的承认，很难确定个别作品是人工智能写作还是人类写作。这种不确定性是偏执的食谱。如果你有意图借助商业筛选工具来区分人类和机器，哈达克表示，这同样伴随着不确定性。“考虑到我们中的一些人自然写作的方式会被认为是类似于人工智能的——她提到神经多样性人群，比如——这会被检测为人工智能。而且你可以修改人工智能的输出，使其看起来更像人类。如果你将这种内容放入人工智能探测器，你将得到奇怪的结果。”作为曾在法庭上担任专家证人的她对其有效性持“极其怀疑”的态度。最新流行的探测器Pangram，自称假阳性率约为万分之一，已在独立测试中被证明在检测人工智能写作方面极其有效，即使这些文本经过“人性化”应用程序处理以掩盖其来源。但问题依然存在。我在第一次尝试时能够骗过它（见下方截图），通过传达一种夸张的表达风格，这种风格可能是人工智能生成的特色，但同样也可能是某种自然夸张风格的人所写——或者更准确地说，一个沉浸在大型语言模型输出中的作家，如ChatGPT、Claude和Gemini的推动，这种情况日益发生在我们所有人身上。