人工智能的十万个为什么

我与其他科技工作者之间经常发生的最痛苦的争论之一是，是否可以区分人类撰写的文本与人工智能生成的文本。他们的怀疑是有理由的：从本质上讲，大型语言模型（LLMs）是基于人类说话方式的最先进统计模型。如果是这样，那么模型的输出几乎在任何统计测试下都应该与人类语言无法区分。我认为这并不总是出于善意的争论；至少有一部分辩论是由那些希望保持自己技术不当使用的可否认性的人发起的。但是如果你真心持有这种信念，我给你展示以下拼贴画：图像展示了大约150本在亚马逊网站上搜索“十万个为什么”时出现的书籍封面（链接）。其中一些书籍在儿童文学类别中是畅销书。你可以在这里查看一个可缩放的高分辨率版本。所有这些标题或封面中没有什么不人性化的。同时，我可能不需要说服你，你正面对着如今填满亚马逊许多非虚构类别的最纯粹的人工智能垃圾。更具体地说，我们看到的是工具的伪确定性所造成的产物：如果一百位“作者”给他们最喜欢的AI工具提供类似的提示——比如说，“生成一本儿童参考书”——那么模型可能会在80%的时间内产生功能上相同的输出。拼贴画中的相似性远远超出了标题的选择：例如，第一排的所有封面设计的左上角都有一只咆哮的恐龙。数据中还有许多其他集群。寻找反复出现的红白相间的卡通火箭、一只金毛猎犬、一只狮子等等。这正是使大型语言模型写作独特的原因：并不是说模型的个体习惯与我们的不同。问题在于它们在几乎任何正常提示的响应中依赖于相同的复杂习惯集。这是一个模糊的信号，所以当你的实习生说“这不是这样的——是那样的”时，你不应该解雇他们。但在更随意的场合中，依靠你的直觉是可以的。实际上，这些本能变得越来越重要，因为如果生产内容的努力远低于与内容互动的努力，那么传统的在线互动模型将崩溃。最后，如果你在使用大型语言模型来自动化博客：是的，这项技术很神奇，但很可能，你的出版物可以改名为“十万个为什么”。没有帖子