返回

文章详情

如果大型语言模型具有人类属性,那么《帝国时代 II》也是如此

Hacker News2026年6月7日 18:54

查看PDF摘要:针对大型语言模型(LLMs)和基于LLM的代理工作流进行了大量研究。然而,该领域的许多研究声称、归因或假设它们具普遍的人形属性(例如,道德或理解自然语言的能力)。我们的目标不是支持或反对这些属性的存在,而是指出这些结论可能是错误的。为此,我们在视频游戏《帝国时代 II》上构建并训练了一个简单的神经网络,并注意到任何在足够强大的基质中存在的实体,例如乐高或大波士顿地区,也可能具备这样的属性。因此,LLMs所声称的人形属性在经验上并非独特:尽管某些特性(例如对提示的响应)可能保持不变,但其他特性,比如对其感知行为的解释,可能会随着基质的变化而改变。因此,任何基于经验的讨论都需要明确的测量标准;否则,解释将留给表示。然后我们展示了,假设这些属性在系统中存在或不存在,无论基质如何和以何种一般化方式,都导致循环或无信息的结论,无论实验者对此主题的观点如何。最后,我们提出了一种“零”假设,即假设LLM的非独特性,而不是假设人形属性来设定实验,并给出其例子。我们还讨论了对我们工作的潜在反对,简要回顾了该领域,并证明《帝国时代 II》在功能上是图灵完备的。主题:计算与语言(cs.CL);人工智能(cs.AI);计算机与社会(cs.CY)引用为:arXiv:2605.31514 [cs.CL](或arXiv:2605.31514v2 [cs.CL]用于此版本) https://doi.org/10.48550/arXiv.2605.31514 arXiv发布的DOI通过DataCite 提交历史 发件人:Adrian de Wynter [查看邮箱] [v1] 2026年5月29日星期五 16:31:31 UTC (13,704 KB) [v2] 2026年6月1日星期一 21:31:22 UTC (13,705 KB)

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡