Anthropic 与白宫在 Claude Fable 5 上依然存在分歧

据三位获悉此事的人士透露，特朗普政府官员周一与 Anthropic 进行了会谈，但没有取消上周针对该公司最先进的人工智能模型施加的出口管制，这是由于监狱破解的担忧。政府依然认为，有办法关闭 Anthropic 的 Claude Fable 5 上的一些保护措施，从而有效让用户访问公司的 Mythos 模型的更强大网络安全能力。这些人士表示，Anthropic 过去几天一直在说政府的担忧被夸大了，这一立场在商务部与来自人工智能标准与创新中心（CAISI）和国家网络总监肖恩·凯尔克罗斯（Sean Cairncross）的政府研究人员举行的工作组会议上得到了重申。商务部的霍华德·卢特尼克（Howard Lutnick）也通过电话参与了会议，他打电话时人在法国的 G7 峰会上。凯尔克罗斯本人并未参与会议。Anthropic 方面，联合创始人兼首席计算官汤姆·布朗（Tom Brown）和外事主管萨拉·赫克（Sarah Heck）一直在主导讨论。Anthropic 的前沿红队主管洛根·格雷厄姆（Logan Graham）和高级安全研究员尼古拉斯·卡尔尼（Nicholas Carlini）飞往华盛顿特区参加会谈。Anthropic 发言人在一份声明中对《连线》表示：“双方正在迅速努力解决这一问题。”白宫发言人拒绝置评。目前尚不清楚接下来的步骤可能会如何展开。商务部表示愿意找到一种方法，使 Fable 5 能够重新上线供消费者使用，但这很可能取决于 Anthropic 完全解决监狱破解的担忧。这次紧急会谈发生在 Anthropic 面临的一个紧张政治时刻，该公司已经在与五角大楼进行长期斗争，争论其人工智能模型是否可以用于某些军事应用。特朗普政府上周首次被告知监狱破解的担忧。亚马逊首席执行官安迪·雅西（Andy Jassy）直接致电财政部长斯科特·贝森特（Scott Bessent）讨论这一漏洞，这对令政府感到害怕起了作用。这一对话首先被《信息》报道。白宫官员对 NSA 提出了审查这些漏洞的要求。NSA 回复称，它确实认为可以去掉 Fable 5 的保护措施，这促使政府对该模型施加了限制。卢特尼克随后在周五与 Anthropic 首席执行官达里奥·阿莫迪（Dario Amodei）进行了交谈，届时商务部正在起草一封信，以对 Fable 5 实施出口管制。在此周末，Anthropic 关闭了所有用户对该模型的访问后，卢特尼克与布朗和赫克进行了多次通话。据知情人士透露，目前尚不清楚亚马逊为何会作为 Anthropic 最大的投资者之一对 Fable 5 发出警报。“作为一种领先的云服务提供商，我们为大量私营和公共部门客户服务，政府寻求我们对潜在安全风险的建议是不寻常的，”亚马逊发言人告诉《连线》。 “当这些问题出现时，我们不会分享这些讨论的细节。”安全失联在 Anthropic 与政府之间的对话核心，是对 Claude Fable 5 监狱破解担忧严重性的问题分歧。在周五的一篇博客帖子中，Anthropic 暗示政府对潜在风险的表述被夸大了。部分网络安全研究人员在周一在与官员的会谈中重申了这一立场，发送了一封公开信，认为对 Anthropic 采取的出口管制行动是不合理的。“Anthropic 的 Mythos 级模型在发现漏洞和武器化漏洞方面非常出色。然而，它们并不是在这些任务上独一无二的，许多签署者每天定期使用其他基础模型和开源模型进行安全审计和红队测试，”公开信中写道。“因此，这一行动使得最佳模型远离防御者，造成市场不确定性，危及美国的人工智能领导地位，而没有任何真正的风险来证明这一点。”监狱破解是通过特定方式提示 AI 模型以规避其安全保护。由于 Fable 5 是一个具有某些网络安全、生物和化学保护措施的 Mythos 版本，绕过这些保护实际上将使用户获得 Mythos 的一个版本。Anthropic 自身对允许 Mythos 被公众使用提出了重大关切；然而，它在周五表示，Fable 5 的保护措施足够强大，可以允许公开发布。评估亚马逊调查结果的研究人员表示，被识别出的问题并没有完全削弱 Fable 5 的保护措施。“这并不是一项监狱破解，”Luta Security 的创始人兼首席执行官凯蒂·穆索里斯（Katie Moussouris）说，她在阅读后发表了一份分析。