美国政府指令暂停对 Fable 5 和 Mythos 5 的访问

美国政府引用国家安全机构，发布出口管制指令，暂停所有外国国籍人士（无论是在美国境内还是境外），包括外国国籍的 Anthropic 员工对 Fable 5 和 Mythos 5 的访问。该指令的直接影响是我们必须立即停止所有客户对 Fable 5 和 Mythos 5 的访问，以确保合规。对其他所有 Anthropic 模型的访问将不受影响。我们今天在东部时间下午 5:21 收到政府的指令。信件未具体说明其国家安全关切的详情。我们的理解是，政府认为它已意识到一种绕过或“越狱” Fable 5 的方法。我们审查了这种特定技术演示，它被用来识别一些之前已知的小漏洞。这些漏洞似乎相对简单，我们发现其他公开可用的模型也能够在不需要绕过的情况下发现这些漏洞。关于 Fable 的安全保护措施，Anthropic 的立场如下：我们已建立强有力的保护措施，大大减少 Fable 被用于网络安全（及其他任务）相关的滥用的可能性。实际上，我们的保护措施如此强大，以至于许多用户抱怨这些措施过于宽泛。在 Fable 发布前的几周里，Anthropic 与美国政府、英国 AISI、多家私人第三方组织和内部团队合作，总共进行了成千上小时的红队测试 Fable 的保护措施。这些测试表明，Fable 的保护措施比以往任何部署模型的有效性都要高。目前，没有测试者能够找到一个普遍的越狱方法——一种可以非常广泛地绕过模型保护措施，从而解锁广泛网络能力的越狱方法。我们怀疑，对于任何模型提供者来说，完美的越狱抗性在目前是不可行的。行业中使用的每一项保护措施都易受非普遍越狱的攻击（这些攻击在特定情况下可以获取某些网络信息），而且很可能未来会发现普遍的越狱方法。我们在发布 Fable 5 时已明确声明这一点。鉴于今天似乎无法实现完美的越狱抗性，Anthropic 采用了深度防御策略与 Fable 5。我们旨在使越狱或狭窄（在非普遍越狱的情况下）或非常昂贵（在普遍越狱的情况下）来产生，并结合全面监控，以快速检测和关闭任何成功的攻击。因此，Anthropic 要求在使用 Fable 时对客户数据保留 30 天——这一政策变化对我们与客户的合作确实带来了实际成本，但它使我们能够研究和减轻越狱的风险。我们坚持这一深度防御策略。它减少了 Fable 带来的风险，使其与已经在行业内部署的现有模型的风险相当。我们甚至没有收到任何关于引发有害结果的令人担忧的非普遍潜在越狱的披露。迄今为止，政府只给了我们关于一种潜在狭窄非普遍越狱的口头证据，其基本内容是请求模型阅读特定代码库并修复任何软件缺陷。我们的理解是，其中一种潜在的越狱已与政府分享。我们审核了该报告并确认那里显示的能力水平在其他模型（包括 OpenAI 的 GPT-5.5）中广泛可用，并且每天都被维护系统安全的防御者使用。我们将在接下来的 24 小时内分享更多细节。我们正在遵守政府的法律指令，并为所有用户移除对 Fable 5 和 Mythos 5 的访问。然而，我们不同意认为发现狭窄的潜在越狱应该成为召回针对数亿用户部署的商业模型的理由。如果这一标准在整个行业中得到应用，我们相信这将基本上停止所有前沿模型提供者的所有新模型部署。正如我们公开声明的那样，我们认为政府应有能力阻止不安全的部署，作为一个透明、公平、清晰且基于技术事实的法定程序的一部分。该行动并未遵循这些原则。我们对这一干扰给客户造成的影响表示歉意。我们认为这是一个误解，正在努力尽快恢复访问。相关内容来自第一个 Anthropic 公共记录的结果，了解更多 TCS 和 Anthropic 合作将 Claude 引入受监管行业的消息。我们宣布与塔塔咨询服务（TCS）建立合作。TCS 将为其在 56 个国家的 50,000 名员工提供 Claude。