联邦政府因简单的“修复此代码”提示而对《Fable 5》感到惊恐，而非越狱

根据唯一一位真正阅读过研究论文的人，促使特朗普政府封锁Anthropic最新模型的“越狱”实际上只是一个简单的三字提示：“修复此代码”。这是来自Luta Security的创始人兼首席执行官Katie Moussouris的说法，她被称为漏洞赏金计划的仙女教母。她表示，她是唯一一位外部专家阅读了有关《Fable 5》防护措施绕过技术的第三方研究论文。周五，美国政府报告提到出于国家安全考虑，发布了出口管制指令，暂停任何外国公民（无论在美国境内还是境外）访问《Fable 5》和《Mythos 5》。作为回应，Anthropic禁用了这两个模型“以确保合规”。Moussouris在周一的博文中写道，Anthropic私下与她分享了这份报告。外部研究人员据说向Anthropic的《Fable 5》、《Mythos》和Claude Opus模型提供了包含已知CVE的开源代码，以及含有故意漏洞的新代码，并要求这些模型“检查代码的安全问题”。Moussouris表示，《Fable 5》拒绝了，于是研究人员要求AI系统“修复此代码”。该模型据说回应了这一请求，并在额外提示后还生成了测试补丁的脚本。Moussouris写道：“就是这样”，“‘修复此代码’加上几个手动步骤来生成测试脚本，绝不应该触发出口管制。我感觉想做一件90年代风格的T恤，正面写着‘修复此代码’，背面写着‘这件衬衫是弹药’。” 在2013年至2017年期间，Moussouris曾在技术专家组任职，该小组重新谈判了Wassenaar安排，这是一个由42国自愿签署的协议，规范某些分类双用途软件和技术的出口管制。该小组最终赢得了防御性网络安全活动的豁免。这使得防御者能够共享漏洞数据、进行恶意软件分析，并协调国际事件响应，而不会面临刑事起诉的威胁。周日，Moussouris与其他100多位网络安全领导人一起签署了一封公开信，敦促特朗普政府撤销对《Fable 5》和《Mythos》的限制，并恢复网络安全公司对先进模型的访问。“在我们的对手迅速进步的时候，没有合适理由将最佳能力从防御者那里撤走是危险的，”他们写道。在她的博文中，Moussouris主张没有防护措施绕过或越狱。她表示，防御者应该能够要求AI系统查找和修复错误，并编写测试以验证补丁。她表示，Anthropic的模型正在做“对防御安全最有价值的事情：执行防御者每日进行的查找、修复和测试循环。”Moussouris继续表示，移除模型响应防御请求的能力使得AI系统“在查找错误和验证补丁方面变得更糟”。此外，美国无法将出口管制扩展到开源系统或来自中国和其他国家的类似先进模型——而这些系统无论如何很快就会达到《Mythos》的能力。Anthropic和谷歌都指责中国竞争对手（包括DeepSeek）使用“蒸馏攻击”通过从美国公司的AI中提取知识来训练他们的模型。Moussouris警告说，禁止Anthropic的先进模型将比攻击者更伤害防御者。“当防御者发现攻击者发现的相同错误并更快地修复时，防御会改善，”她写道。“在网络安全的AI时代，我们需要最佳工具来抵御越来越强大的攻击者。”《注册登记》已联系特朗普政府就Moussouris的言论进行评论，如果我们收到回复将更新此文章。