返回

文章详情

在惊吓特朗普进行安全测试后,Anthropic AI模型全球发布

Ars Technica2026年7月1日 16:44

美国解除对Anthropic最新的Claude模型,Fable 5和Mythos 5的出口限制,约在特朗普政府将这些模型指为国家安全风险后三周。Anthropic在一篇博客文章中确认,截至今天,Fable 5将全球可用,而美国组织自6月26日起恢复对Mythos 5的访问。Anthropic表示,现已与政府合作,以扩大Mythos的访问权限,面向“更广泛的国内和国际合作伙伴,参与Glasswing项目”。该项目允许可信会社的网络安全研究人员访问Mythos用于防御目的。在路透社和《纽约时报》看到的一封信中,商务部长霍华德·卢特尼克表示,Anthropic“将不再需要对其Claude Mythos和Claude Fable AI模型的出口或国内转移获得许可。”信中承认Anthropic“已与美国政府密切协调,以应对模型所带来的风险。”面对模型发布的更长延迟,卢特尼克表示,Anthropic同意扩大与政府的合作。该公司还表示已建立一个与黑客合作的项目,以对其模型进行红队测试,并且现在有一个专门的内部团队24/7监控新出现的越狱威胁报告。在信中,卢特尼克提醒Anthropic,美国“保留重新评估决定的权利”,并在任何时候重新施加出口限制。但目前,卢特尼克与白宫幕僚长苏西·怀尔斯一起庆祝Fable 5在X上的重新部署。「在过去的两周里,我们与Anthropic密切合作,分析并批准Fable 5,以确保与美国政府的一致性,加强美国在AI方面的领导地位,」卢特尼克说。怀尔斯没有直接提到Anthropic,但声称这是特朗普的胜利,写道「政府和私营部门以前从未如此紧密合作,而这种美国优先的基础是前所未有的。我们共同的优先事项仍然是:尽快且安全地部署最佳技术。」 权衡:Fable 5可能会阻止常规编码任务 6月12日,商务部命令Anthropic关闭对其最先进模型的访问,限制任何美国以外的人员。此命令源于对中国、俄罗斯或其他国家可能利用这些模型攻击美国基础设施(如电网或银行系统)的担忧。作为回应,Anthropic关闭了所有访问权限,因为它没有办法按国家阻止用户。特别是,Mythos被视为“对希望在网络攻击中滥用它的恶意行为者具有独特吸引力”,Anthropic的博客说。根据Anthropic的说法,该模型“可以比任何其他模型和几乎所有最熟练的人类安全专家更有效地找到和利用软件漏洞”,这些“惊人的网络安全能力”可能会被用于针对美国。Anthropic表示,Fable 5共享“相同的基础模型”,但与Mythos 5不同,它“不提供这样的独特攻击能力”。Fable 5是为公众设计的,已具备Anthropic以往对模型应用的最强保护措施,Anthropic表示在重新部署之前这些保护措施已变得更强。在经过几周的测试后,Fable 5不再容易受到亚马逊研究人员发现的绕过方法的攻击,后者识别了几个软件漏洞,并引发了出口限制。最令人担忧的是,Anthropic表示,有一个案例中模型被操纵以生成代码,演示如何利用漏洞。根据Anthropic的说法,测试确认市场上较不先进的竞争模型,如GPT-5.5和Kimi K2.7,“能够识别与Fable 5报告中相同的漏洞。”这证实了“所报告的技术没有暴露任何独特的Mythos级网络能力”,并且“只涉及常规的防御网络安全工作”。“即便如此,我们迅速采取了行动来解决所报告的越狱问题,”Anthropic写道。该越狱方法目前在99%以上的情况下被阻止,Anthropic表示。然而,增强保护措施伴随着“权衡”,可能会导致一些良性提示在“常规编码和调试任务”中被屏蔽,该公司承认。“在与政府紧密合作的过程中,我们训练了一个改进的安全分类器,以针对并阻止报告中描述的行为,”Anthropic表示。“如果Fable 5的请求被阻止,用户将收到通知,请求将转发至Opus 4.8。”当然,Anthropic的新分类器,帮助避免对模型的特别危险攻击,可能会出现“失误”,Anthropic表示。该公司长期以来一直认为,构建一个完全“不可越狱”的模型几乎是不可能的,但通过增强红队测试,Anthropic希望“确保我们和...

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡