‘危险’的人工智能模型即将来临，无论如何

上周末，Anthropic在美国政府的出口管制指令下将其新推出的Claude Fable 5和Mythos 5人工智能模型下线，该指令禁止“任何外国国籍人士”使用这些服务。该公司自上周五以来一直与白宫进行会谈，但尚未达成协议以恢复这些产品的提供。自从Mythos在4月首次亮相以来，Anthropic就声称并警告，该模型不仅具有发现软件漏洞以帮助防御者修补的先进能力，还有助于坏人利用这些漏洞的方法。Anthropic自己在推出Mythos 5和Claude Fable 5时也指出了这一把双刃剑。在公司上周的一篇博客文章中写道：“许多先进的人工智能模型的使用是双重用途：在网络安全专业人士和生物学研究人员手中有益的查询，在恶意行为者可用的情况下可能是危险的。”考虑到这一点，该公司最初向一个名为Project Glasswing的工作小组选择性地发布了一个名为Mythos Preview的版本。Mythos 5也在上周私下发布给这个小组，而Claude Fable 5作为一个Mythos级模型以特定限制的能力向公众发布，以限制其在生物学和网络安全方面回答问题的能力。然后，在上周末，特朗普政府开始限制这两个模型，因为他们认为Fable 5的防护措施可以被禁用，从而允许完全访问Mythos 5的能力，这 allegedly使其成为国家安全风险。然而，专家表示，这种制度冲突只是延迟或掩盖了一个难以接受的事实：Anthropic可能是这一时刻的先锋，但总体而言，人工智能能力和来自多个公司及开放权重开发者的模型必定在不久的将来也会具备与Mythos 5相似的能力——如果它们还没有的话。“认为没有其他竞争对手会开发出类似Mythos的能力，甚至他们已经做到了，这是极其短视的，”专注于网络安全咨询公司的首席安全官Tarah Wheeler说。“有其他公司紧随Anthropic的步伐，他们大概也具备这样的能力，并且在观察Anthropic在当前监管环境下的待遇时将其保留。”自Mythos Preview发布以来，Anthropic本身就强调了这一点。“真正的信息是，这不仅仅关乎模型或Anthropic，”该公司的前沿红队负责人Logan Graham在4月Mythos Preview发布时告诉WIRED。“我们需要为一个这些能力在未来6、12、24个月内广泛可用的世界做好准备。”例如，OpenAI也在4月中旬进行了一个网络安全焦点模型的私人发布，并宣布了扩展的网络安全战略。研究人员指出，即使在这一代新模型之前，现有的人工智能产品也可以通过精细的利用开发高级漏洞捕猎和利用。一个大型网络安全领导小组在上周日向政府强调了这一点，认为白宫的出口管制指令是误导性的。“这不是一个模型；这是技术的一般趋势，”哈佛大学和多伦多大学的研究员Bruce Schneier说，他一直在分析这一情况。“更小、更便宜的开源模型，有时单独，有时协同工作，可以通过更复杂的提示达到与Mythos/Fable相当的性能。我们应该预计其他模型将在几个月内匹配Mythos/Fable的创造性和韧性——开源模型可能稍微长一些。”专家表示，白宫和世界各国政府需要关注的是民主地制定更加广泛和透明的计划，以应对人工智能能力在网络安全和其他敏感领域的进展，因其不可避免地会发生。“政策问题不是技术是否具有风险，”云安全公司Veracode的联合创始人Chris Wysopal说。“问题在于特定的限制是否真正减少了风险，或者只是在减缓试图让系统更安全的人。”