返回

文章详情

Anthropic: 'We made the wrong tradeoff' in new model guardrails

人工智能公司Anthropic:在新模型的保护措施上做出了错误的权衡

Business Insider2026年6月11日 07:18

Anthropic缩回了其在人工智能研究中的新政策。彭博社/盖蒂图片社,Anthropic在AI社区的强烈反对下,反转了关于Claude Fable 5的秘密保护措施的政策。Claude Fable 5现在明显将受到标记的AI请求重新路由到Opus 4.8。Anthropic的Mythos模型仍然是国家安全的担忧。这个星期早些时候,人工智能实验室发布了Claude Fable 5,这是Mythos模型的公共版本,设计时增加了额外的安全措施以防止滥用。在发布时,Anthropic表示,将会采取预防措施,例如将有关网络安全、生物学和化学的问题重新路由到能力较低的模型,以确保人们无法使用高级模型策划网络攻击或制造生物武器。实验室还表示,对于那些试图使用Fable 5进行人工智能开发的人,公司会降低模型的性能,而不向用户解释变化。开发者社区中的一些人认为该举动是一种低调的方式来防止他人创建竞争的人工智能系统,《商业内幕》之前报道称。周三的声明撤回了这一举措:Fable 5现在将告知用户他们的提示是否被拒绝或重新路由。

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡