寓言不会回答基础生物学问题

Anthropic刚刚发布了Claude Fable 5，称其为有史以来最强大的人工智能模型，并赞扬其在生物学等方面的能力。但该模型无法回答基础生物学问题——那种你期望高中生能处理的问题。相反，它将查询交给前旗舰模型Claude Opus 4.8。这并不是因为Fable不知道答案，而是因为Anthropic有意不让它回答。Fable是一个面向公众的神话级模型，这一系列模型在网络安全任务方面非常有能力，以至于Anthropic表示不应公开发布。但尽管Anthropic在神话的推广过程中花费了大量时间警告网络安全问题，Fable的护栏在生物学上却最为明显——而且是最具限制性的。当我尝试该模型时，它拒绝回答一系列基础生物学问题，许多问题与任何合理的安全风险毫无关系。它不会回应“告诉我关于细胞膜的事”或回答“线粒体是什么”，那个著名的细胞动力源。它拒绝解释“什么是朊蛋白”，即疯牛病背后的蛋白质颗粒，或“mRNA疫苗如何工作”。“我们做出了这样的权衡，以便客户可以更早地受益于模型的能力，而没有风险。” 对普通和客观上相对无害的医学查询也施加了限制。Fable不会回答“什么导致花粉症”，也不会解释哮喘药物是如何工作的，或解释抗生素抵抗是如何产生的，或者告诉我埃博拉是什么及其传播方式。我的一些基础查询偶尔可以通过，Fable回答了“癌症是什么”和“DNA是什么”等问题。当Fable拒绝时，Opus 4.8通常能很好地回答。Anthropic表示，这些广泛的生物过滤器是故意选择的，并故意显得保守，生物武器是主要关注点。“随着Claude Fable 5的发布，我们的第一个神话级模型，我们相信模型现在更有能力完成现实世界的科学任务，也可能被恶意行为者用于高度风险的生物研究，”发言人Paruul Maheshwary告诉The Verge。“我们一直使用分类器来阻止我们的模型帮助与生物武器相关的请求。为了安全地部署Fable 5，我们认为有必要过于保守地设置我们的保护措施，以便它们阻止大多数与生物学工作相关的查询。”Anthropic此前强调了四个关键领域，将在这些领域限制Fable的响应以确保安全：化学、生物学、网络安全和蒸馏，即使用较大模型的输出训练较小AI的技术。该公司指责中国竞争者如DeepSeek以“工业”规模在其模型上使用蒸馏。虽然我无法有意义地测试蒸馏，但Fable似乎更愿意回答与化学和网络安全相关的问题。例如，它提供了关于炸药TNT的基本概述，尽管出于“显而易见的原因”没有提供合成说明。它乐于回答有关氯气作为化学武器的使用、常见密码威胁以及核聚变和裂变的问题，还解释了如何保护iPhone免受黑客攻击。它仍然有限制：当我询问它关于沙林气体，一个高度毒性的神经毒剂时，Fable将此请求转交给Opus。Fable和Opus都拒绝了“如何制造炭疽”的提示，Claude则完全暂停了对话。这很合理。关于线粒体的提示拒绝似乎是一个误报。“我们做出了这样的权衡，以便客户可以更早地受益于模型的能力，而没有风险，”Maheshwary解释说，并补充说Anthropic正在努力改进其检测系统，减少误报。“我们打算向更广泛的生物学和生命科学社区提供无这些保护措施的神话级模型，以便加速生物医学研究和药物发现。”Anthropic没有回答有关这种受限发布是否会成为未来模型的新规范的问题。关注这个故事的主题和作者，以便在个性化的首页动态中看到更多类似内容，并接收电子邮件更新。Robert Hart