关于这个 Fable 事情悬着一片阴影
好吧。我原本没有计划在今晚写作,因为今天是星期五,星期五是我喜欢编码的时候,当我说编码时,我的意思是‘让代理编码,而我和我的朋友们一起看足球。’最近我一直在制作一些有趣的 HTML 游戏。实际上,我还有另一篇关于我认为我们应该看到‘Flash 游戏’复兴的草稿,因为使用 AI 工具制作有趣的小游戏变得更容易了。但就在我考虑如何让我那糟糕的后室主题射击游戏play得更好时,代理说‘抱歉!这个模型不再存在了!’这是什么鬼?我第一个想到的是我需要重新登录。我大部分时间都在并行运行大量代理,所以我的本能反应是这只是一种非常奇怪的限制错误。我隐约知道 Anthropic 正在考虑将 Fable 从订阅计划中撤回,所以我转向了 API。还是没有用。我的团队构建了一个自定义的 Rust 代理客户端,它非常棒。但我接下来的想法是‘哦,操,这个框架坏了’,然后我开始在 Rust 中四处摸索,这是一种我几乎不太熟悉的语言,即使我声称写了数万行代码。此时,我的朋友说‘政府禁止了 Fable。’这是什么鬼?但这是真的。美国政府指示 Anthropic 禁止任何外国国籍的个人在世界任何地方访问 Fable 和 Mythos,包括那些在美国的人,包括 Anthropic 的员工。这是一个不可能的要求,政府知道这一点,所以 Anthropic 已经禁止了所有人对 Fable/Mythos 的访问。美国政府引述国家安全机关,发布了出口管制指令,暂停任何外国国籍的个人对 Fable 5 和 Mythos 5 的访问,无论其身处美国境内外,包括外国国籍的 Anthropic 员工。这项命令的直接后果是,我们必须突然禁用所有客户的 Fable 5 和 Mythos 5,以确保合规。对所有其他 Anthropic 模型的访问不会受到影响。……我们今天下午 5:21(东部时间)收到了政府的指令。信中没有提供具体的国家安全担忧的细节。我们的理解是,政府相信他们已经发现了一种绕过或'越狱' Fable 5 的方法。我们查看了一个示范,展示了这一特定技术用于识别几个之前已知的小漏洞。这些漏洞似乎相对简单,我们发现其他公开可用的模型也能发现这些漏洞,而无需进行绕过。……我们已经审查了一份报告,我们认为这是政府指令的基础,并确认那里展示的能力水平广泛存在于其他模型中(包括 OpenAI 的 GPT-5.5),并被那些维持系统安全的防御者每天使用。我们将在接下来的 24 小时内分享更多细节。……我们在遵守政府的法律指令,正在为所有用户移除对 Fable 5 和 Mythos 5 的访问。然而,我们不同意一个狭窄潜在越狱的发现应该成为召回面向数亿人的商业模型的理由。对此我有几点想法。首先,我感到非常矛盾。我每天大部分时间都是一个 AI 怀疑论者。由于我在过去训练了许多深度神经网络,我对于优化器可能出现的问题有着深刻的认识。我们优化可以测量的东西,而不是我们真正想要实现的东西。我们希望并祈祷这两者是相同的,但实际上往往不是。我们希望构建良好的产品,但我们不知道如何衡量这一点,所以我们优化参与度。我们希望教孩子们如何阅读和写作,所以我们优化考试分数。我们希望改善经济,所以我们杀死成千上万的鲸鱼,它们的尸体就在码头上腐烂。AGI/ASI 系统可能会以极难预测的方式变得极其危险,因为在它们努力优化我们可以测量的东西时,它们实际上是偏离了好事。企业也是优化者,所以它们当然在为‘尽快赚钱’——我们可以测量的东西——优化,尽管许多构建它的人都在说‘嘿,是的,这真的很危险。’但在这一切上,有一个巨大的阴影。如果美国历史上的任何其他政府采取了这一措施,人们会有充分的理由至少给予那个政府以怀疑的利益。但是,这个政府已经表明它以其开放性和创造力在小气和腐败方面令人完全震惊。这个决定是出于真正想要监管 AI 的愿望吗?更好的问题是:这个政府里是否有任何了解 AI 的人真的能让做出这些决定的人听到他们的声音?我对此持怀疑态度!Anthropic 和这届政府毫无疑问不是朋友。我有偏见,但从我的角度看,Anthropic 竭尽全力地进行整合。
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡