科技公司能学会欣赏更便宜的 AI 模型吗？

AI 热潮建立在一个基本假设之上：更大的模型更强大，最强大的模型获胜。现在，行业即将了解到如果这一假设开始破裂将会发生什么。不断上涨的成本已经迫使用户重新审视更小更便宜的模型。这种成本意识的模型选择是新的，目前尚不清楚它将如何影响行业，但其影响很可能是显著的。 Coinbase 联合创始人布莱恩·阿姆斯特朗提出的一个预测是，绝大多数任务将转向更便宜的模型。他在 X 上写道：“对智能的需求几乎是无限的，但 80% 的工作负载将在 12-18 个月内运行在便宜 99% 的模型上。20% 的工作负载仍将运行在最新一代模型上，那些对于智商提升至关重要。”如果阿姆斯特朗的预测成真，对于 AI 行业而言，这将是一个重大的转变。在此之前，大多数 AI 公司都以质量为竞争焦点，这意味着默认使用最先进的模型。如果那些相同的工作可以由更便宜的模型处理而不影响质量，这将意味着 AI 经济学的重大转变。而且至关重要的是，这其中的大部分节省将来自大型实验室的口袋，这将在 OpenAI 和 Anthropic 正在准备 IPO 时对它们造成财政冲击。这可能是行业内的重大变革，基于一个基本问题：公司是否准备好切换到更小的模型？初步测试表明，当系统安排得当时，更便宜的模型可以在不牺牲质量的情况下替代当前模型。在法律 AI 工具 Harvey 的一次测试中，该公司能够在不降低质量的前提下，将推理成本降低了 3 倍。该测试与推理平台 Fireworks AI 合作进行，结合了 Claude Opus 和 Fireworks 的 GLM 5.1，并针对最密集的任务转向 Opus。结果是服务器时间和总体成本显著降低。“质量是第一位的，在法律领域始终如此，”Harvey 联合创始人加贝·佩雷拉在接受 TechCrunch 采访时表示，他的初创公司提供 AI 法律服务。“然而，质量的定义正在从简单地使用最强大的模型进行所有任务，转变为使用最有效率地得到正确答案的最佳模型。”这个趋势通常被框定为主要实验室与中国模型或开放权重模型之间的对抗，但这忽略了更大的问题。真正的分界线不在于专有模型与开放模型之间，而是在于大型模型与小型模型之间。你可以通过从 GPT-5.5 切换到 DeepSeek 的 V4 Flash 来节省金钱，但切换到 GPT-5.4-mini 同样有效。大型实验室的内部推理与独立服务的开放权重模型之间正在进行一场激烈的价格战争。对于小型与大型模型之间的更大问题而言，哪种小型模型最终胜出并没有太大关系。这一切看起来可能很明显 — 当然你不应该使用多于必要的计算 — 但这与直到现在主导行业的优先扩展的策略相悖。受到痛苦教训的启发，实验室一直致力于训练尽可能计算密集的模型，推动 AI 模型的可能性边界。在投资者的重重补贴下，客户没有理由选择任何其他选项。随着代币价格上涨和补贴放缓，用户首次面临成本压力。我们不知道这种新的成本压力是否真的会驱使企业用户转向更小的模型。他们可能同样会通过减少调用次数、使用更少的上下文，或干脆放弃前景不佳的部署来节省开支。但如果事实证明大多数部署在更小的模型上也能够很好地运行，这可能会对不断增长的推理需求造成严重的影响，并提出关于如何证明训练一款前沿模型成本合理的新问题。当您通过我们文章中的链接购买时，我们可能会获得少量佣金。这并不会影响我们的编辑独立性。拉塞尔·布兰登自 2012 年以来一直报道科技行业，专注于平台政策和新兴技术。他曾在 The Verge 和 Rest of World 工作，并为 Wired、The Awl 和 MIT 技术评论撰写过文章。您可以通过电子邮件 russell.brandom@techcrunch.com 或在 Signal 上拨打 412-401-5489 联系他。