Tokenmaxxing 已成为过去式，现在一切都是关于 modelmaxxing。

Getty Images; Tyler Le/BI 作者：阿迪提·巴哈拉德你正在关注这位作者！想要取消关注吗？请通过电子邮件中的链接取消订阅。亨利·尚登内特•肖尔戈你正在关注这位作者！想要取消关注吗？请通过电子邮件中的链接取消订阅。 2026-07-04T08:30:01.288Z 阅读应用程序每周两次，摩根·林顿告诉他的16名工程师使用哪些 AI 模型以及何时使用。在距离工程团队站会50分钟的时间里，《商业内幕》与林顿进行了交谈，他是位于太浩湖的 AI 初创公司 Bold Metrics 的首席技术官。他计划告诉一个团队使用 Claude Fable 进行低负载，另一个团队使用 GPT-5.5 进行高负载。第三个团队正在使用 Cursor 和 Composer 2.5，并获得了“完全完美的结果”，他说。明确使用模型的细节意味着林顿不必设置严格的令牌上限。“我的团队可以使用最好的工具，但他们正在以更高的效率使用这些工具，”他说。 2026 年上半年，AI 社区的一个词是：tokenmaxxing——指的是公司敦促员工尽可能多地使用AI。然而，在审查了员工产生的AI账单后，从优步到微软的公司都采取了更审慎的方法。创始人、软件工程师、用户体验设计师甚至非技术的气氛编码爱好者都意识到了一种节省成本的技巧：模型切换。他们将最困难、最具智力挑战性的任务路由到更昂贵的前沿模型，并将更简单、重复的任务转交给更旧、更便宜的模型。随着公司削减AI预算并施加使用上限，这种令牌卫生策略可能会帮助你获得更多的投资回报。再见，tokenmaxxing 当然，有充分的理由使用最新模型。OpenAI的凯琳·沃斯在LinkedIn上写道，更好的模型“减少了重试、监督和浪费的努力”。但一些任务根本不值得这样的成本。Coinbase首席执行官布莱恩·阿姆斯特朗是最早在6月7日的X帖子中提到这一点的人之一。“在12到18个月内，80%的工作负载将使用便宜99%的模型，”他写道，并补充说，其他20%仍将继续使用最新模型，因为“智商最大化很重要”。克里斯·马科尼一直对tokenmaxxing不感兴趣。位于亨茨维尔的AI初创公司Hechura的联合创始人表示，他以“人机共存”的态度运营公司，并且不会建立通宵的机器人来继续编码。模型选择是这种反tokenmaxxing观点的一部分。马科尼记得OpenClaw的炒作周期——一种封装在Mac Mini中的AI代理，因其24小时/7天的使用和广泛的自动性而特别消耗令牌。当他设置OpenClaw时，马科尼从便宜的Gemini模型开始，然后切换到Anthropic的Haiku。“我不怕尝试一些低端模型，看它们是否能提供我们需要的智能，”马科尼说。以创造性的方式拉伸他们的令牌 29岁的科技用户体验设计师坦维·皮萨尔表示，她以艰难的方式学会了更有效地使用模型。皮萨尔使用的工具包括Figma、ChatGPT和Claude来集思广益并制定产品需求文档。她订阅了ChatGPT企业版，并支付基础的每月20美元的Claude Pro套餐。起初，她说她会从零开始使用Claude进行UX构思，在此过程中“浪费了数月的令牌”，结果任务仍未完成。“所以现在我做的是先在Figma中设计所有内容，然后将这些截图放入Claude。我告诉Claude保持UI不变并构建整个功能和流程，”皮萨尔补充道。“这样设计优先的过程真的有助于我节省令牌。”她还选择用ChatGPT进行头脑风暴——由于她的企业计划，这对她来说是免费的——然后将精炼的想法带到Claude以创建更完善的文档。来自纽约市的软件工程师兼技术内容创作者阿莱汉德拉·托马斯表示，她对每个新发布的模型进行测试，以了解每个模型擅长什么。“我尽量不单纯因为它可用而使用最昂贵或先进的模型。对于简单任务，我总是使用更轻的模型或根本不使用，”托马斯说。AI销售公司Scoot的首席执行官埃德·史蒂文斯表示，他喜欢“选一匹马并骑上去”。他的工程师会选择一个模型，尝试几个月，然后确定它是否合格。如果有一个闪亮的新模型——或者他们认为可以用更便宜的成本达到同样的效果——他们就会更换马匹，史蒂文斯说。丹·阿里尔，杜克大学的行为经济学研究员和教授表示，挤压每个令牌的想法体现了稀缺思维模式。阿里尔说，令牌预算让他想起了早期的手机，当时手机的通话时间有限。他说人们会尝试在月底之前尽量用尽他们的通话时间，即使这意味着拨打他们并不真的想打的人的电话。“令牌创造了一种稀缺的模型，使人们无法像他们想要的那样频繁使用。它为我们创造了一个目标。