代币账单到期:行业对于管理人工智能失控成本的争夺
在整个行业中,公司们开始对人工智能的价格感到犹豫。优步在四月份就耗尽了2026年全部的人工智能编码预算。微软在启用开发人员的Claude Code许可证几个月后便撤回了该许可证。Priceline的一名员工告诉TechCrunch,一个常规的Cursor合同续约返回的价格比以前贵了4-5倍。尽管每令牌的价格有所下降,但对人工智能的更大采用以及越来越多的自主智能体推动了令牌消耗的不断增加。最初在2025年早期大量购买无限制订阅的公司如今正争先恐后地理解他们的资金流向,削减开支,并试图弄清楚他们是否能从预算的破裂中挽回一些投资回报。与此同时,一个市场正在形成以满足他们的需求。初创公司、成熟供应商和一个新的标准机构都在争相为公司提供跟踪他们支出的工具和语言。OpenAI企业负责人亚历山大·埃姆布里科斯在本周纽约市的一次活动中告诉TechCrunch:“六个月前,我与客户交谈时,讨论的内容全部围绕‘它能做什么?它足够好吗?’”如今我们的对话再也不是关于这些的了。现在的对话是:‘嘿,我们花了这么多钱,你有什么可视性?你有什么审计能力?你有什么令牌控制?你的模型效率如何?’”在这样的背景下,Linux基金会本周推出了代币经济基础委员会的计划,这是一个新的标准机构,旨在为人工智能令牌灌输与FinOps云支出相同的成本控制纪律。FinOps基金会执行董事J.R. Storment告诉TechCrunch:“在四月和五月,我开始听到公司说:‘哦,我的天,我们超出了整个2026年的令牌预算3倍,而现在还只是四月,’”。“我们开始听到生存危机,整个对话从代币最大化和‘快速推进’转变为‘我们需要防护措施,我们如何控制这一切?’”科技界响起的呼声紧随其后,是首席执行官们热切地要求团队使用最佳模型、快速行动,成本无所谓。去年11月发布的新模型,如Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和Google的Gemini 3 Pro,为智能工具带来了显著的改进,导致了消费的倍增。正是这样,一家公司在忘记为员工设置使用限制后,被报告需支付5亿美元的Claude账单。“这就像是冰毒-可卡因的流行,”Priceline的IT财务高级总监克里斯·里德说,并指出该公司已经开始对某些小组设置令牌限额。“他们让你尝试,让你上瘾,而现在你变得有些依赖它。”工程运营平台Faros AI的首席执行官Vitaly Gordon表示,他最近与一位CTO交谈时被告知:“我一名工程师上个月花了4万美元买令牌,我真的不知道我该让他停下来,还是去告诉其他人也像他一样。”Faros的三月份调查发现,在20000名开发者中,产出在提高,但错误和重写也在增加。工程管理平台Jellyfish同样发现使用最多令牌的工程师的生产力是使用人工智能较少的人的两倍,但他们花费的令牌数量是前者的10倍。Jellyfish的研究主管尼古拉斯·阿尔科拉诺通过电子邮件告诉TechCrunch,人工智能的支出因智能特征而爆炸性增长,平均每位开发者的消费在9个月内上涨了约18.6倍。总的来说,这些统计数据使生产力的情况比支出来得模糊得多。“极端支出是否回报归根结底取决于交付代码的最终商业价值(例如收入),而大多数公司仍然无法衡量,”阿尔科拉诺说。至少部分测量问题源于如今人工智能使用的巨大规模。“跟踪云成本是一个每月涉及数亿行数据的问题,”Storment说。“跟踪令牌成本是一个每月涉及万亿行数据的问题。你不能仅仅把这些放进常规的电子表格或基本工具里。你必须根本重新思考你的工具、规格和会计系统以实现这一点。”在Priceline,里德已经看到了差异。他指出供应商报告的使用情况与Priceline的内部数据之间的问题。“我在电信费用管理领域开始了我的职业生涯,我看到所有的相似之处,从电信到云到人工智能,”他说。“每当你引入新的东西时,它就容易出现计费错误、审计和优化机会。”一个市场开始围绕这个问题形成。有纯粹针对这个问题的公司,如Pay-i,跟踪、测量和优化生成型人工智能投资的成本和表现。而Paid则允许开发者跟踪成本,测量使用情况,并根据实际价值而非订阅费用对用户收费。然后还有像Jellyfish、Waydev和Faros AI这样的公司,它们都提供
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡