返回

文章详情

‘Tokenmaxxing’ is dead: How the hardware shortage is blowing up AI budgets

‘Tokenmaxxing’已死:硬件短缺如何影响人工智能预算

Sydney Morning Herald2026年6月29日 06:58

2026年6月29日 — 下午4:58,科技巨头谷歌已开始限制对其Gemini人工智能模型的访问,这传达了一个明确的信号:全球计算能力紧张正在结束“tokenmaxxing”时代,并迫使澳大利亚的董事会在其人工智能推出上实施之前未能执行的成本纪律。Tokens 是AI模型为每项任务处理的小块工作——微小的标准化数据单元——导致去年科技界出现了“tokenmaxxing”的潮流,许多公司将token使用视为生产力的代理,推动员工尽可能多地消耗。谷歌已经开始限制对其Gemini人工智能模型的访问。彭博社报道称,Uber和Meta等公司现在已放弃这种做法,因为token使用成本已飙升至天文数字,且容量限制迫使谷歌等公司削减销售。《金融时报》本周报道称,谷歌在三月告诉Meta,它无法提供社交媒体巨头想要购买的所有Gemini计算能力,目前仍然维持着这一上限,其他谷歌客户也受到影响。Meta是全球最大的企业AI客户之一;即使它也无法获得所需的全部计算能力,表明全球短缺已变得多么严重。来自搜索公司Elastic的新澳大利亚研究表明,这一紧缩已经改变了当地企业对人工智能支出的看法。在上一个财年中,三分之一的澳大利亚组织超出了其人工智能预算,32%的公司因成本无法证明而暂停、取消或缩减了部署。Nvidia首席执行官黄仁勋在三月表示,如果一个50万美元(72.4万美元)的开发者在tokens上的支出少于25万美元,他将“深感震惊”。据报道,Meta工程师在30天内消耗了超过60万亿tokens,其支出一项估计约为9亿美元,而Uber的首席技术官在四月表示,该打车公司在四个月内耗尽了全年的人工智能预算。从那时起,亚马逊和Meta已删除了内部的token使用排行榜。“请不要仅仅为了使用人工智能而使用人工智能,”高级副总裁大卫·特雷德韦尔在五月对员工说。在同月,Uber的首席运营官在一档播客中表示,token使用与真正的生产力之间“尚未建立联系”。支撑这种节奏的硬件并不存在。内存芯片制造商SK海力士、三星和美光已经售罄了大多数高带宽内存的供应,而自去年十一月以来,Nvidia较旧的H100图形处理单元的租金价格上涨了约30%。为了在紧缩中生存,工程团队越来越多地放弃了庞大的基础模型,转而采用专门的小型语言模型和可以以较低成本在本地托管的替代方案。大卫·阿隆索,德勤全国AI市场负责人。瑞妮·诺维塔格尔。这场建立物理基础设施的争夺战引发了一场前所未有的土地争夺。澳大利亚创办的Firmus计划进行ASX上市,预计市值高达120亿澳元,该公司周一宣布已与Nvidia签署协议,在印度尼西亚建设人工智能数据中心能力,预计在前六年内将产生250亿至300亿美元的收入。德勤澳大利亚的全国AI市场负责人大卫·阿隆索表示,模型提供商已经从许可和订阅定价转向基于消费的定价,从而消除了使人工智能感觉便宜的隐性补贴。“这是人工智能补贴时代的结束,”阿隆索告诉这一媒体。“Tokenmaxxing……现在本身成为了一个问题。”Elastic国家经理杰里米·佩尔表示,紧缩将迫使公司控制其人工智能成本。“因为需求超过了物理基础设施,经济学的基本法则将会作用,token成本必然会上升,”他说。阿隆索表示,这一转变并不意味着澳大利亚公司在整体上会减少人工智能支出。“如果有的话,他们会......继续增长,而且你的成本线可能仍然会增加,”他说。“但现在明确需要将其与价值联系起来。”由Pure Profile进行的Elastic调查,委托给Elastic,表明当地企业尚未衡量其人工智能支出是否带来回报。只有8%的决策者跟踪人工智能对收入或成本节省的贡献。然而,其中一半计划在未来12个月内增加人工智能支出,32%的人表示,他们只有在有更明显的价值证明时才会这样做。杰里米·佩尔,Elastic澳大利亚和新西兰国家经理。“在未来12个月中,我们预测人工智能使用将向严格的人工智能问责制发生巨大的转变,”佩尔说。“通过使用仪表板上的繁忙程度来评估成功的时代正式结束。”阿隆索表示,澳大利亚拥有约两年的“机遇窗口”,以吸引对国内数据中心能力的投资,从而为澳大利亚企业提供本地优势。

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡