‘Tokenmaxxing’已经死了：硬件短缺如何打击AI预算

2026年6月29日 — 下午4:58 科技巨头谷歌已经开始限制对其Gemini人工智能模型的访问，这无疑表明全球计算资源紧缩正在结束“tokenmaxxing”时代，并迫使澳大利亚企业高管施加他们迄今未能强加于自身AI推广的成本纪律。令牌是AI模型为每个任务处理的小块工作——微小的、标准化的数据单位——因此导致去年的科技界流行“tokenmaxxing”，一些公司将使用令牌视为生产力的代理，推动员工尽可能多地消费。科技巨头谷歌已经开始限制对其Gemini人工智能模型的访问。据彭博社报道，但如Uber和Meta等公司现在已经停止了这一做法，因为令牌使用的费用已飙升至天文数字，而能力限制迫使谷歌等公司限制销售。《金融时报》本周报道称，谷歌在3月告诉Meta，无法提供社交媒体巨头希望购买的所有Gemini容量，限制仍然存在，其他谷歌客户也受到影响。 Meta是全球最大的企业AI客户之一；即使它也无法获得所需的全部计算能力，这表明全球短缺情况已变得多么严重。澳大利亚搜索公司Elastic的新研究显示，压力已经改变了当地企业对AI支出的思考。三分之一的澳大利亚组织在上一个财年超出了他们的AI预算，32%的人已暂停、取消或缩减部署，因为无法证明成本是合理的。Nvidia首席执行官黄仁勋在三月表示，如果一名50万美元（72.4万美元）开发者在令牌上花费少于25万美元，他将“深感不安”。据报道，Meta工程师在30天内消耗了超过60万亿个令牌，这一支出估计约为9亿美元，而Uber的首席技术官在四月份表示，该乘车共享公司在四个月内耗尽了其全年的AI预算。此后，亚马逊和Meta已删除了内部的令牌使用排行榜。“请不要仅仅出于使用AI的目的而使用AI，”高级副总裁大卫·特雷德维尔在五月对员工说道。该月，Uber的首席运营官在一档播客中表示，令牌使用与真正的生产力之间“尚未建立链接”。维持这样的速度所需的硬件并不存在。内存芯片制造商SK海力士、三星和美光已经售罄大部分高带宽内存的供应，AI模型依赖于此，同时自去年11月以来，Nvidia旧款H100图形处理单元的租赁价格上涨了约30%。为了在压力中生存，工程团队越来越多地放弃大规模基础模型，转向专业的小型语言模型和能够以较低成本在本地托管的替代品。德勤国家AI市场负责人大卫·阿隆索表示，构建物理基础设施的争夺战引发了前所未有的土地抢夺。以价值120亿美元计划在ASX上市的澳大利亚成立的Firmus表示，周一与Nvidia签署了一项协议，计划在印度尼西亚建立AI数据中心能力，预测将在首六年内产生250亿到300亿美元的收入。德勤澳大利亚国家AI市场负责人大卫·阿隆索表示，模型提供商已经从许可和订阅定价转向基于消费的定价，消除了使AI感觉便宜的隐性补贴。“这是AI补贴时代的结束，”阿隆索告诉本报记者。“Tokenmaxxing……现在本身变成了一个问题。”Elastic国家经理杰里米·佩尔表示，压力将迫使企业控制其AI成本。“因为需求超过了物理基础设施，基本的经济规律将会占据主导，令牌成本不可避免地会上升，”他说。阿隆索表示，这一变化并不意味着澳大利亚公司总的来说会减少AI支出。“如果说有什么，反而会……继续增长，……你的成本线很可能仍会增加，”他说。“但现在有了将其与价值联系起来的明确需求。”由Pure Profile进行的Elastic调查显示，当地企业尚未衡量他们的AI支出是否带来了成果。只有8%的决策者跟踪AI对收入或成本节约的贡献。然而，他们中的一半计划在接下来的12个月内增加AI支出，其中32%的人表示，只有在有了更明确的价值证明后才会这样做。杰里米·佩尔，Elastic澳大利亚和新西兰的国家经理。“在接下来的12个月里，我们预测AI使用将大幅转向对AI问责的严格监督，”佩尔说。“通过你的使用仪表板看起来有多繁忙来评估成功的时代已经正式结束。”阿隆索表示，澳大利亚有大约两年的“机会窗口”来吸引对本地数据中心能力的投资，这将使澳大利亚企业能够