为什么AI令牌会再次让您的企业云账单飙升
imaginima/ iStock / Getty Images Plus via Getty Images 关注ZDNET:将我们添加为Google的首选来源。ZDNET的关键要点 AI使用正转向基于令牌的定价。令牌定价远比以前的固定费用模式要昂贵。衡量从AI中获得的价值仍然是一个未解决的问题。圣地亚哥 -- 几个月前,大多数人支付固定费用以获取AI访问权限。那是以前,这就是现在。AI定价作为亏损领导者的时代已经结束。正如在FinOps X 2026上大家讨论的那样,基于令牌的AI定价模型正成为整个生成AI经济的基础,并且它远比旧模式更昂贵。问问CoPilot的用户,他们对新的基于令牌的定价感到非常不满。对于许多企业客户来说,这让他们想起了云定价的早期阶段,当时他们不得不面对不稳定的账单和不断变动的商业模式。在混乱的背后,令牌正在悄然标准化实验室将稀缺的GPU容量转化为可计费单位、企业如何衡量AI使用情况以及软件供应商如何重新定价其产品的方式。此外:推出AI代理?四种快速而激进的方式 - 但要极其谨慎 令牌:AI的基本单位 在这个新世界中,令牌是AI工作的基本单位。FinOps基金会的执行主任J.R. Storment称其为“AI的原子单位”。在他的FinOps主题演讲中,Storment表示,“令牌在现代经济中所扮演的角色比现代历史上几乎任何其他商品都要多,也许,甚至可能比20世纪的石油更重要。”他告诉FinOps X的听众,令牌同时是“所有硬件、计算和数据中心的输出单位”、“实验室定价其输出和输入的方式”,以及“企业希望变现的价值单位”。这种抽象正是实验室和超大规模计算者喜欢它的原因。他们不是直接对GPU类型、内存和电力收费,而是可以在错综复杂的架构和部署拓扑中暴露出一个单位——每百万个令牌的价格。OpenAI、Anthropic、谷歌等现在发布每个模型的费率卡,为输入令牌(您发送给模型的所有内容)和输出令牌(模型生成的所有内容)分别定价,通常以每百万个令牌的美元报价。此外:构建无风险商业失败的代理AI策略 那么,令牌到底是什么呢?Storment表示,“AI令牌是大型语言模型(LLM)在处理时可以将单词或短语分解成的最小单位。”在模型处理文本之前,它会将其分解成片段,这个过程称为令牌化。对于英语,常用的经验法则是“一令牌大约为四个字符,或大约三个四分之一的单词”,所以“100个令牌≈75个单词”。令牌隐藏着巨大的复杂性。正如SAP的FinOps团队在他们的会议上所说,“您按令牌付费,而这个小令牌在可预测性下隐藏着巨大的复杂性”,从模型选择和量化到您使用缓存或代理的激进程度。这种复杂性正是FinOps团队如今被要求解码的内容。无限量令牌时代已经结束。如果2023至2025年初是廉价实验的时代,那么过去18个月就是一次无情的觉醒。Storment描述了三个不同的阶段:ChatGPT之前的“老AI时代”、聊天机器人“能写出不错代码”的“美好时光”,以及2025年11月之后的世界,当时主要模型发布“使AI从不错变得非常好”。在美好时光的无限量令牌和订阅时代,我们经历了一个短暂的令牌最大化期。然后每个人都对他们的令牌排行榜感到兴奋,显示谁的令牌使用量最多。如今,令牌排行榜显得很尴尬,因为没人能负担得起浪费令牌。正如亚马逊高级副总裁Dave Treadwell恳求的那样,“请不要仅仅为了使用AI而使用AI。”客观而言,Storment表示,从去年6月到11月,全球令牌使用量以“令人愉悦的线性路径”增长。然后那些新模型和代理模式横空出世。上下文窗口“一次对话中从几千个、几十万个甚至几百万个令牌爆炸式增长”,而“代理性场景的出现和爆炸,增加了循环、重试、修正和所有这些疯狂”。此外:自主业务即将到来。为什么这一转变对专业人士来说是个好消息 公司们曾愉快地补贴这种行为……直到他们看到账单。Storment回忆起一些“每月200美元”的重度用户在使用最新模型时成本“高达几万美元”。例如,AI分析公司SemiAnalysis最近估计,200美元的Anthropic计划曾经提供8,000美元的Claude令牌,而类似的OpenAI产品则提供14,000美元的Codex令牌。这些日子和价格已经结束。展望未来,公司们
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡