外媒:衡量大模型使用成本的 Token 支出指标近期回落,市场对 AI 的关注点正从“能力提升”转向“成本能否承受”。这一变化正在影响投资者对 GPU、存储芯片和数据中心扩张节奏的判断。
Token支出增速放缓
宏观策略师 Andreas Steno Larsen 在社交平台表示,Sil代币发行n Data 的 LLM Token 支出指数是当前值得关注的指标之一。该指数以支出加权,反映市场每百万个大模型 Token 的支付价格。由于 OpenAI、Anthropic 和谷歌等厂商普遍按用量收费,这类数据常被视为企业真实付费意愿的近端信号。
该指数自去年底快速上升,但在今年 5 月后出现回落。文章认为,这意味着企业继续为高成本前沿模型买单的力度可能减弱。一旦这种趋势持续,新增 GPU、DRAM 和数据中心采购背后的收入支撑也会随之走弱,原本建立在 Token 高增长上的资本开支预期将面临调整。
企业开始压缩无效消耗
报道提到,科技公司已开始整顿内部 AI 使用。亚马逊和微软近期都在收紧相关项目,原因是部分员工为了提升内部排名,刻意放大模型调用量,推高了算力成本。亚马逊高管随后要求员工不要为了使用 AI 而使用 AI,并下线了相关测试仪表盘。
企业客户的账单压力也在上升。Axios 援引 AI 顾问消息称,一家企业客户曾在单月为 Claude 支出 5 亿美元,原因是没有设置员工使用上限。文章据此认为,企业 AI 热潮正首次遭遇大规模成本约束,过去依靠补贴和宽松计费推动增长的模式开始承压。
按量计费正在普及
GitHub Copilot 已在 6 月 1 日调整为按 Token 用量计费。部分用户称,月度费用预估明显上升。GitHub 管理层此前表示,随着智能体 AI 增多,旧有定价方式已难以覆盖成本。Gartner 分析师也预计,更多企业软件将转向按用量收费。
文章认为,这一变化会让企业更直接地感受到推理成本,并压缩不必要的调用需求。如果客户开始按真实价格控制使用量,AI 基础设施链条上的收入预期也会被重新定价,尤其是高度依赖推理增长叙事的芯片和云服务板块。
低价模型分流需求
面对高昂成本,市场也在转向更便宜的模型。文章提到,DeepSeek 和小米 MiMo 等产品已大幅下调价格。Coinbase 首席执行官 Brian Armstrong 也预计,未来 12 到 18 个月内,大部分 AI 工作负载会迁移到成本更低的模型,只有少数任务继续使用最强模型。
与此同时,本地模型能力也在提升。Hugging Face 首席执行官 Clement Delangue 援引斯坦福大学数据称,本地模型在真实查询中的准确率已明显改善。文章据此认为,如果低价模型和本地部署持续替代高成本闭源模型,AI 产业的增长结构将从“堆算力”转向“控成本”。
不过,华尔街对这一趋势仍有分歧。乐观者认为,代理式 AI 仍会推动 Token 总量继续增长,并带动云服务利润改善;谨慎者则认为,当前产业链收益过度集中在上游半导体环节,若企业无法证明 AI 支出带来足够回报,算力扩张节奏可能进一步放缓。