外媒评论认为,AI 产业眼下面临的不只是芯片贵的问题,推理阶段不断上升的 token 消耗,也在把企业使用成本继续抬高。这种双重压力正从模型公司传导到更广泛的经济层面。
需求重心转向推理
过去几年,AI 芯片需求主要由模型训练推动。如今,需求重心正逐步转向推理。随着智能体类应用增加,单次任务不再是一次提问一次回答,而是拆成多步执行,计算量明显上升。
文章援引高盛预测称,到 2030 年,全球 token 消耗量可能增至每月 120 千万亿个,较当前水平大幅增长。与此同时,芯片还需要定期更新,才能维持成本竞争力,这使需求压力同时来自新增部署和设备替换。
企业预算压力已出现
文章提到,微软近期取消了大部分 Claude Code 直签许可,原因是员工对 AI 工具的使用规模过大,计算成本已经高到超过部分人力成本。Uber 也被指在 4 个月内用完了 2026 年 AI 编码工具预算。
Gartner 也警告称,即便推理成本下降 90%,企业 AI 总成本也未必同步下降。原因在于,智能体模型每项任务消耗的 token 更多,而服务商未必会把全部成本下降传导给客户。文章据此认为,企业可能会发现,AI 带来的生产力提升并没有想象中便宜。
高杠杆风险或被放大
文章认为,芯片供给短期内难以快速跟上需求。新建晶圆厂往往需要数十亿美元投入,建设周期也较长。与此同时,更先进芯片的制造步骤更多,材料和工艺成本也更高,通胀、地缘政治和贸易摩擦又进一步推升了价格。
在此背景下,AI 公司为了支撑资本开支,已经形成交叉投资、产能承诺和债务融资并行的结构。文章称,如果相关贷款以现有芯片作抵押,而企业收入增长又低于预期,一旦出现违约或债权人收紧融资,旧芯片可能集中流入市场,进一步压低抵押品价值。
文章认为,这种风险不只停留在单个公司层面。如果私募信贷、特殊目的载体和更广泛金融体系之间存在较深敞口,压力可能向外扩散。核心问题在于,支撑高额芯片投资的收入预期,建立在企业持续扩大 AI 使用的前提上,而这一前提已经出现放缓迹象。
文章提出三类应对方向
文章认为,缓解压力首先要从降低需求强度入手,包括改进算法、软件和硬件效率。文中提到,DeepSeek 已显示出算法优化可以明显减少算力需求。
其次是扩大芯片产能,并在供应链内部更广泛分摊建厂成本与风险。再次是审视关税、出口限制和金融监管对芯片价格及融资透明度的影响,避免高成本与高杠杆同时累积。
整体来看,这篇评论的核心判断是,AI 的商业化瓶颈未必首先出现在模型能力,而可能先出现在算力成本和 token 开销。如果企业开始主动限制使用量,行业此前建立的增长预期就会受到考验。