外媒：AI芯片与Token成本或挤压行业扩张

分类：要闻 | 时间：2026-05-30 20:52 | 关注

　　外媒评论认为，AI 产业眼下面临的不只是芯片贵的问题，推理阶段不断上升的 token 消耗，也在把企业使用成本继续抬高。这种双重压力正从模型公司传导到更广泛的经济层面。

　　需求重心转向推理

　　过去几年，AI 芯片需求主要由模型训练推动。如今，需求重心正逐步转向推理。随着智能体类应用增加，单次任务不再是一次提问一次回答，而是拆成多步执行，计算量明显上升。

　　文章援引高盛预测称，到 2030 年，全球 token 消耗量可能增至每月 120 千万亿个，较当前水平大幅增长。与此同时，芯片还需要定期更新，才能维持成本竞争力，这使需求压力同时来自新增部署和设备替换。

　　企业预算压力已出现

　　文章提到，微软近期取消了大部分 Claude Code 直签许可，原因是员工对 AI 工具的使用规模过大，计算成本已经高到超过部分人力成本。Uber 也被指在 4 个月内用完了 2026 年 AI 编码工具预算。

　　 Gartner 也警告称，即便推理成本下降 90%，企业 AI 总成本也未必同步下降。原因在于，智能体模型每项任务消耗的 token 更多，而服务商未必会把全部成本下降传导给客户。文章据此认为，企业可能会发现，AI 带来的生产力提升并没有想象中便宜。

　　高杠杆风险或被放大

　　文章认为，芯片供给短期内难以快速跟上需求。新建晶圆厂往往需要数十亿美元投入，建设周期也较长。与此同时，更先进芯片的制造步骤更多，材料和工艺成本也更高，通胀、地缘政治和贸易摩擦又进一步推升了价格。

　　在此背景下，AI 公司为了支撑资本开支，已经形成交叉投资、产能承诺和债务融资并行的结构。文章称，如果相关贷款以现有芯片作抵押，而企业收入增长又低于预期，一旦出现违约或债权人收紧融资，旧芯片可能集中流入市场，进一步压低抵押品价值。

　　文章认为，这种风险不只停留在单个公司层面。如果私募信贷、特殊目的载体和更广泛金融体系之间存在较深敞口，压力可能向外扩散。核心问题在于，支撑高额芯片投资的收入预期，建立在企业持续扩大 AI 使用的前提上，而这一前提已经出现放缓迹象。

　　文章提出三类应对方向

　　文章认为，缓解压力首先要从降低需求强度入手，包括改进算法、软件和硬件效率。文中提到，DeepSeek 已显示出算法优化可以明显减少算力需求。

　　其次是扩大芯片产能，并在供应链内部更广泛分摊建厂成本与风险。再次是审视关税、出口限制和金融监管对芯片价格及融资透明度的影响，避免高成本与高杠杆同时累积。

　　整体来看，这篇评论的核心判断是，AI 的商业化瓶颈未必首先出现在模型能力，而可能先出现在算力成本和 token 开销。如果企业开始主动限制使用量，行业此前建立的增长预期就会受到考验。

温馨提示：内容仅供参考