行业2 天前·文汇报 + 科学网

中国日均Token调用量突破140万亿,两年增长超千倍,大模型厂商集体涨价

国家数据局数据显示,中国日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿,两年增长超千倍。AI智能体的爆发式应用是主要驱动力。多家大模型厂商几乎同步调价,最高涨幅达463%。腾讯云Tencent HY2.0 Instruct涨幅最大,阿里云、百度智能云、智谱等跟进。业界认为大模型免费时代已基本翻篇。

Token通胀:AI免费时代终结

2026年3月,中国日均Token调用量突破140万亿。

数据爆炸

  • 2024年初:1000亿Token/日
  • 2026年3月:140万亿Token/日
  • 两年增长:超1000倍

集体涨价

  • 智谱:GLM Coding Plan涨价30%起
  • 腾讯云:Tencent HY2.0 Instruct涨幅463%
  • 阿里云:算力卡涨价5%-34%,CPFS智算版涨30%
  • 百度智能云:AI算力服务涨5%-30%

Harness Engineering新范式

  • 百度DuMate(搭子):原生内置安全沙箱
  • 字节ArkClaw:框架和模型趋同进化
  • 德勤报告:80%企业部署AI,仅15%规模化应用

来源: 文汇报 + 科学网
链接: https://news.sciencenet.cn/htmlnews/2026/4/562627.shtm

AI Master 解读

核心事件

中国Token调用量两年千倍增长,大模型厂商集体涨价标志着免费时代结束,行业进入商业化新阶段。

行业影响

涨价的根本原因是AI智能体的爆发:智能体需要复杂的任务执行、长程推理、自我纠错和工具调用,每次复杂操作背后都是海量Token在燃烧。这迫使厂商从价格战转向价值定价。Harness Engineering成为新范式,通过为AI智能体构建运行环境和约束规则,不同Harness设计的Token消耗可能差出数倍。

AI Master 建议

在Token涨价潮中,企业应评估Harness工程实施方案,通过优化Agent执行框架来降低Token消耗。关注Token成本管控工具和服务的需求增长。