Token通胀:AI免费时代终结
2026年3月,中国日均Token调用量突破140万亿。
数据爆炸
- 2024年初:1000亿Token/日
- 2026年3月:140万亿Token/日
- 两年增长:超1000倍
集体涨价
- 智谱:GLM Coding Plan涨价30%起
- 腾讯云:Tencent HY2.0 Instruct涨幅463%
- 阿里云:算力卡涨价5%-34%,CPFS智算版涨30%
- 百度智能云:AI算力服务涨5%-30%
Harness Engineering新范式
- 百度DuMate(搭子):原生内置安全沙箱
- 字节ArkClaw:框架和模型趋同进化
- 德勤报告:80%企业部署AI,仅15%规模化应用
来源: 文汇报 + 科学网
链接: https://news.sciencenet.cn/htmlnews/2026/4/562627.shtm
AI Master 解读
核心事件
中国Token调用量两年千倍增长,大模型厂商集体涨价标志着免费时代结束,行业进入商业化新阶段。
行业影响
涨价的根本原因是AI智能体的爆发:智能体需要复杂的任务执行、长程推理、自我纠错和工具调用,每次复杂操作背后都是海量Token在燃烧。这迫使厂商从价格战转向价值定价。Harness Engineering成为新范式,通过为AI智能体构建运行环境和约束规则,不同Harness设计的Token消耗可能差出数倍。
AI Master 建议
在Token涨价潮中,企业应评估Harness工程实施方案,通过优化Agent执行框架来降低Token消耗。关注Token成本管控工具和服务的需求增长。