文章摘要
2026年6月8日,阿里巴巴宣布合并通义大模型事业部和未来生活实验室,成立Token Foundry事业部,由CEO吴泳铭直接负责。此前3月已成立Alibaba Token Hub(ATH)事业群。周靖人升任首席科学家牵头AI未来研究院,郑波带队并入Token Foundry——表面是组织调整,底层是商业逻辑的根本转变:从「做最好的模型」到「卖最多的Token」。本文解读这次战略转型的技术基础、商业逻辑和行业影响。
一、Token Foundry:一个名字背后的商业革命
2026年6月8日,阿里巴巴完成了一次看似平静、实则深刻的AI组织架构重组:
- 合并通义大模型事业部 + 未来生活实验室 → 成立 Token Foundry 事业部
- CEO吴泳铭直接负责,信号明确:AI商业化是公司最高优先级
- 周靖人升任首席科学家,牵头成立AI未来研究院,专注前沿研究
- 郑波带领 Happy Horse、Happy Oyster 等团队并入 Token Foundry
这次调整最值得玩味的不是人事变动,而是命名本身:「Token Foundry」——代币工厂。
1.1 从「模型实验室」到「代币工厂」意味着什么?
| 维度 | 模型实验室时代 | 代币工厂时代 |
|---|---|---|
| 核心指标 | 模型性能(benchmark) | Token 吞吐量 |
| 商业模式 | 免费/补贴获客 | 按 Token 计费盈利 |
| 组织架构 | 研究导向 | 商业化导向 |
| 产品逻辑 | 做最好的模型 | 卖最多的算力 |
| 竞争策略 | 技术领先 | 成本+规模优势 |
这个命名转变揭示了一个底层逻辑:当 Qwen 系列模型已经跻身全球开源第一梯队时,单纯追求「更好的模型」已经不够——真正的壁垒变成了「以最低成本生产最多 Token」的工业化能力。
就像云计算从「实验室的服务器」变成了「按小时卖的算力」,AI 正在经历同样的工业化进程。
💡 一句话理解
⚠️ 常见踩坑
从研究导向转向商业化导向可能导致前沿研究人才流失。周靖人升任首席科学家是保护措施,但研究自由度和资源分配可能受限。
二、Qwen 的成熟为商业化铺平了道路
理解 Token Foundry 的前提是理解 Qwen 系列的成功。
2.1 Qwen 的成绩单
截至 2026 年 6 月,Qwen 系列已经建立了全球领先的开源 AI 生态:
- Qwen3.7 系列在多项 benchmark 上跻身全球前三,国内 Coding 能力第一
- Qwen-Coder 在代码生成任务上成为开发者首选开源模型之一
- Qwen-VL 多模态模型在企业场景大规模落地
- Hugging Face 下载量突破 10 亿次,全球开源模型下载量第一
这意味着什么? 模型能力已经「够用」了。当开源模型能达到商业模型 90% 的效果时,竞争焦点就转向了:
这三个问题的答案,都指向基础设施和工程能力——而不是模型架构本身。
2.2 为什么需要独立的事业部?
独立的 Token Foundry 事业部解决了一个关键的组织问题:研发和商业化的节奏冲突。
在同一个事业部里,研究团队追求「更好的模型」需要 3-6 个月的周期,而商业团队需要「每周降价」来抢客户。两种节奏在同一个组织里必然冲突。
拆分后的格局:
- Token Foundry:负责 Qwen 系列的商业化、API 服务、企业客户
- 首席科学家团队:负责下一代模型架构、前沿研究
这是经典的「exploit vs explore」组织解法——用独立团队分别处理「榨取现有价值」和「探索未来可能」。
💡 一句话理解
阿里此举与 Google 分拆 DeepMind 为 Google DeepMind + Gemini 团队的逻辑一致:当模型成熟后,商业化需要独立的组织和节奏。Token Foundry 与千问事业部、悟空事业部平行,均隶属 ATH 事业群。
⚠️ 常见踩坑
组织拆分不等于目标一致。Token Foundry 的短期收入压力可能挤压首席科学家团队的长期研究资源——这是所有大厂 AI 部门面临的经典矛盾。
三、算力经济的底层逻辑:为什么 Token 是新时代的「电」
Token Foundry 的核心假设是:Token 就是 AI 时代的电力。
3.1 Token 经济学
类比电力市场,Token 市场正在形成类似的结构:
| 电力市场 | Token 市场 |
|---|---|
| 发电厂 | 推理集群(GPU 农场) |
| 输电网 | API 网关 + 路由层 |
| 配电局 | 模型服务(按 Token 计费) |
| 用户 | 开发者 / 企业 |
| 度(kWh) | Token |
| 峰谷电价 | 动态定价(忙时/闲时) |
这个类比解释了为什么阿里用「Foundry(工厂)」命名——它不是在做一个产品,而是在建设一个基础设施。
3.2 规模效应与成本曲线
Token 的生产成本遵循一个独特的规模曲线:
- 模型固定成本:训练一次,推理无限次(边际成本趋零)
- 推理可变成本:GPU 时间 + 电力 + 带宽(随 Token 量线性增长)
- 网络效应:用户越多 → 反馈越多 → 模型越好 → 成本越低
阿里的战略赌注:通过 Qwen 的开源优势获取海量用户,再通过 Token Foundry 的规模化推理能力实现低成本生产,最终形成「开源获客 → 规模降本 → 定价优势 → 赢家通吃」的飞轮。
3.3 竞争对手的类似布局
这不是阿里一家的选择——整个行业都在向「Token 工厂」模式迁移:
Token 的边际成本持续下降:2024 年 1M Token 成本约 $10 → 2026 年部分场景降至 $0.5 以下
价格战已经开始:部分场景 Token 价格低于电力成本
差异化从模型能力转向服务质量(延迟、可靠性、合规)
企业客户关注的不再是「哪个模型最强」,而是「哪个 Token 最稳最便宜」
💡 一句话理解
四、对行业的影响:AI 产业正在「电力化」
阿里 Token Foundry 的成立,是 AI 产业「电力化」进程的一个缩影。
4.1 AI 产业的三个阶段
阶段 1:手工作坊(2022-2023)
- 每个项目都是定制开发
- 模型是稀缺资源,需要精调
- 成本极高,无法规模化
阶段 2:工业量产(2024-2025)
阶段 3:基础设施化(2026-)
- Token 变成标准商品
- 竞争焦点是「生产效率」和「分销能力」
- 类似电力市场,形成「发电-输电-配电」的产业链
4.2 对开发者的启示
对于 AI 开发者来说,Token 基础设施化意味着:
- 模型选择不再是核心决策 — 差异在缩小,选哪个都「够用」
- 成本优化成为关键技能 — 如何用更少的 Token 做更多的事
- Prompt Engineering 进化为 Token Engineering — 不只是写好提示词,而是设计整个 Token 消耗流程
- 本地推理 vs 云端推理的权衡 — 敏感数据本地处理,通用任务云端调用
4.3 对创业公司的影响
Token 商品化对创业公司是双刃剑:
利好:基础设施成本持续下降,创业门槛降低
威胁:如果你的核心壁垒只是「调用某个模型的 API」,那你的壁垒为零
生存策略:
💡 一句话理解
Token 基础设施化对行业是好事——它意味着 AI 能力正在变成像电力一样的通用基础设施,每个企业都能低成本使用。阿里 2026 财年 Q4 AI 相关产品收入 89.71 亿元,占云外部收入 30%。
五、总结:阿里 AI 战略转型的三个关键判断
Token Foundry 的成立基于三个关键判断:
判断 1:模型能力已经「够用」
Qwen 系列的成功证明阿里有能力做出世界级模型。继续追求 benchmark 第一的边际收益递减,不如把精力放在商业化。
判断 2:Token 将成为标准商品
就像云计算从「新奇概念」变成「基础设施」,AI Token 也在经历同样的进程。谁先建成「Token 工厂」,谁就占据先发优势。
判断 3:规模决定成本
Token 生产具有强烈的规模效应。用户越多 → 推理量越大 → 单位成本越低 → 定价越有竞争力 → 用户越多。这是一个必须抢占的飞轮。
对行业的启示:
阿里的转型不是个案——它是整个 AI 行业从「研究驱动」转向「商业驱动」的缩影。2026 年,所有 AI 公司都面临同样的选择:
- 继续做「最好的模型」(研究路线)
- 还是做「最便宜的 Token」(商业路线)
大多数公司会选择后者——因为前者只剩少数玩家能玩。
这就是 Token Foundry 真正告诉我们的:AI 的「电力时代」来了。
模型能力「够用」→ 竞争焦点从性能转向成本
Token 商品化 → AI 能力变成基础设施
规模效应 → 先发者建立成本壁垒
组织架构调整 → 研发和商业化分离,ATH 事业群统筹 Token 全生命周期
行业信号 → AI 从研究驱动转向商业驱动
💡 一句话理解