💡

文章摘要

2026年6月8日,阿里巴巴宣布合并通义大模型事业部和未来生活实验室,成立Token Foundry事业部,由CEO吴泳铭直接负责。此前3月已成立Alibaba Token Hub(ATH)事业群。周靖人升任首席科学家牵头AI未来研究院,郑波带队并入Token Foundry——表面是组织调整,底层是商业逻辑的根本转变:从「做最好的模型」到「卖最多的Token」。本文解读这次战略转型的技术基础、商业逻辑和行业影响。

一、Token Foundry:一个名字背后的商业革命

2026年6月8日,阿里巴巴完成了一次看似平静、实则深刻的AI组织架构重组:

  • 合并通义大模型事业部 + 未来生活实验室 → 成立 Token Foundry 事业部
  • CEO吴泳铭直接负责,信号明确:AI商业化是公司最高优先级
  • 周靖人升任首席科学家,牵头成立AI未来研究院,专注前沿研究
  • 郑波带领 Happy Horse、Happy Oyster 等团队并入 Token Foundry

这次调整最值得玩味的不是人事变动,而是命名本身:「Token Foundry」——代币工厂。

1.1 从「模型实验室」到「代币工厂」意味着什么?

维度 模型实验室时代 代币工厂时代
核心指标 模型性能(benchmark Token 吞吐量
商业模式 免费/补贴获客 Token 计费盈利
组织架构 研究导向 商业化导向
产品逻辑 做最好的模型 卖最多的算力
竞争策略 技术领先 成本+规模优势

这个命名转变揭示了一个底层逻辑:当 Qwen 系列模型已经跻身全球开源第一梯队时,单纯追求「更好的模型」已经不够——真正的壁垒变成了「以最低成本生产最多 Token」的工业化能力

就像云计算从「实验室的服务器」变成了「按小时卖的算力」,AI 正在经历同样的工业化进程。

图表加载中…

💡 一句话理解

Token Foundry 的命名不是营销话术——它暗示了阿里 AI 的核心 KPI 已经从「模型 benchmark」变成了「Token 日产量」。此前 3 月成立的 ATH 事业群已埋下伏笔。

⚠️ 常见踩坑

从研究导向转向商业化导向可能导致前沿研究人才流失。周靖人升任首席科学家是保护措施,但研究自由度和资源分配可能受限。

二、Qwen 的成熟为商业化铺平了道路

理解 Token Foundry 的前提是理解 Qwen 系列的成功

2.1 Qwen 的成绩单

截至 2026 年 6 月,Qwen 系列已经建立了全球领先的开源 AI 生态:

  • Qwen3.7 系列在多项 benchmark 上跻身全球前三,国内 Coding 能力第一
  • Qwen-Coder 在代码生成任务上成为开发者首选开源模型之一
  • Qwen-VL 多模态模型在企业场景大规模落地
  • Hugging Face 下载量突破 10 亿次,全球开源模型下载量第一

这意味着什么? 模型能力已经「够用」了。当开源模型能达到商业模型 90% 的效果时,竞争焦点就转向了:

  1. 推理成本:谁的 Token 更便宜?
  2. 推理速度:谁的延迟更低?
  3. 规模化能力:谁能稳定服务百万级并发?

这三个问题的答案,都指向基础设施和工程能力——而不是模型架构本身。

2.2 为什么需要独立的事业部?

独立的 Token Foundry 事业部解决了一个关键的组织问题:研发和商业化的节奏冲突

在同一个事业部里,研究团队追求「更好的模型」需要 3-6 个月的周期,而商业团队需要「每周降价」来抢客户。两种节奏在同一个组织里必然冲突。

拆分后的格局

  • Token Foundry:负责 Qwen 系列的商业化、API 服务、企业客户
  • 首席科学家团队:负责下一代模型架构、前沿研究

这是经典的「exploit vs explore」组织解法——用独立团队分别处理「榨取现有价值」和「探索未来可能」。

图表加载中…

💡 一句话理解

阿里此举与 Google 分拆 DeepMind 为 Google DeepMind + Gemini 团队的逻辑一致:当模型成熟后,商业化需要独立的组织和节奏。Token Foundry 与千问事业部、悟空事业部平行,均隶属 ATH 事业群。

⚠️ 常见踩坑

组织拆分不等于目标一致。Token Foundry 的短期收入压力可能挤压首席科学家团队的长期研究资源——这是所有大厂 AI 部门面临的经典矛盾。

三、算力经济的底层逻辑:为什么 Token 是新时代的「电」

Token Foundry 的核心假设是:Token 就是 AI 时代的电力

3.1 Token 经济学

类比电力市场,Token 市场正在形成类似的结构:

电力市场 Token 市场
发电厂 推理集群(GPU 农场)
输电网 API 网关 + 路由层
配电局 模型服务(按 Token 计费)
用户 开发者 / 企业
度(kWh) Token
峰谷电价 动态定价(忙时/闲时)

这个类比解释了为什么阿里用「Foundry(工厂)」命名——它不是在做一个产品,而是在建设一个基础设施

3.2 规模效应与成本曲线

Token 的生产成本遵循一个独特的规模曲线:

  1. 模型固定成本:训练一次,推理无限次(边际成本趋零)
  2. 推理可变成本:GPU 时间 + 电力 + 带宽(随 Token 量线性增长)
  3. 网络效应:用户越多 → 反馈越多 → 模型越好 → 成本越低

阿里的战略赌注:通过 Qwen 的开源优势获取海量用户,再通过 Token Foundry 的规模化推理能力实现低成本生产,最终形成「开源获客 → 规模降本 → 定价优势 → 赢家通吃」的飞轮。

3.3 竞争对手的类似布局

这不是阿里一家的选择——整个行业都在向「Token 工厂」模式迁移:

  • OpenAI:从非营利转向营利,核心就是 Token 销售
  • Google:Gemini API 定价战,本质是 Token 价格战
  • 字节跳动:豆包大模型免费策略,用 Token 补贴换市场份额
  • AWS/Azure:Bedrock/Azure AI 本质是 Token 的分销渠道
  • Token 的边际成本持续下降:2024 年 1M Token 成本约 $10 → 2026 年部分场景降至 $0.5 以下

  • 价格战已经开始:部分场景 Token 价格低于电力成本

  • 差异化从模型能力转向服务质量(延迟、可靠性、合规)

  • 企业客户关注的不再是「哪个模型最强」,而是「哪个 Token 最稳最便宜」

💡 一句话理解

Token 经济的本质是「算力商品化」。当 Token 变成标准商品时,竞争壁垒在于生产效率(推理优化)和分销渠道(云平台集成),而不是模型本身。阿里 2026 财年 Q4 AI 相关产品收入 89.71 亿元,占云外部收入 30%,连续 11 个季度三位数增长。

⚠️ 常见踩坑

Token 价格战可能导致全行业亏损。2026 年多家 AI 公司 Token 售价低于生产成本——这是不可持续的补贴状态。阿里凭借平头哥芯片 + 自研模型的垂直整合,在成本控制上具备独特优势。

四、对行业的影响:AI 产业正在「电力化」

阿里 Token Foundry 的成立,是 AI 产业「电力化」进程的一个缩影。

4.1 AI 产业的三个阶段

阶段 1:手工作坊(2022-2023)

  • 每个项目都是定制开发
  • 模型是稀缺资源,需要精调
  • 成本极高,无法规模化

阶段 2:工业量产(2024-2025)

  • 基础模型「够用」,微调需求下降
  • API 标准化Token 成为计量单位
  • 开源模型涌现,模型不再是瓶颈

阶段 3:基础设施化(2026-)

  • Token 变成标准商品
  • 竞争焦点是「生产效率」和「分销能力」
  • 类似电力市场,形成「发电-输电-配电」的产业链

4.2 对开发者的启示

对于 AI 开发者来说,Token 基础设施化意味着:

  1. 模型选择不再是核心决策 — 差异在缩小,选哪个都「够用」
  2. 成本优化成为关键技能 — 如何用更少的 Token 做更多的事
  3. Prompt Engineering 进化为 Token Engineering — 不只是写好提示词,而是设计整个 Token 消耗流程
  4. 本地推理 vs 云端推理的权衡 — 敏感数据本地处理,通用任务云端调用

4.3 对创业公司的影响

Token 商品化对创业公司是双刃剑:

利好:基础设施成本持续下降,创业门槛降低
威胁:如果你的核心壁垒只是「调用某个模型的 API」,那你的壁垒为零

生存策略

  • Token 之上构建领域知识和数据壁垒
  • Token 的「应用层」而不是「基础层」
  • 利用 Token 成本下降的红利,创造新的用户场景
图表加载中…

💡 一句话理解

Token 基础设施化对行业是好事——它意味着 AI 能力正在变成像电力一样的通用基础设施,每个企业都能低成本使用。阿里 2026 财年 Q4 AI 相关产品收入 89.71 亿元,占云外部收入 30%。

⚠️ 常见踩坑

基础设施化的另一面是「commoditization(商品化)」——如果你的产品只是 Token 的简单包装,你将被价格战碾碎。阿里的策略是在 Token 之上构建完整的应用生态(千问、悟空、Happy Horse 等)。

五、总结:阿里 AI 战略转型的三个关键判断

Token Foundry 的成立基于三个关键判断:

判断 1:模型能力已经「够用」
Qwen 系列的成功证明阿里有能力做出世界级模型。继续追求 benchmark 第一的边际收益递减,不如把精力放在商业化。

判断 2:Token 将成为标准商品
就像云计算从「新奇概念」变成「基础设施」,AI Token 也在经历同样的进程。谁先建成「Token 工厂」,谁就占据先发优势。

判断 3:规模决定成本
Token 生产具有强烈的规模效应。用户越多 → 推理量越大 → 单位成本越低 → 定价越有竞争力 → 用户越多。这是一个必须抢占的飞轮。

对行业的启示

阿里的转型不是个案——它是整个 AI 行业从「研究驱动」转向「商业驱动」的缩影。2026 年,所有 AI 公司都面临同样的选择:

  • 继续做「最好的模型」(研究路线)
  • 还是做「最便宜的 Token」(商业路线)

大多数公司会选择后者——因为前者只剩少数玩家能玩。

这就是 Token Foundry 真正告诉我们的:AI 的「电力时代」来了。

  • 模型能力「够用」→ 竞争焦点从性能转向成本

  • Token 商品化 → AI 能力变成基础设施

  • 规模效应 → 先发者建立成本壁垒

  • 组织架构调整 → 研发和商业化分离,ATH 事业群统筹 Token 全生命周期

  • 行业信号 → AI 从研究驱动转向商业驱动

💡 一句话理解

观察 AI 公司的战略方向,看它的组织架构调整比看它的新闻稿更准确。组织跟着钱走,钱跟着战略走。从 3 月成立 ATH 事业群到 6 月成立 Token Foundry,阿里的 AI 商业化节奏明显加快。

⚠️ 常见踩坑

过度追求 Token 产量可能导致质量下降。在价格战中保持服务质量,是 Token Foundry 面临的核心挑战。阿里 AI 相关产品 ARR 已突破 358 亿元。