文章摘要
2026 年 6 月,路透社报道高通正以 80-100 亿美元洽谈收购 AI 芯片公司 Tenstorrent。这笔交易的核心不是产品,而是人——传奇芯片设计师 Jim Keller,以及 RISC-V 开放架构在数据中心的可能性。高通正从手机芯片巨头向数据中心 AI 基础设施转型,同时试图摆脱对 Arm 的依赖。本文深度解析这场收购背后的战略逻辑、RISC-V 在 AI 领域的崛起、以及英伟达垄断地位面临的结构性挑战。
1交易全景:100 亿美元买的是什么?
2026 年 6 月 15 日,The Information 率先报道:高通正在洽谈以 80-100 亿美元收购 Tenstorrent。 路透社随后跟进确认,但强调"谈判仍在进行中,价格可能变动,交易也可能失败"。高通和 Tenstorrent 均拒绝评论。
这笔交易的估值令行业侧目——一家 2016 年成立的芯片初创公司,凭什么值 100 亿美元?答案不在财务报表上,而在三个战略维度:
第一,Jim Keller 本人。 这位传奇芯片设计师的履历几乎就是过去 30 年芯片产业的缩影:AMD Zen 架构(让 AMD 起死回生)、苹果 A4/A5 芯片(iPhone 4/5 的核心)、特斯拉自动驾驶芯片(FSD 的算力基础)、DEC Alpha(90 年代最强 RISC 架构)。2016 年加入 Tenstorrent 后,他押注 RISC-V 开放架构,打造了一套全新的 AI 加速器设计哲学。
第二,RISC-V IP 储备。 Tenstorrent 拥有业界最成熟的 RISC-V 高性能核心设计——Ascalon 系列,专为数据中心和 AI 推理优化。2025 年底高通已经收购了另一家 RISC-V 公司 Ventana Micro Systems(估值 2-6 亿美元),但 Tenstorrent 的 AI 加速器能力是 Ventana 不具备的。
第三,Galaxy Blackhole 平台。 Tenstorrent 的旗舰产品——32 颗 Blackhole 加速器组成的 6U 机架式 AI 计算平台,每颗加速器集成 768 个 RISC-V 核心,运行自有软件栈。这不是 PPT 产品,2026 年初已经量产出货。
2高通的战略焦虑:为什么要摆脱 Arm?
高通对 Arm 的依赖是其最大的战略风险。 高通的 Snapdragon 处理器使用 Arm 指令集授权,自研的 Oryon CPU 核心也基于 Arm ISA。这意味着高通的数据中心战略命脉掌握在 Arm 及其大股东软银手中。
近年来双方关系持续恶化。2024 年,高通因 Arm 授权协议纠纷诉诸法律,最终在 Nuvia 收购案中获得胜诉。但这场诉讼让高通意识到:在 Arm 生态中,你永远是一个被许可人,而不是主人。
收购 Tenstorrent 为高通提供了一条退路:
| 维度 | Arm 生态 | RISC-V 生态 |
|---|---|---|
| 指令集授权 | 需付费授权,受 Arm 控制 | 开放免费,完全自主 |
| 定制自由度 | 受限于 Arm 许可条款 | 可深度定制微架构 |
| AI 优化 | 依赖 Arm 的 Neoverse 路线图 | 可针对 AI 负载定制 |
| 地缘风险 | Arm 被软银控股,日本背景 | 开源社区治理,中立 |
| 数据中心成熟度 | 高,AWS Graviton 已验证 | 中低,正在追赶 |
Bernstein 分析师 Michael Rodriguez 指出:"收购 Tenstorrent 将进一步增强高通在 CPU、定制 AI 加速器(ASIC)、服务器基础设施和 IP 产品方面的能力。"
高通的数据中心产品线也在快速成型:
- AI 200(2026 年):Hexagon NPU 技术,直接液冷,每卡最高 768GB LPDDR 内存,机架功耗约 160kW
- AI 250(2027 年初):近内存计算架构,有效内存带宽比 AI 200 提升 10 倍以上
- 新服务器 CPU:细节尚未公布,但 Tenstorrent 的 RISC-V 技术将成为关键拼图
💡 一句话理解
3Tenstorrent 的技术内核:RISC-V 凭什么做 AI?
RISC-V 不是为 AI 设计的——但 Tenstorrent 让它变成了 AI 利器。 传统 AI 加速器依赖 GPU 的 SIMD(单指令多数据)架构或专用 ASIC 的固定数据流。Tenstorrent 的方法完全不同:用 RISC-V 的通用计算灵活性来弥补专用硬件的刚性。
核心创新在于 Tensix 核心架构:
每个 Tensix 核心包含:
这种设计的优势是可编程性。GPU 的 Tensor Core 是固定功能的——你只能按 NVIDIA 定义的方式使用它。但 Tenstorrent 的 RISC-V 核心可以通过软件重新定义数据流,针对不同的模型架构(Transformer、CNN、MoE)优化执行路径。
Galaxy Blackhole 的规模化设计同样独特:
- 32 颗 Blackhole 加速器通过高速互联组成统一计算池
- 每颗加速器有 768 个 RISC-V 核心
- 总计 24,576 个 RISC-V 核心 / 机架
- 自有软件栈 TT-Metalium 直接操作硬件,绕过传统驱动层
Jim Keller 的设计哲学:"GPU 是为图形设计的,然后被强行用于 AI。我们从第一天就为 AI 设计——这意味着不同的数据流、不同的内存层次、不同的编程模型。"
4英伟达的护城河:CUDA 生态 vs 开放架构
英伟达的 AI 芯片垄断不是硬件优势,而是软件锁定。 CUDA 生态经过 15 年积累,拥有:
- 超过 400 万开发者
- 所有主流 AI 框架(PyTorch、TensorFlow、JAX)的原生支持
- 海量的预优化库(cuDNN、TensorRT、cuBLAS)
- 成熟的调试和性能分析工具链
挑战者面临的不是芯片性能问题,而是生态迁移成本。
但 2026 年的格局正在发生微妙变化:
1. 推理市场崛起
训练市场由 NVIDIA H100/B100 主导,但推理市场的规模正在超越训练。推理工作负载更多样化、延迟敏感、成本敏感——这恰恰是专用芯片的优势领域。
2. 软件抽象层成熟
MLIR(Multi-Level Intermediate Representation)、ONNX Runtime、Apache TVM 等编译框架正在降低硬件迁移成本。开发者写一次模型定义,编译器自动优化到不同硬件后端。
3. 大客户自研芯片
Google TPU、Amazon Trainium/Inferentia、Microsoft Maia——三大云厂商都在自研 AI 芯片。这些内部芯片不需要 CUDA 生态,因为它们有专门的团队做软件适配。
Tenstorrent 的定位很聪明: 它不试图正面挑战 NVIDIA 的训练市场,而是聚焦推理效率。在推理场景下,客户更关心每美元/每瓦特的吞吐量,而不是 CUDA 兼容性。
💡 一句话理解
关注 Tenstorrent 的软件栈 TT-Metalium 与 MLIR/ONNX 的集成进展。如果能在主流框架中实现'一键部署',将大幅降低迁移门槛。
5AI 芯片市场的五极格局
2026 年的 AI 芯片市场正在从英伟达独大走向五极格局:
| 极 | 代表 | 核心优势 | 主要市场 |
|---|---|---|---|
| 霸主 | NVIDIA | CUDA 生态 + 训练性能 | 训练 + 推理 |
| 云自研 | Google TPU / Amazon Trainium | 成本优势 + 内部闭环 | 自家云服务 |
| 挑战者 | AMD MI400 / Intel Gaudi 3 | 性价比 + 软件追赶 | 推理 + 边缘 |
| 新势力 | Tenstorrent / Cerebras / Groq | 架构创新 + 推理效率 | 推理专用 |
| 手机/边缘 | 高通 AI 200 / 联发科 | 能效比 + 端侧部署 | 边缘推理 |
高通收购 Tenstorrent 的独特之处在于:它是唯一一个横跨'新势力'和'边缘'两极的玩家。
如果整合成功,高通将拥有:
- Arm CPU(Oryon)+ RISC-V AI 加速器(Tenstorrent)+ Hexagon NPU + 5G 基带
- 从云端到边缘的完整 AI 计算栈
- 数据中心和移动设备共享的 AI IP
但整合风险同样巨大。 高通是一家以手机芯片为核心的公司,数据中心文化和手机芯片文化截然不同。Jim Keller 是否会留在高通长期任职?Tenstorrent 的开源文化能否适应高通的企业文化?这些都是未知数。
💡 一句话理解
投资视角:不要只看收购本身,关注后续整合。如果高通在 12 个月内推出整合了 Tenstorrent RISC-V 加速器的数据中心产品,说明整合顺利;如果拖延超过 18 个月,可能遇到文化冲突。
⚠️ 常见踩坑
芯片收购的历史成功率很低。Intel 收购 Altera、Altera 收购 NXP(失败)、NVIDIA 收购 Arm(失败)——大型芯片收购的整合难度常被低估。
6对中国 AI 产业的启示
高通收购 Tenstorrent 对中国 AI 芯片产业有三重启示:
第一,RISC-V 是中国 AI 芯片的战略机遇。
RISC-V 的开源中立性意味着它不受美国出口管制的直接限制(指令集本身是公开的)。中国已经在 RISC-V 领域投入大量资源——阿里平头哥的 C910/C920、赛昉科技的 JH7110 等。Tenstorrent 的 Tensix 架构设计思路值得深入研究。
第二,推理效率比训练性能更重要。
中国 AI 产业正在从"训练大模型"转向"部署大模型"。在推理场景下,每美元/每瓦特的效率直接决定商业可行性。国产 AI 芯片应该优先优化推理效率,而非追求训练峰值算力。
第三,软件栈是真正的护城河。
无论是 Tenstorrent 的 TT-Metalium 还是 NVIDIA 的 CUDA,最终决定芯片能否落地的不是硬件参数,而是软件生态的成熟度。国产 AI 芯片需要在 MLIR/ONNX 等编译框架上投入更多,降低从 CUDA 迁移的成本。
中国 AI 芯片的可行路径:
- 基于 RISC-V 开放架构设计 AI 加速器核心
- 聚焦推理效率而非训练峰值性能
- 深度集成 MLIR/ONNX 生态,降低迁移成本
- 在边缘场景(智能摄像头、自动驾驶、工业机器人)建立先发优势
⚠️ 常见踩坑
出口管制政策持续变化。即使 RISC-V 指令集本身不受限制,先进制程的代工能力(如台积电 3nm)仍受美国管控。