💡

文章摘要

2026 年 6 月,路透社报道高通正以 80-100 亿美元洽谈收购 AI 芯片公司 Tenstorrent。这笔交易的核心不是产品,而是人——传奇芯片设计师 Jim Keller,以及 RISC-V 开放架构在数据中心的可能性。高通正从手机芯片巨头向数据中心 AI 基础设施转型,同时试图摆脱对 Arm 的依赖。本文深度解析这场收购背后的战略逻辑、RISC-V 在 AI 领域的崛起、以及英伟达垄断地位面临的结构性挑战。

1交易全景:100 亿美元买的是什么?

2026 年 6 月 15 日,The Information 率先报道:高通正在洽谈以 80-100 亿美元收购 Tenstorrent。 路透社随后跟进确认,但强调"谈判仍在进行中,价格可能变动,交易也可能失败"。高通和 Tenstorrent 均拒绝评论。

这笔交易的估值令行业侧目——一家 2016 年成立的芯片初创公司,凭什么值 100 亿美元?答案不在财务报表上,而在三个战略维度:

第一,Jim Keller 本人。 这位传奇芯片设计师的履历几乎就是过去 30 年芯片产业的缩影:AMD Zen 架构(让 AMD 起死回生)、苹果 A4/A5 芯片(iPhone 4/5 的核心)、特斯拉自动驾驶芯片(FSD 的算力基础)、DEC Alpha(90 年代最强 RISC 架构)。2016 年加入 Tenstorrent 后,他押注 RISC-V 开放架构,打造了一套全新的 AI 加速器设计哲学。

第二,RISC-V IP 储备。 Tenstorrent 拥有业界最成熟的 RISC-V 高性能核心设计——Ascalon 系列,专为数据中心和 AI 推理优化。2025 年底高通已经收购了另一家 RISC-V 公司 Ventana Micro Systems(估值 2-6 亿美元),但 Tenstorrent 的 AI 加速器能力是 Ventana 不具备的。

第三,Galaxy Blackhole 平台。 Tenstorrent 的旗舰产品——32 颗 Blackhole 加速器组成的 6U 机架式 AI 计算平台,每颗加速器集成 768 个 RISC-V 核心,运行自有软件栈。这不是 PPT 产品,2026 年初已经量产出货。

图表加载中…

2高通的战略焦虑:为什么要摆脱 Arm?

高通对 Arm 的依赖是其最大的战略风险。 高通的 Snapdragon 处理器使用 Arm 指令集授权,自研的 Oryon CPU 核心也基于 Arm ISA。这意味着高通的数据中心战略命脉掌握在 Arm 及其大股东软银手中。

近年来双方关系持续恶化。2024 年,高通因 Arm 授权协议纠纷诉诸法律,最终在 Nuvia 收购案中获得胜诉。但这场诉讼让高通意识到:在 Arm 生态中,你永远是一个被许可人,而不是主人。

收购 Tenstorrent 为高通提供了一条退路:

维度 Arm 生态 RISC-V 生态
指令集授权 需付费授权,受 Arm 控制 开放免费,完全自主
定制自由度 受限于 Arm 许可条款 可深度定制微架构
AI 优化 依赖 Arm 的 Neoverse 路线图 可针对 AI 负载定制
地缘风险 Arm 被软银控股,日本背景 开源社区治理,中立
数据中心成熟度 高,AWS Graviton 已验证 中低,正在追赶

Bernstein 分析师 Michael Rodriguez 指出:"收购 Tenstorrent 将进一步增强高通在 CPU、定制 AI 加速器(ASIC)、服务器基础设施和 IP 产品方面的能力。"

高通的数据中心产品线也在快速成型:

  • AI 200(2026 年):Hexagon NPU 技术,直接液冷,每卡最高 768GB LPDDR 内存,机架功耗约 160kW
  • AI 250(2027 年初):近内存计算架构,有效内存带宽比 AI 200 提升 10 倍以上
  • 新服务器 CPU:细节尚未公布,但 Tenstorrent 的 RISC-V 技术将成为关键拼图

💡 一句话理解

关注高通 2026 年下半年的数据中心产品发布。如果 AI 200 与 Tenstorrent 的 RISC-V 加速器整合,将标志着首个 Arm+RISC-V 混合架构数据中心平台的诞生。

⚠️ 常见踩坑

RISC-V 在数据中心的软件生态远不如 CUDA 成熟。即使硬件效率更高,软件迁移成本仍是最大障碍。

3Tenstorrent 的技术内核:RISC-V 凭什么做 AI?

RISC-V 不是为 AI 设计的——但 Tenstorrent 让它变成了 AI 利器。 传统 AI 加速器依赖 GPU 的 SIMD(单指令多数据)架构或专用 ASIC 的固定数据流。Tenstorrent 的方法完全不同:用 RISC-V 的通用计算灵活性来弥补专用硬件的刚性。

核心创新在于 Tensix 核心架构:

每个 Tensix 核心包含:

  1. 6 个 RISC-V 处理器:处理控制流、数据调度和标量计算
  2. 矩阵乘法单元(MXM):执行 AI 推理的核心矩阵运算
  3. 软件定义的数据流:通过 RISC-V 程序动态调度数据在核心间的流动

这种设计的优势是可编程性。GPU 的 Tensor Core 是固定功能的——你只能按 NVIDIA 定义的方式使用它。但 Tenstorrent 的 RISC-V 核心可以通过软件重新定义数据流,针对不同的模型架构(TransformerCNNMoE)优化执行路径。

Galaxy Blackhole 的规模化设计同样独特:

  • 32 颗 Blackhole 加速器通过高速互联组成统一计算池
  • 每颗加速器有 768 个 RISC-V 核心
  • 总计 24,576 个 RISC-V 核心 / 机架
  • 自有软件栈 TT-Metalium 直接操作硬件,绕过传统驱动层

Jim Keller 的设计哲学:"GPU 是为图形设计的,然后被强行用于 AI。我们从第一天就为 AI 设计——这意味着不同的数据流、不同的内存层次、不同的编程模型。"

图表加载中…

4英伟达的护城河:CUDA 生态 vs 开放架构

英伟达的 AI 芯片垄断不是硬件优势,而是软件锁定。 CUDA 生态经过 15 年积累,拥有:

  • 超过 400 万开发者
  • 所有主流 AI 框架(PyTorchTensorFlow、JAX)的原生支持
  • 海量的预优化库(cuDNN、TensorRT、cuBLAS)
  • 成熟的调试和性能分析工具链

挑战者面临的不是芯片性能问题,而是生态迁移成本。

但 2026 年的格局正在发生微妙变化:

1. 推理市场崛起
训练市场由 NVIDIA H100/B100 主导,但推理市场的规模正在超越训练。推理工作负载更多样化、延迟敏感、成本敏感——这恰恰是专用芯片的优势领域。

2. 软件抽象层成熟
MLIR(Multi-Level Intermediate Representation)、ONNX Runtime、Apache TVM 等编译框架正在降低硬件迁移成本。开发者写一次模型定义,编译器自动优化到不同硬件后端。

3. 大客户自研芯片
Google TPU、Amazon Trainium/Inferentia、Microsoft Maia——三大云厂商都在自研 AI 芯片。这些内部芯片不需要 CUDA 生态,因为它们有专门的团队做软件适配。

Tenstorrent 的定位很聪明: 它不试图正面挑战 NVIDIA 的训练市场,而是聚焦推理效率。在推理场景下,客户更关心每美元/每瓦特的吞吐量,而不是 CUDA 兼容性。

💡 一句话理解

关注 Tenstorrent 的软件栈 TT-Metalium 与 MLIR/ONNX 的集成进展。如果能在主流框架中实现'一键部署',将大幅降低迁移门槛。

⚠️ 常见踩坑

CUDA 生态的护城河比看起来更深。很多企业的 AI 管线深度依赖 CUDA 特定库(如 TensorRT 的 INT8 量化),迁移到非 CUDA 平台需要大量工程投入。

5AI 芯片市场的五极格局

2026 年的 AI 芯片市场正在从英伟达独大走向五极格局:

代表 核心优势 主要市场
霸主 NVIDIA CUDA 生态 + 训练性能 训练 + 推理
云自研 Google TPU / Amazon Trainium 成本优势 + 内部闭环 自家云服务
挑战者 AMD MI400 / Intel Gaudi 3 性价比 + 软件追赶 推理 + 边缘
新势力 Tenstorrent / Cerebras / Groq 架构创新 + 推理效率 推理专用
手机/边缘 高通 AI 200 / 联发科 能效比 + 端侧部署 边缘推理

高通收购 Tenstorrent 的独特之处在于:它是唯一一个横跨'新势力'和'边缘'两极的玩家。

如果整合成功,高通将拥有:

  • Arm CPU(Oryon)+ RISC-V AI 加速器(Tenstorrent)+ Hexagon NPU + 5G 基带
  • 从云端到边缘的完整 AI 计算栈
  • 数据中心和移动设备共享的 AI IP

但整合风险同样巨大。 高通是一家以手机芯片为核心的公司,数据中心文化和手机芯片文化截然不同。Jim Keller 是否会留在高通长期任职?Tenstorrent 的开源文化能否适应高通的企业文化?这些都是未知数。

💡 一句话理解

投资视角:不要只看收购本身,关注后续整合。如果高通在 12 个月内推出整合了 Tenstorrent RISC-V 加速器的数据中心产品,说明整合顺利;如果拖延超过 18 个月,可能遇到文化冲突。

⚠️ 常见踩坑

芯片收购的历史成功率很低。Intel 收购 Altera、Altera 收购 NXP(失败)、NVIDIA 收购 Arm(失败)——大型芯片收购的整合难度常被低估。

6对中国 AI 产业的启示

高通收购 Tenstorrent 对中国 AI 芯片产业有三重启示:

第一,RISC-V 是中国 AI 芯片的战略机遇。
RISC-V 的开源中立性意味着它不受美国出口管制的直接限制(指令集本身是公开的)。中国已经在 RISC-V 领域投入大量资源——阿里平头哥的 C910/C920、赛昉科技的 JH7110 等。Tenstorrent 的 Tensix 架构设计思路值得深入研究。

第二,推理效率比训练性能更重要。
中国 AI 产业正在从"训练大模型"转向"部署大模型"。在推理场景下,每美元/每瓦特的效率直接决定商业可行性。国产 AI 芯片应该优先优化推理效率,而非追求训练峰值算力。

第三,软件栈是真正的护城河。
无论是 Tenstorrent 的 TT-Metalium 还是 NVIDIA 的 CUDA,最终决定芯片能否落地的不是硬件参数,而是软件生态的成熟度。国产 AI 芯片需要在 MLIR/ONNX 等编译框架上投入更多,降低从 CUDA 迁移的成本。

中国 AI 芯片的可行路径:

  1. 基于 RISC-V 开放架构设计 AI 加速器核心
  2. 聚焦推理效率而非训练峰值性能
  3. 深度集成 MLIR/ONNX 生态,降低迁移成本
  4. 在边缘场景(智能摄像头、自动驾驶、工业机器人)建立先发优势

💡 一句话理解

关注阿里平头哥和中科院计算所在 RISC-V AI 加速方面的最新进展。中国有全球最大的 RISC-V 开发者社区之一。

⚠️ 常见踩坑

出口管制政策持续变化。即使 RISC-V 指令集本身不受限制,先进制程的代工能力(如台积电 3nm)仍受美国管控。