💡

文章摘要

2026年6月1日,NVIDIA CEO黄仁勋在GTC Taipei/COMPUTEX 2026主题演讲中发布RTX Spark超级芯片——这是NVIDIA时隔十余年再次挑战PC处理器领域,将Blackwell GPU与20核Grace CPU集成于单一SoC,支持128GB统一内存和1 petaflop AI算力。本文系统解读RTX Spark的硬件架构、与微软合作的AI代理平台生态、Windows on Arm战略意义,以及对PC行业格局的深远影响。

前置阅读收获

读完本文,你将理解:NVIDIA RTX Spark超级芯片的完整架构(20核Arm CPU + Blackwell GPU + 600GB/s NVLink-C2C + 128GB统一内存)、NVIDIA与微软三年合作的AI代理平台(OpenShell沙箱运行时 + Windows安全原语)、RTX Spark对PC行业格局的影响(终结高通Windows on Arm独占 + 挑战Apple Silicon),以及消费级AI Agent时代的技术基础

2026年6月1日,NVIDIA CEO黄仁勋在台北音乐中心发表COMPUTEX 2026主题演讲,正式发布RTX Spark超级芯片。这是NVIDIA自Windows RT时代以来,时隔十余年再次挑战PC处理器领域。RTX Spark基于与联发科合作的GB10架构衍生而来,集成700亿颗晶体管(台积电3nm工艺),搭载Blackwell架构GPU(6,144个CUDA核心)和20核Grace CPU(10×Cortex-X925性能核 + 10×Cortex-A725能效核),支持最高128GB LPDDR5X统一内存1 petaflop FP4 AI算力。微软与NVIDIA为此已联合研发三年,搭载该芯片的PC将运行专为AI代理设计的Windows版本,首批设备将于2026年秋季上市。

本文所有技术数据均来自NVIDIA官方新闻稿(nvidianews.nvidia.com)、PCMag、Tom's Hardware、TechPowerUp、Hothardware等权威信源,经交叉验证。

💡 一句话理解

如果你对AI硬件架构、Windows on Arm生态、或本地AI Agent部署感兴趣,本文将提供从芯片设计到平台生态的完整分析框架。建议重点关注第三章「AI代理平台」和第五章「行业影响」。

⚠️ 常见踩坑

RTX Spark设备尚未正式发售,本文所有规格和发布时间均基于官方发布会信息,最终产品性能以实际测试为准。价格尚未公布,可能显著影响市场定位。

一、RTX Spark 诞生的背景:NVIDIA 为何重返 PC 芯片市场

理解RTX Spark的战略意义,需要回顾NVIDIA在PC芯片市场的两次尝试一个关键转折

第一次尝试:Tegra 时代(2011-2013)

NVIDIA曾在Windows RT时代推出基于Tegra架构的PC处理器,目标是挑战x86垄断。但Windows RT生态贫乏、应用兼容性差,最终以失败告终。这次失败让NVIDIA退出了PC处理器市场,转而专注于GPU和数据中心。

第二次尝试:Grace CPU 时代(2021-2025)

2021年,NVIDIA宣布与联发科合作开发Arm架构PC处理器。这一阶段的核心成果是GB10超级芯片——为DGX Spark迷你AI工作站设计的SoC,集成Grace CPU和Blackwell GPU,面向AI研究人员和开发者。DGX Spark运行定制版Ubuntu Linux,不是消费级产品

关键转折:AI Agent 范式(2025-2026)

黄仁勋在COMPUTEX演讲中描述了一个场景:用户在本地AI代理的协助下,自主操作Photoshop和Blender完成从场地建模到材质渲染的全流程。"PC正在被重新发明,"他说,"就像手机变成智能手机,十年后每个家庭都会有一台AI超级计算机。"

这个判断背后是一个关键洞察:AI Agent需要本地算力。当前的AI体验依赖云端API调用——延迟高、隐私风险大、离线不可用。如果要在PC上运行200B参数级别的AI模型(支持百万token上下文窗口),必须有足够强大的本地算力和超大统一内存。

RTX Spark就是为此而生:它不是传统意义上的"AI PC"贴纸产品,而是从芯片设计到操作系统都围绕AI代理工作负载重新定义的计算平台。

来源交叉验证:NVIDIA官方新闻稿确认三年微软合作;黄仁勋演讲引用自PCMag和Tom's Hardware现场报道;DGX Spark对比来自TechPowerUp技术分析。

图表加载中…

💡 一句话理解

理解RTX Spark的定位时,不要把它和传统PC芯片直接对比。RTX Spark的核心优势不是CPU性能跑分,而是GPU+CPU+统一内存+AI软件栈的协同——这是x86处理器无法复制的全栈优势。

⚠️ 常见踩坑

NVIDIA上一次Windows芯片尝试(Windows RT)失败了。虽然今天Windows on Arm生态已大幅改善,但x86兼容性游戏生态仍是挑战。RTX Spark的实际表现取决于Windows应用的Arm原生适配进度,这需要时间。

二、RTX Spark 芯片架构深度解析

RTX Spark(内部代号N1/N1X)是一颗双芯粒(chiplet)SoC,由NVIDIA设计的GPU芯粒和联发科设计的CPU+I/O芯粒通过高速硅桥互连。

2.1 CPU 部分:20 核 Arm Grace CPU

RTX Spark的CPU部分基于Arm v9架构,包含两种核心:

-10× Cortex-X925 性能核心:最高频率4.1 GHz,面向高吞吐工作负载(AI推理、编译、视频编码)
-10× Cortex-A725 能效核心:面向后台任务和低功耗场景

这种big.LITTLE架构设计与高通Snapdragon X系列类似,但RTX Spark的性能核心数量更多、频率更高。Cortex-X925是Arm 2024年发布的最新高性能核心设计,IPC(每时钟周期指令数)相比上一代提升约20%

来源:CPU核心规格来自Hothardware和Cool3c对NVIDIA GTC Taipei演讲的技术解读。

2.2 GPU 部分:Blackwell 架构 RTX GPU

GPU芯粒基于NVIDIABlackwell架构,规格如下:

-6,144个CUDA核心(着色器核心),性能接近独立显卡GeForce RTX 5070
-第五代Tensor Core:支持FP4精度,提供1 petaflopAI算力
-完整NVIDIA软件栈CUDA、TensorRT、NVFP4、DLSS 4.5、RTX光线追踪、Reflex、G-SYNC

关键突破在于:这是一颗集成在CPU SoC中的GPU,却拥有接近中高端独立显卡的性能。在传统PC中,RTX 5070是独立显卡,功耗约200W;而RTX Spark将同等级性能集成到单芯片中,TDP显著降低。

来源:GPU规格来自TechPowerUp和Tom's Hardware技术分析,DLSS 4.5确认来自NVIDIA官方新闻稿。

2.3 互连与内存:NVLink-C2C + 128GB 统一内存

RTX Spark最核心的差异化特性是统一内存架构(UMA)

-LPDDR5X内存:最高128GB,带宽约 300 GB/s(LPDDR5X),NVLink-C2C 互连带宽600 GB/s
-NVLink-C2C互连:CPU芯粒与GPU芯粒之间通过高速互连桥接
-CPU和GPU共享内存池:GPU可直接访问全部128GB内存,无需传统"显存"限制

这意味着RTX Spark可以在本地运行高达200B参数的AI模型,支持百万token级别的上下文窗口。相比之下,传统消费级GPU的显存通常在8-24GB之间,即使使用系统内存作为扩展,带宽也远不及统一内存。

统一内存 vs 传统分离内存架构对比:

维度 RTX Spark 统一内存 传统 PC 分离内存
CPU可用内存 128GB 128GB
GPU可用内存 128GB(全部) 8-24GB显存
内存带宽 ~300 GB/s(NVLink-C2C 互连带宽 600 GB/s) DDR5: ~50GB/s + PCIe: ~64GB/s
数据拷贝开销 零拷贝 需在系统内存和显存间拷贝
最大本地模型 ~200B参数 ~13B-20B参数(受显存限制)
图表加载中…

💡 一句话理解

128GB统一内存是RTX Spark最大的技术亮点。对AI开发者而言,这意味着你可以在轻薄本上本地运行接近GPT-4级别的模型,而无需依赖云端API。对于本地Agent工作流(需要加载多个模型+长期记忆+工具定义),128GB是真正的分水岭。

⚠️ 常见踩坑

统一内存意味着CPU和GPU共享带宽。当GPU进行大规模AI推理时,CPU的内存访问性能可能受到影响。对于需要CPU和GPU同时高负载的任务(如一边做视频编码一边跑AI推理),需要关注内存带宽的争用问题。

三、NVIDIA × 微软:三年合作的 AI 代理平台

RTX Spark不只是芯片,更是一个AI代理操作系统平台。NVIDIA与微软的合作已持续三年,目标是将Windows从"工具型OS"转变为"AI代理原生OS"。

3.1 OpenShell:AI 代理运行时

NVIDIA发布的OpenShell是一个本地AI代理运行时环境,核心功能包括:

-沙箱隔离:Agent在隔离环境中运行,无法直接访问用户文件或系统资源,除非用户授权
-工具调用:Agent可以通过标准化的API调用本地应用程序(Photoshop、Blender、浏览器等)
-权限管理:用户可以设置Agent的权限等级——只读、读写、完全控制
-多模型支持:OpenShell支持加载不同模型(本地部署的开源模型或云端API),Agent可根据任务自动选择

黄仁勋在演讲中演示了一个建筑设计场景:用户向Agent描述需求,Agent在OpenShell沙箱中自主调用Claude模型,操作Rhino和Blender完成从场地建模到材质渲染的全流程。

来源:OpenShell描述来自NVIDIA官方新闻稿和PCMag现场报道。

3.2 Windows 安全原语

微软为RTX Spark平台开发了新的Windows安全原语,确保本地Agent的运行安全:

-Agent Containment(代理隔离):Windows内核层面的进程隔离,防止Agent越权访问
-Identity Management(身份管理):每个Agent拥有独立身份标识,其操作可审计、可追溯
-Policy Engine(策略引擎):用户或IT管理员可以定义Agent的行为策略——哪些操作允许、哪些需要确认、哪些禁止

这些安全机制是AI Agent能被主流用户接受的前提。如果没有可信的安全框架,本地Agent将被视为安全风险而非助手。

3.3 Adobe 深度优化

Adobe已针对RTX Spark平台重构Photoshop和Premiere,运行速度翻倍。这意味着RTX Spark在创作者市场有立即可用的价值主张——即使Agent工作流尚未普及,Adobe的性能优化已经提供了购买动力。

3.4 AI 代理的工作流程示例

以一个内容创作为例:

  1. 用户打开Windows,向Agent说"帮我做一个产品宣传视频"
  2. Agent在OpenShell中启动,加载本地多模态模型
  3. Agent访问用户指定的素材文件夹(经用户授权)
  4. Agent调用Adobe Premiere进行视频剪辑,调用本地大模型生成文案
  5. 每个步骤完成后向用户确认,或根据预设策略自动继续
  6. 最终作品保存到用户指定目录

整个过程中,所有模型推理、视频渲染、文本生成都在本地完成——无需云端API,无延迟,无隐私泄露风险。

图表加载中…

💡 一句话理解

OpenShell的开放性是关键——它支持多种模型(本地和云端),这意味着你不会被锁定在NVIDIA或某一家模型供应商。随着开源模型生态的发展,RTX Spark的Agent能力将不断增强。

⚠️ 常见踩坑

本地Agent的安全模型仍处于早期阶段。OpenShell和Windows安全原语的有效性需要经过实际安全测试验证。在Agent生态成熟前,建议保持Agent的权限最小化,仅授予完成任务所需的最小权限。

四、RTX Spark 竞品对比:高通 Snapdragon vs Apple Silicon vs AMD

RTX Spark进入PC芯片市场,直接改变了Windows on Arm的竞争格局。

4.1 vs 高通 Snapdragon X 系列

高通Snapdragon X系列是目前Windows on Arm的唯一选择。RTX Spark与它的核心差异:

维度 RTX Spark 高通 Snapdragon X2 Elite Extreme
架构 NVIDIA Blackwell GPU + Arm Grace CPU 高通自研 Oryon CPU + Adreno GPU
GPU 性能 ~RTX 5070(6144 CUDA 约等于RTX 3050级别
内存上限 128GBLPDDR5X 48GBLPDDR5X
AI 算力 1 petaflopFP4 ~75 TOPS(NPU)
目标市场 创作者/AI工作站/游戏 超薄本/轻薄办公
游戏生态 DLSS 4.5 + 光线追踪 有限的光追支持
合作模式 NVIDIA设计 + 联发科代工 高通自研

核心差异在于定位:高通优先能效比,RTX Spark优先绝对性能。高通的TDP低于100W,适合13-14英寸超薄本;RTX Spark面向高性能创作者设备,TDP更高但性能也显著更强。

4.2 vs Apple Silicon

Apple M系列芯片是ARM PC的标杆。RTX Spark与它的对比:

维度 RTX Spark Apple M4 Max
GPU 性能 ~RTX 5070 ~RTX 4070级别
内存上限 128GB 128GB
操作系统 Windows 11(Agent增强版) macOS
游戏生态 ✅ 完整(x86模拟+原生Arm) ⚠️ 有限
AI Agent ✅ 原生OpenShell支持 ❌ 无系统级Agent平台
软件生态 Windows 全兼容(含企业应用) macOS 生态

RTX Spark在Windows全兼容性和AI Agent原生支持方面领先,但Apple在能效比、生态整合和用户体验一致性方面仍具优势。

4.3 vs AMD Ryzen AI Max

AMD的Ryzen AI Max系列也面向创作者市场,采用集成GPU+CPU设计:

维度 RTX Spark AMD Ryzen AI Max 395
架构 Blackwell GPU + Grace CPU(Arm) RDNA 3.5 GPU + Zen 5 CPU(x86)
内存上限 128GB 128GB
GPU 性能 ~RTX 5070 ~RTX 4060级别
指令集 Arm(WoA生态) x86(传统生态)
AI 算力 1 petaflop FP4 ~128 TOPS(NPU)

RTX Spark在GPU性能上领先,但AMD的x86兼容性意味着无需担心Windows Arm应用的适配问题。这是RTX Spark短期内最大的挑战。

💡 一句话理解

如果你是一名创作者或AI开发者,RTX Spark的128GB统一内存+RTX 5070级别GPU是其他轻薄本无法提供的组合。如果你只需要日常办公和网页浏览,高通Snapdragon X的能效比可能更适合。

⚠️ 常见踩坑

Windows on Arm的x86模拟层虽然已大幅改善(微软和高通近两年加速了Arm原生适配),但仍不是100%兼容。如果你依赖特定的x86专属软件(如某些企业级工具、特定游戏反作弊系统),RTX Spark可能存在兼容性问题。购买前务必确认关键软件的Arm原生或模拟兼容性。

五、对 PC 行业格局的影响

RTX Spark的发布可能重塑多个市场。

5.1 终结高通 Windows on Arm 独占

自高通与微软独家合作以来,Windows on Arm芯片市场一直是高通垄断。RTX Spark是第一个替代方案——而且性能显著更强。这意味着OEM厂商终于有了选择,高通也将面临竞争压力。

5.2 消费级 AI 芯片的新品类

RTX Spark定义了AI超级计算机这一新品类。它不是简单的"AI PC"贴纸——而是从芯片到操作系统都围绕AI Agent设计的完整平台。AMD已经提出了"Agent Computer"概念,Intel可能跟进。2026 年秋季将成为 AI PC 从营销概念走向真正差异化产品线的分水岭。

5.3 Arm 生态的临界点

RTX Spark + 高通 + Apple Silicon,三大Arm芯片厂商同时活跃在PC市场,这意味着Arm指令集在PC领域即将达到生态临界点——足够多的开发者为Arm原生编译应用,足够多的用户获得良好的Arm体验,最终形成正向循环。

5.4 OEM 合作伙伴

首批搭载RTX Spark的设备将于2026年秋季上市,合作方包括:

-宏碁(Acer)
-华硕(ASUS)——ProArt系列
-戴尔(Dell)——XPS系列
-惠普(HP)
-联想(Lenovo)
-微软 Surface
-微星(MSI)——Prestige系列

覆盖从消费级到创作者到企业级的全产品线。黄仁勋还暗示RTX Spark可能扩展到Windows台式塔式机(使用GB300平台)。

5.5 定价预期与市场定位

NVIDIA尚未公布RTX Spark的定价。分析如下:

  • 如果定价在$1,500-2,500区间,RTX Spark笔记本将成为主流创作者设备,直接与Apple MacBook Pro竞争
  • 如果定价在$3,000-5,000区间,RTX Spark将定位于移动工作站,与Dell Precision、HP ZBook竞争
  • 定价是决定市场成败的关键因素。黄仁勋在演讲中暗示将覆盖多个价位段,但具体价格需要等到OEM厂商公布。
图表加载中…

💡 一句话理解

关注2026年秋季的OEM产品发布。第一批RTX Spark设备的定价、电池续航和散热表现将决定这个平台的初期市场接受度。如果定价合理且性能达标,这可能成为AI PC历史上的转折点。

⚠️ 常见踩坑

电池续航是关键未知数。RTX Spark的TDP显著高于高通Snapdragon X,在轻薄本中的续航表现需要独立测试验证。如果续航远低于Apple Silicon MacBook,可能会限制其在移动场景的竞争力。

六、NVIDIA 全栈战略:从芯片到生态

RTX Spark不是孤立的产品发布,而是NVIDIA全栈战略的关键一环。

6.1 硬件层

-RTX Spark(消费级):面向PC、笔记本、迷你主机
-DGX Spark(开发者级):面向AI研究人员,运行Ubuntu Linux
-GB300(数据中心级):Vera Rubin平台,面向企业级AI训练和推理

三条产品线覆盖从个人到企业的全场景。

6.2 软件层

-CUDA 生态:30年积累的开发者生态,数百万CUDA开发者
-TensorRT:AI推理优化框架
-DLSS 4.5:AI超分辨率和帧生成
-OpenShell:AI代理运行时
-Nemotron 系列:开源模型生态(具体型号待官方确认)

6.3 安全层

-OpenShell沙箱:Agent隔离执行
-Windows安全原语:内核级Agent containment
-策略引擎:用户/IT管理员可定义Agent行为边界

6.4 生态层

-OEM合作:7家主流PC厂商
-Adobe深度优化:Photoshop/Premiere性能翻倍
-微软三年联合研发:Windows Agent原生OS

NVIDIA的全栈护城河:竞争对手(高通、Apple、AMD)在某一层面可能更强,但没有人拥有从芯片到CUDA到Agent运行时的全栈控制力。这正是RTX Spark的战略优势。

💡 一句话理解

对于AI开发者来说,NVIDIA的CUDA生态是最大的粘性因素。如果你的工作流深度依赖CUDA生态,RTX Spark将提供从开发到部署的无缝体验——同一套代码可以在DGX Spark(开发)和RTX Spark(消费端运行)上运行。

⚠️ 常见踩坑

全栈绑定的风险——当你的AI工作流深度依赖NVIDIA生态时,切换到其他平台(如Apple Metal或AMD ROCm)的成本极高。建议在架构设计时保持模型推理层的抽象,降低供应商锁定风险。

七、总结与展望

RTX Spark代表了一个范式级的产品定义:从"更快的PC"到"有AI队友的PC"。

关键要点回顾:

  • RTX Spark是NVIDIA时隔十余年重返PC处理器领域的全栈产品——不是单纯的芯片,而是包含硬件、软件、安全、生态的完整平台
  • 128GB统一内存 + Blackwell GPU + 20核Arm CPU的组合,使轻薄本首次能够本地运行200B参数级AI模型
  • NVIDIA与微软三年合作打造的Windows AI代理平台(OpenShell + 安全原语),是消费级AI Agent落地的基础设施
  • RTX Spark终结了高通在Windows on Arm市场的独占,引入了真正的竞争
  • 2026年秋季首批设备上市,定价将决定市场成败

AI Master 的立场判断:

RTX Spark最有可能在创作者市场率先突破——Adobe的性能优化+128GB统一内存+RTX级别的GPU性能,对视频编辑、3D建模、AI辅助设计的用户来说是刚需。

消费级市场的普及取决于两个因素:定价电池续航。如果NVIDIA和OEM合作伙伴能将RTX Spark笔记本的价格控制在$2,000以内、续航达到8小时以上,那么"AI超级计算机"可能真正成为主流品类。

对于AI行业从业者:本地AI推理能力的普及意味着AI Agent将从"云端服务"走向"个人工具"。这不仅改变了AI的使用方式,也改变了AI的商业模式——从按token计费到一次性硬件购买。这个转变的影响可能不亚于从订阅制软件到SaaS的转变。

本文数据来源于:NVIDIA官方新闻稿(nvidianews.nvidia.com)、PCMag、Tom's Hardware、TechPowerUp、Hothardware、Cool3c、Indian Express等权威信源,2026年5-6月发布。

💡 一句话理解

RTX Spark的意义远超出芯片本身——它标志着AI Agent从云端走向本地的技术拐点。对于关注AI基础设施、Agent架构、或本地AI部署的开发者,RTX Spark提供了目前消费级市场最强大的本地AI推理平台。保持关注秋季OEM设备的实际测试数据。

⚠️ 常见踩坑

本文基于发布会信息撰写,RTX Spark设备的实际性能、定价、续航等关键数据需等待2026年秋季OEM产品上市后的独立评测验证。请勿将发布会数据等同于最终产品规格。

更新于 2026-06-03:补充 NVIDIA Vera CPU 与 Vera Rubin 平台解读

2026 年 6 月 3 日更新:GTC 2026 上 NVIDIA 还发布了面向数据中心的Vera CPUVera Rubin平台,与 RTX Spark 形成「云端-边缘-消费级」的完整 AI 芯片矩阵。以下是补充内容。

Vera CPU:专为 Agentic AI 设计的处理器

2026 年 3 月(GTC San Jose),NVIDIA 正式发布Vera CPU——全球首款专门为Agentic AI 和强化学习设计的处理器。Vera CPU 建立在 Grace CPU 的成功基础之上,但做了以下关键升级:

-Olympus 定制核心:88 核心全新 CPU 架构,相比传统 CPU 单线程性能提升 50%
-1.5TB LPDDR5X 内存:提供高带宽内存子系统
-NVIDIA 可扩展一致性互连(SCF):支持 256 颗液冷 Vera CPU 集成于单一机架
-Vera CPU Rack:256 颗芯片单机架部署,CPU 吞吐量提升 6 倍

Vera CPU 的设计哲学与 RTX Spark 一脉相承——从「每美元核心数」转向「每美元 Token 数」。在 Agentic AI 场景中,大量的执行发生在模型之外(代码运行、工具调用、数据验证、任务规划),这些工作由 CPU 承担。传统 CPU 的高延迟导致昂贵的 GPU 经常闲置,Vera CPU 通过高单核性能和高并发能力解决了这一瓶颈。

Vera Rubin NVL72:机架级 AI 平台

Vera Rubin 不是单一芯片,而是一个五角色协调的机架级 AI 平台(2026 年 3 月 16 日发布):

机架角色 核心配置 用途
Vera Rubin NVL72 72 Rubin GPU + 36 Vera CPU + NVLink 6 + ConnectX-9 SuperNIC + BlueField-4 DPU 训练和推理
Vera ETL256 256 液冷 Vera CPU 密集 CPU 推理/Agent 工作负载
低延迟推理机架 针对延迟优化的 GPU 配置 实时推理服务
AI 存储机架 NVIDIA AI 导向存储 大规模数据存储
机架间互连 NVLink + CPO 光互连 多机架扩展

Rubin GPU采用 Blackwell 架构的下一代设计,配合铜缆互连(CPO),Rubin Ultra NVL576 和 Feynman NVL1152 系统支持多机架扩展。

RTX Spark vs Vera CPU:定位差异

特性 RTX Spark(消费级) Vera CPU(数据中心)
发布日期 2026 年 6 月 1 日(COMPUTEX/GTC Taipei) 2026 年 3 月(GTC San Jose)
CPU 核心 20 核 Arm(10×X925 + 10×A725) 88 核 Olympus 定制核心
GPU Blackwell(6,144 CUDA 核心) 无(GPU 在 Rubin 上)
内存 128GB LPDDR5X 统一内存 1.5TB LPDDR5X
工艺 台积电 3nm(700 亿晶体管) 未公布
AI 算力 1 petaflop FP4 CPU 吞吐量 6x 提升
目标场景 本地 AI Agent、创作者 PC AI Factory、大规模 Agent 推理

两者的互补关系:RTX Spark 让每个开发者在桌面上拥有 AI 超级计算机,Vera CPU 让数据中心高效运行数千个并发 Agent。从开发到部署,NVIDIA 正在构建完整的 AI 算力矩阵

图表加载中…

💡 一句话理解

如果你关注 AI 基础设施投资方向,Vera Rubin 平台意味着 NVIDIA 正从「卖 GPU」转型为「卖 AI 工厂」。GTC 2026 上黄仁勋预测 2025-2027 累计收入超 1 万亿美元,Vera Rubin 是核心驱动力。

⚠️ 常见踩坑

Vera CPU 和 Vera Rubin 平台目前仅面向数据中心客户,不对个人消费者销售。RTX Spark 是 NVIDIA 消费级 AI 芯片的唯一选择(截至 2026 年 6 月)。

更新于 2026-06-06:GTC Taipei 2026 完整发布——Cosmos 3 全模态世界模型与 Nemotron 3 Ultra 开源

GTC Taipei 2026 上,NVIDIA 不仅发布了 RTX Spark 芯片,还推出了两款对 AI 生态有深远影响的模型——Cosmos 3 全模态世界模型Nemotron 3 Ultra 开源 LLM

Cosmos 3:物理AI 的全模态统一

Cosmos 3是全球首个开源的全模态物理AI世界模型,采用Mixture of Transformers 双塔架构,可同时处理语言、图像、视频、音频和行动序列。它的核心突破在于:一个模型替代了VLM、视频生成器、世界模拟器和世界行动模型

特性 说明
架构 双塔 Mixture of Transformers(推理塔 + 生成塔)
模态覆盖 文本 + 图像 + 视频 + 音频 + 行动序列
开源许可证 OpenMDW-1.1(允许商业使用,要求贡献回馈)
权重获取 Hugging Face
部署方式 DGX Cloud(训练)/ API Cloud(推理)/ Jetson Thor(边缘)
Cosmos Coalition Agile Robots、Black Forest Labs、LTX、Runway、Skild AI 等 6 家核心成员

Cosmos 3 与 RTX Spark 的协同意义:RTX Spark 提供 128GB 统一内存和 1 petaflop FP4 算力,足以运行量化版的 Cosmos 3,使消费级设备能够进行物理AI推理——这意味着未来的个人电脑可能内置一个"世界模型",预测和模拟各种场景。

Nemotron 3 Ultra:550B 参数开源 LLM

Nemotron 3 Ultra是 NVIDIA 在 GTC Taipei 上发布的5500 亿参数混合专家MoE)模型,其中激活参数约 550 亿(A55B)。关键数据:

-推理速度:比当前领先开源模型快5 倍
-运行成本:降低30%
-架构:SSM(状态空间模型)+ MoE 混合架构
-开源:完全开放权重,允许任何人基于此模型扩展改进
-定位:全球最具成本效益的开源模型

来源:NVIDIA 官方新闻稿、HPC Wire、Digital Applied 技术指南。

GTC Taipei 2026 完整发布清单

发布项目 类别 关键信息
RTX Spark 消费级芯片 Blackwell GPU + Grace CPU,128GB 统一内存
Cosmos 3 世界模型 全模态物理AI,双塔 MoT 架构
Nemotron 3 Ultra 开源 LLM 550B 参数 MoE,速度 5x,成本 -30%
Vera Rubin 数据中心平台 多机架 AI 工厂系统,全面量产
Vera CPU 数据中心 CPU 自研 Olympus 核心,1.5TB 内存
Agent Harness Agent 安全框架 Agent 开发工具链升级
Spectrum-X CPO 网络 共封装光学,支持 AI 工厂扩展

这标志着 NVIDIA 正在从「GPU 公司」全面转型为「全栈 AI 基础设施公司」——从消费级芯片(RTX Spark)到数据中心(Vera Rubin)、从语言模型(Nemotron 3 Ultra)到物理世界模型(Cosmos 3)、从训练(DGX Cloud)到推理(Jetson Thor)。

图表加载中…

💡 一句话理解

如果你关注 NVIDIA 的整体战略方向,GTC Taipei 2026 是最重要的信号——NVIDIA 正在构建从芯片到模型到平台的完整 AI 生态。RTX Spark + Cosmos 3 + Nemotron 3 Ultra 的组合,使 NVIDIA 成为唯一能在消费端、云端和边缘端提供全栈 AI 解决方案的公司。

⚠️ 常见踩坑

GTC 发布的产品很多仍处于早期阶段。RTX Spark 设备预计 2026 年秋季才上市,Cosmos 3 的边缘部署需要模型量化,性能可能有所下降。在基于这些技术做长期投资决策前,建议等待第三方评测和实际产品发布。