NVLink（NVLink 高速互联）

NVLink 就是把多张显卡用超高速专线直连，让它们共享内存、传数据比走主板 PCIe 槽快十倍以上

亦作、亦称：NVLink 高速互联 · GPU高速互联 · 显卡互联总线 · NVLink Network

NVLink 是 NVIDIA 的专有高速 GPU 互联技术，带宽从 2016 年的 160 GB/s 一路进化到 2026 年机架级 260 TB/s，是现代超大规模 AI 训练集群的核心硬件基础。它让多 GPU 突破 PCIe 瓶颈，实现近乎统一的共享内存空间与极低延迟通信。

概述

NVLink 是 NVIDIA 为打破 PCIe 带宽瓶颈而设计的高速串行互联技术。

NVLink 通过物理链路（Lane）与协议层共同实现高带宽通信。

NVLink 随 NVIDIA GPU 架构逐代升级，带宽持续翻倍。

2016 年（NVLink 1.0 / Pascal P100）：每 GPU 4 条链路，总带宽 160 GB/s
2017 年（NVLink 2.0 / Volta V100）：每 GPU 6 条链路，总带宽 300 GB/s；首次支持 CPU-GPU 互联（IBM POWER9）
2020 年（NVLink 3.0 / Ampere A100）：每 GPU 12 条链路，总带宽 600 GB/s
2022 年（NVLink 4.0 / Hopper H100）：每 GPU 18 条链路，总带宽 900 GB/s；引入 NVLink Network 机架级互联
2024 年（NVLink 5.0 / Blackwell B200）：每 GPU 18 条链路，总带宽 1,800 GB/s（1.8 TB/s）
2026 年（NVLink 6.0 / Rubin）：单 GPU 3,600 GB/s，GB200 NVL72 机架级达 260 TB/s

NVLink 主要服务于需要高 GPU 间通信带宽的工作负载。

NVLink 常被与其他互联技术混淆，需注意其适用层级。

NVLink vs PCIe：PCIe 是通用总线，带宽低、延迟高；NVLink 是 NVIDIA 专有，带宽高出数十倍，但仅适用于节点内或 NVLink Network 机架内
NVLink vs InfiniBand / RoCE：InfiniBand/RoCE 是跨节点网络互联（节点间），NVLink 是节点内（或机架内）互联；两者分工不同，大型集群通常同时使用
NVLink vs NVSwitch：NVSwitch 是配合 NVLink 构建全互联拓扑的交换芯片，二者是协同关系而非替代关系
NVLink vs AMD Infinity Fabric：AMD 的 Infinity Fabric 是类似定位的 GPU 互联技术，但生态与带宽规格不同

NVLink 并非万能，使用时需了解其边界。

NVLink 已发展为 NVIDIA 完整互联生态的核心组件。

NVSwitch：2018 年随 Volta 引入，可将 8 块（或更多）GPU 构成无阻塞全互联拓扑
NVLink Network（NVLink 4.0+）：2022 年起支持机架级互联，GB200 NVL72 可将 72 张 GPU 组成单一互联域
NCCL（NVIDIA Collective Communications Library）：专为 NVLink 拓扑优化的集合通信库，All-Reduce 等操作自动利用最优路径
cuDSA / GPUDirect：结合 NVLink 实现 GPU-GPU、GPU-存储之间的零拷贝直接数据传输
未来展望：NVLink 6.0（Rubin 平台）进一步将机架级带宽推至 260 TB/s，持续引领 AI 基础设施演进

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

从知识库精选 3 篇文章，帮助深入理解该术语。

本页内容为本站原创撰写；维基百科链接仅作延伸参考。