大语言模型2026-05-07 16:00·OpenAI Blog + 量子位

OpenAI 公开大规模稳定训练的秘密,MRC 协议惠及英伟达/AMD/英特尔

OpenAI 宣布与 AMD、Broadcom、英特尔、微软、英伟达合作开发 MRC(Multipath Reliable Connection)超算网络协议,大幅提升大规模 AI 训练集群的网络性能和韧性。

OpenAI 分享了大规模稳定训练的关键技术。

  • OpenAI 联合 AMD、Broadcom、英特尔、微软、英伟达发布 MRC 超算网络协议
  • MRC 大幅提升 GPU 网络在大规模训练集群中的性能和韧性
  • 完整规格已通过 Open Compute Project(OCP)开放
  • 这是 OpenAI 少有的开源技术贡献,而非封闭研究
  • 所有参与方都将从统一的网络协议中受益
  • 这对降低大规模 AI 训练的网络故障率有重要意义

来源: OpenAI Blog + 量子位 + 机器之心
链接: https://openai.com/index/mrc-supercomputer-networking/