大语言模型2026-05-31·NVIDIA官方 + Axios + AI Weekly

NVIDIA发布Cosmos 3:首个开源物理AI全模态世界模型,统一渲染、模拟与机器人动作

NVIDIA在Computex 2026/GTC台北发布Cosmos 3,这是首个完全开源的物理AI全模态基础模型。采用双塔Mixture-of-Transformers架构,统一理解并生成文本、图像、视频、环境音和机器人动作信号。权重已在Hugging Face开放,使用OpenMDW-1.1许可证。Cosmos联盟首批成员包括Agile Robots、Runway、Black Forest Labs和Skild AI。工业落地方涵盖LG电子、三星、理想汽车和Doosan Robotics。

Cosmos 3:物理AI的开源统一模型

2026年5月31日,NVIDIA在Computex 2026/GTC台北上发布Cosmos 3。

技术架构

  • 双塔Mixture-of-Transformers:一个推理模块理解场景,一个生成模块输出物理数据
  • 全模态:文本、图像、视频、环境音、机器人动作
  • 开源权重:Hugging Face可下载,build.nvidia.com可在线试用
  • 许可证:OpenMDW-1.1(Linux基金会)

生态与合作

  • Cosmos联盟:Agile Robots、Runway、Black Forest Labs、Skild AI
  • 工业落地:LG电子、三星、理想汽车、Doosan Robotics
  • 训练数据:6个合成数据集在GitHub开放

应用场景

  • 机器人训练与仿真
  • 自动驾驶环境模拟
  • 数字孪生与工业仿真
  • 合成数据生成

来源: NVIDIA官方 + Axios + AI Weekly
链接: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai

AI Master 解读

核心事件

NVIDIA Cosmos 3是全球首个开源物理AI全模态世界模型,统一了感知、生成和动作输出,将物理AI训练周期从月级缩短到天级。

行业影响

Cosmos 3的突破在于用单一模型替代了过去需要多个模型分别处理视觉、语言、视频和机器人控制的工作流。OpenMDW-1.1许可证降低了采用门槛,Cosmos联盟构建了围绕NVIDIA硬件的软件生态。这对具身智能和自动驾驶行业意味着:基础模型层的标准化正在加速,竞争焦点将从模型训练转向微调和应用层创新。

AI Master 建议

关注Cosmos 3在机器人训练和自动驾驶仿真中的应用案例,特别是开源权重+合成数据集组合如何降低中小团队的研发门槛。对于已有仿真平台的团队,评估Cosmos 3能否作为替代或补充的训练数据源。