NVIDIA发布Cosmos 3:首个开源物理AI全模态世界模型,统一渲染、模拟与机器人动作
NVIDIA在Computex 2026/GTC台北发布Cosmos 3,这是首个完全开源的物理AI全模态基础模型。采用双塔Mixture-of-Transformers架构,统一理解并生成文本、图像、视频、环境音和机器人动作信号。权重已在Hugging Face开放,使用OpenMDW-1.1许可证。Cosmos联盟首批成员包括Agile Robots、Runway、Black Forest Labs和Skild AI。工业落地方涵盖LG电子、三星、理想汽车和Doosan Robotics。
Cosmos 3:物理AI的开源统一模型
2026年5月31日,NVIDIA在Computex 2026/GTC台北上发布Cosmos 3。
技术架构
- 双塔Mixture-of-Transformers:一个推理模块理解场景,一个生成模块输出物理数据
- 全模态:文本、图像、视频、环境音、机器人动作
- 开源权重:Hugging Face可下载,build.nvidia.com可在线试用
- 许可证:OpenMDW-1.1(Linux基金会)
生态与合作
- Cosmos联盟:Agile Robots、Runway、Black Forest Labs、Skild AI
- 工业落地:LG电子、三星、理想汽车、Doosan Robotics
- 训练数据:6个合成数据集在GitHub开放
应用场景
- 机器人训练与仿真
- 自动驾驶环境模拟
- 数字孪生与工业仿真
- 合成数据生成
来源: NVIDIA官方 + Axios + AI Weekly
链接: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai
AI Master 解读
核心事件
NVIDIA Cosmos 3是全球首个开源物理AI全模态世界模型,统一了感知、生成和动作输出,将物理AI训练周期从月级缩短到天级。
行业影响
Cosmos 3的突破在于用单一模型替代了过去需要多个模型分别处理视觉、语言、视频和机器人控制的工作流。OpenMDW-1.1许可证降低了采用门槛,Cosmos联盟构建了围绕NVIDIA硬件的软件生态。这对具身智能和自动驾驶行业意味着:基础模型层的标准化正在加速,竞争焦点将从模型训练转向微调和应用层创新。
AI Master 建议
关注Cosmos 3在机器人训练和自动驾驶仿真中的应用案例,特别是开源权重+合成数据集组合如何降低中小团队的研发门槛。对于已有仿真平台的团队,评估Cosmos 3能否作为替代或补充的训练数据源。