开源项目2026-05-31·NVIDIA 官方 + HPCWire + Axios

英伟达发布 Cosmos 3:全球首个开源物理 AI 全模态模型,在 GTC 台北/Computex 2026 亮相

NVIDIA 在 GTC 台北/Computex 2026 上发布 Cosmos 3,全球首个完全开源的物理 AI 全模态模型。权重已在 Hugging Face 开放,支持文本、图像、视频、声音和机器人动作的统一理解与生成,基于创新的混合 Transformer 架构。

Cosmos 3:物理 AI 的全模态突破

2026 年 5 月 31 日,黄仁勋在 GTC 台北主题演讲中发布 Cosmos 3。

核心能力

  • 全模态统一:单一模型原生理解并生成文本、图像、视频、环境声音和机器人动作信号
  • 双塔混合 Transformer 架构:推理模块先理解场景,生成模块产生物理感知输出
  • 开源权重:Hugging Face 已开放,OpenMDW-1.1 许可证
  • 无需 GPU 体验:可通过 build.nvidia.com 在线试用

五大应用模式

  1. 视觉 AI:物理世界场景理解
  2. 合成数据生成:生成带物理约束的训练数据
  3. 闭环仿真:在模拟环境中测试机器人策略
  4. 世界动作模型:输出机器人可执行的动作序列
  5. 自动驾驶:复杂交通场景的预测和规划

Cosmos 联盟

NVIDIA 同时发起 Cosmos Coalition,成员包括 Agile Robots、Black Forest Labs、Generalist、LTX、Runway 和 Skild AI,共同推进下一代世界模型。

行业意义

Cosmos 3 将物理 AI 训练和评估周期从数月缩短至数天,为机器人和自动驾驶开发带来代际飞跃。

来源: NVIDIA 官方 + HPCWire + Axios
链接: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai

AI Master 解读

核心事件

英伟达发布 Cosmos 3:全球首个开源物理 AI 全模态模型,在 GTC 台北/Computex 2026 亮相

行业影响

Cosmos 3 将物理 AI 训练和评估周期从数月缩短至数天,为机器人和自动驾驶开发带来代际飞跃。

AI Master 建议

Star 增速不等于生产可用,建议从 issue 响应、release 频率、文档质量三个维度评估是否引入。