Cosmos 3:物理 AI 的全模态突破
2026 年 5 月 31 日,黄仁勋在 GTC 台北主题演讲中发布 Cosmos 3。
核心能力
- 全模态统一:单一模型原生理解并生成文本、图像、视频、环境声音和机器人动作信号
- 双塔混合 Transformer 架构:推理模块先理解场景,生成模块产生物理感知输出
- 开源权重:Hugging Face 已开放,OpenMDW-1.1 许可证
- 无需 GPU 体验:可通过 build.nvidia.com 在线试用
五大应用模式
- 视觉 AI:物理世界场景理解
- 合成数据生成:生成带物理约束的训练数据
- 闭环仿真:在模拟环境中测试机器人策略
- 世界动作模型:输出机器人可执行的动作序列
- 自动驾驶:复杂交通场景的预测和规划
Cosmos 联盟
NVIDIA 同时发起 Cosmos Coalition,成员包括 Agile Robots、Black Forest Labs、Generalist、LTX、Runway 和 Skild AI,共同推进下一代世界模型。
行业意义
Cosmos 3 将物理 AI 训练和评估周期从数月缩短至数天,为机器人和自动驾驶开发带来代际飞跃。
来源: NVIDIA 官方 + HPCWire + Axios
链接: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai
AI Master 解读
核心事件
英伟达发布 Cosmos 3:全球首个开源物理 AI 全模态模型,在 GTC 台北/Computex 2026 亮相
行业影响
Cosmos 3 将物理 AI 训练和评估周期从数月缩短至数天,为机器人和自动驾驶开发带来代际飞跃。
AI Master 建议
Star 增速不等于生产可用,建议从 issue 响应、release 频率、文档质量三个维度评估是否引入。