大语言模型2026-05-17 20:15·NVIDIA Labs + Hacker News

NVIDIA 开源 SANA-WM:2.6B 参数世界模型,可生成 1 分钟 720p 视频

NVIDIA 发布 SANA-WM,这是一个 26 亿参数的开源世界模型,能够生成 1 分钟 720p 高清视频,在 Hacker News 获得 353 分、140 条评论

SANA-WM:开源世界模型的里程碑

2026 年 5 月 17 日,NVIDIA Labs 发布 SANA-WM 项目。

技术规格

  • 参数量:2.6B(26 亿)
  • 输出能力:1 分钟时长、720p 分辨率视频
  • 开源许可:完全开源,社区可自由使用和改进

什么是世界模型?

世界模型(World Model)是 AI 领域的前沿研究方向,目标是让模型理解物理世界的运行规律,能够预测和生成符合物理规则的内容。SANA-WM 在视频生成方面取得了显著进展,相比传统视频生成模型,它能更好地模拟真实世界的物理动态。

开源意义

NVIDIA 选择开源 SANA-WM 而非闭源发布,体现了开源世界模型研究的趋势。对于视频生成、游戏开发、仿真训练等领域,这是一个重要的基础设施工具。

来源: NVIDIA Labs / Hacker News
链接: https://nvlabs.github.io/Sana/WM/