开源项目2 天前·NVIDIA

NVIDIA发布Nemotron 3 Ultra:550B参数开源MoE模型,专为AI Agent打造

NVIDIA正式发布Nemotron 3 Ultra,一个550B参数的开放权重MoE模型(活跃参数55B),基于混合Transformer-Mamba架构。该模型支持100万Token上下文窗口,推理速度提升5倍、成本降低30%,专为长时间运行的AI Agent工作流设计。采用Linux基金会OpenMDW许可证,完全开放权重、数据和训练配方。

AI Master 解读

核心事件

NVIDIA发布550B参数开源MoE模型Nemotron 3 Ultra。

行业影响

影响分析: 活跃参数55B,支持100万Token上下文,推理速度提升5倍。采用Linux基金会OpenMDW许可证,完全开放权重、数据和训练配方。

AI Master 建议

这是NVIDIA在开源模型领域的重大布局,企业可在本地部署和微调,降低对闭源模型的依赖。

NVIDIA发布Nemotron 3 Ultra开源模型

NVIDIA正式发布Nemotron 3 Ultra,一个550B参数的开放权重MoE模型(活跃参数55B),基于混合Transformer-Mamba架构。

核心特性:

  • 支持100万Token上下文窗口
  • 推理速度提升5倍、成本降低30%
  • 专为长时间运行的AI Agent工作流设计
  • 支持规划、推理、工具使用、代码编写调试、研究等复杂任务

开放许可: 采用Linux基金会OpenMDW许可证,完全开放权重、数据和训练配方(recipes),企业可微调并部署在本地、云端或边缘。