开源项目2 天前·NVIDIA
NVIDIA发布Nemotron 3 Ultra:550B参数开源MoE模型,专为AI Agent打造
NVIDIA正式发布Nemotron 3 Ultra,一个550B参数的开放权重MoE模型(活跃参数55B),基于混合Transformer-Mamba架构。该模型支持100万Token上下文窗口,推理速度提升5倍、成本降低30%,专为长时间运行的AI Agent工作流设计。采用Linux基金会OpenMDW许可证,完全开放权重、数据和训练配方。
AI Master 解读
核心事件
NVIDIA发布550B参数开源MoE模型Nemotron 3 Ultra。
行业影响
影响分析: 活跃参数55B,支持100万Token上下文,推理速度提升5倍。采用Linux基金会OpenMDW许可证,完全开放权重、数据和训练配方。
AI Master 建议
这是NVIDIA在开源模型领域的重大布局,企业可在本地部署和微调,降低对闭源模型的依赖。
NVIDIA发布Nemotron 3 Ultra开源模型
NVIDIA正式发布Nemotron 3 Ultra,一个550B参数的开放权重MoE模型(活跃参数55B),基于混合Transformer-Mamba架构。
核心特性:
- 支持100万Token上下文窗口
- 推理速度提升5倍、成本降低30%
- 专为长时间运行的AI Agent工作流设计
- 支持规划、推理、工具使用、代码编写调试、研究等复杂任务
开放许可: 采用Linux基金会OpenMDW许可证,完全开放权重、数据和训练配方(recipes),企业可微调并部署在本地、云端或边缘。