Nemotron 3 Ultra 发布
2026 年 6 月 4 日,NVIDIA 正式发布 Nemotron 3 Ultra 开源模型。
核心技术参数
- 参数量:550B 总参数,55B 激活参数(MoE 架构)
- 推理性能:比同类开源模型高 5 倍吞吐量
- 成本:复杂 Agent 工作流降低 30% 推理成本
- 许可证:Linux 基金会 OpenMDW 许可证
- 开源范围:模型权重、训练数据、训练配方全部开放
设计目标
- 长期 Agent:专为需要计划、推理、工具使用、代码编写和研究的复杂工作流设计
- 上下文窗口:支持 100 万 token 上下文
- 多模态:基于混合 Mamba-Transformer MoE 架构
行业意义
NVIDIA 正通过 Nemotron 系列成为美国领先的开源 LLM 公司。根据 NVIDIA 向 SEC 提交的年报,开源模型对 NVIDIA 是长期战略——通过广泛的开发者采用,确保 AI 生态系统继续依赖 NVIDIA GPU。如果开源模型部署在竞争对手平台上,可能减少对 NVIDIA 产品的需求。
来源: NVIDIA Developer Blog + Constellation Research
链接: https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents
AI Master 解读
核心事件
NVIDIA 发布 Nemotron 3 Ultra:550B 参数开源 MoE 模型,专为长期 Agent 工作流设计
行业影响
NVIDIA 正通过 Nemotron 系列成为美国领先的开源 LLM 公司。根据 NVIDIA 向 SEC 提交的年报,开源模型对 NVIDIA 是长期战略——通过广泛的开发者采用,确保 AI 生态系统继续依赖 NVIDIA GPU。如果开源模型部署在竞争对手平台上,可能减少对 NVIDIA 产品的需求。
AI Master 建议
Star 增速不等于生产可用,建议从 issue 响应、release 频率、文档质量三个维度评估是否引入。