开源项目6 天前·NVIDIA Developer + 综合报道

NVIDIA 发布 Nemotron 3 Ultra：550B 参数开源 MoE 模型，专为长期 Agent 工作流设计

NVIDIA 发布 Nemotron 3 Ultra，这是一个 550B 参数的混合专家模型，激活参数仅 55B。在长期 Agent 任务中实现比同类开源模型高 5 倍的推理吞吐量，降低 30% 成本。该模型采用 OpenMDW 许可证完全开源，包含权重、训练数据和配方。

Nemotron 3 Ultra 发布

2026 年 6 月 4 日，NVIDIA 正式发布 Nemotron 3 Ultra 开源模型。

核心技术参数

参数量：550B 总参数，55B 激活参数（MoE 架构）
推理性能：比同类开源模型高 5 倍吞吐量
成本：复杂 Agent 工作流降低 30% 推理成本
许可证：Linux 基金会 OpenMDW 许可证
开源范围：模型权重、训练数据、训练配方全部开放

设计目标

长期 Agent：专为需要计划、推理、工具使用、代码编写和研究的复杂工作流设计
上下文窗口：支持 100 万 token 上下文
多模态：基于混合 Mamba-Transformer MoE 架构

行业意义

NVIDIA 正通过 Nemotron 系列成为美国领先的开源 LLM 公司。根据 NVIDIA 向 SEC 提交的年报，开源模型对 NVIDIA 是长期战略——通过广泛的开发者采用，确保 AI 生态系统继续依赖 NVIDIA GPU。如果开源模型部署在竞争对手平台上，可能减少对 NVIDIA 产品的需求。

来源: NVIDIA Developer Blog + Constellation Research
链接: https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents

AI Master 解读

核心事件

NVIDIA 发布 Nemotron 3 Ultra：550B 参数开源 MoE 模型，专为长期 Agent 工作流设计

行业影响

AI Master 建议

Star 增速不等于生产可用，建议从 issue 响应、release 频率、文档质量三个维度评估是否引入。

📰 原始来源

https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents

← 上一篇

Anthropic 发布"当 AI 构建自身"论文：Claude 编写 80% 生产代码，呼吁全球暂停机制

Google Gemini 月活用户达 9 亿，同比增长 100%，Alphabet 完成 847 亿美元融资

📰 更多动态

行业2026-06-10

NVIDIA 发布 Nemotron 3 Ultra：550B 参数开源 MoE 模型，专为长期 Agent 工作流设计

Nemotron 3 Ultra 发布

核心技术参数

设计目标

行业意义

AI Master 解读

📰 更多动态

具身智能行业营收暴增50倍，一季度赚一年的钱，疯狂抢数据

两位经济学家AGI终极推演：当一切不再稀缺，人类退回情感领域

黑客利用Meta AI获取高权限Instagram账户，AI安全漏洞引发关注