← 首页/AI 资讯

开源项目昨天·NVIDIA NeMo + MarkTechPost + arXiv

NVIDIA Polar：GRPO 训练框架让 Codex/Claude Code 编码能力大幅提升

NVIDIA 发布 Polar——面向 GRPO 训练的 Token 忠实 Rollout 框架，在 Codex、Claude Code、Qwen Code 等编码 Agent 上验证。Qwen3.5-4B 在 SWE-bench Verified 上从 3.8% 提升至 26.4%（+22.6 分），Pi 从 34.2% 提升至 40.4%。

Polar：让编码 Agent 更聪明

2026 年 5 月底，NVIDIA 开源了 Polar 框架。

GRPO 训练效果

Codex：3.8% → 26.4%（+22.6 分）
Claude Code：29.8% → 34.6%（+4.8 分）
Qwen Code：34.6% → 35.2%（+0.6 分）
Pi：34.2% → 40.4%（+6.2 分）

技术架构

Token-Faithful Rollout 框架
支持多种 Agent Harness
已发布研究论文 arXiv:2605.24220
开源仓库：NVIDIA-NeMo/ProRL-Agent-Server

来源: NVIDIA NeMo + MarkTechPost + arXiv
链接: https://arxiv.org/pdf/2605.24220

📰 原始来源

https://arxiv.org/pdf/2605.24220

← 上一篇

Salt Security 推出 Salt Code：AI Agent 代码全生命周期安全策略平台

下一篇 →

AI 安全新纪元：2026 年 AI 辅助攻击激增，各国加速 AI 治理立法

📰 更多动态

行业2026-06-04

SpaceX IPO路演6月4日启动，6月12日纳斯达克挂牌交易

芯片2026-06-02

Intel 发布 Crescent Island AI GPU：用便宜内存挑战英伟达

开源项目2026-06-01

NVIDIA 发布 Nemotron-3 Ultra：55B 活跃参数的 MoE 开源模型，推理提速 5 倍