应用2 天前·Business Insider
OpenAI 与 Anthropic 同日发布新模型:GPT-5.3 Codex 对阵 Claude Opus 4.6
OpenAI 和 Anthropic 原计划在同一天上午 10 点发布各自的 AI 编程模型,但 Anthropic 提前 15 分钟发布 Claude Opus 4.6 抢占先机。GPT-5.3 Codex 在 Terminal-Bench 2.0 得分 77.3%,Claude Opus 4.6 得分 65.4%,但 Claude 在 SWE-bench 等实际工程任务中仍保持优势。
AI Master 解读
核心事件
这是 AI 行业竞争最激烈的一次「正面交锋」——两家公司原计划在同一时刻发布模型,最终 Anthropic 提前 15 分钟抢跑。这种「发布竞速」在 AI 行业历史上前所未有。
行业影响
从基准测试看,GPT-5.3 Codex 在命令行自动化(Terminal-Bench 2.0)上大幅领先(77.3% vs 65.4%),但 Claude Opus 4.6 在实际软件工程任务(SWE-bench)中仍保持优势(80.8% vs ~80%)。两个模型的竞争已经从「谁更聪明」转向「谁在实际工作中更好用」。
AI Master 建议
模型选择不再是「哪个最好」而是「哪个最适合特定任务」。企业应建立模型路由机制,在不同场景自动选择最优模型。
GPT-5.3 Codex 与 Claude Opus 4.6 同日发布
2026 年 2 月,OpenAI 和 Anthropic 上演了 AI 史上最激烈的同日发布对决。
发布细节
- 原定时间:太平洋时间上午 10 点同时发布
- Anthropic 提前 15 分钟发布 Claude Opus 4.6
- OpenAI 约 10:20 发布 GPT-5.3 Codex
基准对比
| 基准测试 | Claude Opus 4.6 | GPT-5.3 Codex |
|---|---|---|
| Terminal-Bench 2.0 | 65.4% | 77.3% |
| SWE-bench Verified | 80.8% | ~80.0% |
| 实际工程任务 | Claude 领先 | - |
工具生态
- Claude Opus 4.6:Cursor、Windsurf、Claude Code 已支持
- GPT-5.3 Codex:ChatGPT、CodeX 应用已支持
- API 访问:Claude 已开放,GPT-5.3 稍后开放
竞争趋势
- 从「谁更聪明」转向「谁在实际工作中更好用」
- 模型路由和任务适配成为核心竞争力