应用2 天前·Business Insider

OpenAI 与 Anthropic 同日发布新模型:GPT-5.3 Codex 对阵 Claude Opus 4.6

OpenAI 和 Anthropic 原计划在同一天上午 10 点发布各自的 AI 编程模型,但 Anthropic 提前 15 分钟发布 Claude Opus 4.6 抢占先机。GPT-5.3 Codex 在 Terminal-Bench 2.0 得分 77.3%,Claude Opus 4.6 得分 65.4%,但 Claude 在 SWE-bench 等实际工程任务中仍保持优势。

AI Master 解读

核心事件

这是 AI 行业竞争最激烈的一次「正面交锋」——两家公司原计划在同一时刻发布模型,最终 Anthropic 提前 15 分钟抢跑。这种「发布竞速」在 AI 行业历史上前所未有。

行业影响

从基准测试看,GPT-5.3 Codex 在命令行自动化(Terminal-Bench 2.0)上大幅领先(77.3% vs 65.4%),但 Claude Opus 4.6 在实际软件工程任务(SWE-bench)中仍保持优势(80.8% vs ~80%)。两个模型的竞争已经从「谁更聪明」转向「谁在实际工作中更好用」。

AI Master 建议

模型选择不再是「哪个最好」而是「哪个最适合特定任务」。企业应建立模型路由机制,在不同场景自动选择最优模型。

GPT-5.3 Codex 与 Claude Opus 4.6 同日发布

2026 年 2 月,OpenAI 和 Anthropic 上演了 AI 史上最激烈的同日发布对决。

发布细节

  • 原定时间:太平洋时间上午 10 点同时发布
  • Anthropic 提前 15 分钟发布 Claude Opus 4.6
  • OpenAI 约 10:20 发布 GPT-5.3 Codex

基准对比

基准测试 Claude Opus 4.6 GPT-5.3 Codex
Terminal-Bench 2.0 65.4% 77.3%
SWE-bench Verified 80.8% ~80.0%
实际工程任务 Claude 领先 -

工具生态

  • Claude Opus 4.6:Cursor、Windsurf、Claude Code 已支持
  • GPT-5.3 Codex:ChatGPT、CodeX 应用已支持
  • API 访问:Claude 已开放,GPT-5.3 稍后开放

竞争趋势

  • 从「谁更聪明」转向「谁在实际工作中更好用」
  • 模型路由和任务适配成为核心竞争力