大语言模型2 天前·Anthropic + Axios + TechCrunch

Anthropic正式发布Claude Opus 4.8:更强编码、Agent与法律分析能力

Anthropic于5月28日发布Claude Opus 4.8,在编码、代理任务、推理和金融分析等关键基准上全面超越前代Opus 4.7。新增动态工作流(Dynamic Workflows)支持数百个子代理并行执行,用户可自主调节模型努力程度(Effort Control),Fast Mode提速2.5倍且价格降至此前三分之一。

Claude Opus 4.8 正式发布

Anthropic于2026年5月28日发布Claude Opus 4.8,这是其最先进公开可用模型的最新版本。

核心能力提升

  • 编码能力: 在Terminal-Bench 2.1上达到行业领先水平,CursorBench各努力级别均超越前代
  • 代理任务: Super-Agent基准上唯一完成全部端到端案例的模型,超越GPT-5.5
  • 法律分析: 在法律代理基准上创下最高分,首个突破10%整体准确率
  • 计算机使用: Online-Mind2Web得分84%,大幅领先Opus 4.7和GPT-5.5

三大新特性

  1. 动态工作流: Claude Code中可运行数百个并行子代理,支持数十万行代码的跨库迁移
  2. 努力程度控制: 用户可调节模型投入的思考深度,低努力模式响应更快、消耗token更少
  3. Fast Mode降价: 提速2.5倍,价格降至此前版本的三分之一

价格与可用性

  • 定价不变:输入$5/百万token,输出$25/百万token
  • 已上线:claude.ai、Claude Code、Claude API、AWS Bedrock、Google Vertex AI、Microsoft Foundry
  • GitHub Copilot同日上线,Cursor同步支持

安全与对齐

  • 代码缺陷遗漏率比前代降低约4倍
  • 亲社会行为指标达到与Claude Mythos Preview相当水平
  • 欺骗等错位行为率显著低于Opus 4.7

来源: Anthropic + Axios + TechCrunch + 9to5Mac
链接: https://www.anthropic.com/news/claude-opus-4-8