← 首页/AI 资讯

大语言模型2 天前·Anthropic + Axios + TechCrunch

Anthropic正式发布Claude Opus 4.8：更强编码、Agent与法律分析能力

Anthropic于5月28日发布Claude Opus 4.8，在编码、代理任务、推理和金融分析等关键基准上全面超越前代Opus 4.7。新增动态工作流（Dynamic Workflows）支持数百个子代理并行执行，用户可自主调节模型努力程度（Effort Control），Fast Mode提速2.5倍且价格降至此前三分之一。

Claude Opus 4.8 正式发布

Anthropic于2026年5月28日发布Claude Opus 4.8，这是其最先进公开可用模型的最新版本。

核心能力提升

编码能力: 在Terminal-Bench 2.1上达到行业领先水平，CursorBench各努力级别均超越前代
代理任务: Super-Agent基准上唯一完成全部端到端案例的模型，超越GPT-5.5
法律分析: 在法律代理基准上创下最高分，首个突破10%整体准确率
计算机使用: Online-Mind2Web得分84%，大幅领先Opus 4.7和GPT-5.5

三大新特性

动态工作流: Claude Code中可运行数百个并行子代理，支持数十万行代码的跨库迁移
努力程度控制: 用户可调节模型投入的思考深度，低努力模式响应更快、消耗token更少
Fast Mode降价: 提速2.5倍，价格降至此前版本的三分之一

价格与可用性

定价不变：输入$5/百万token，输出$25/百万token
已上线：claude.ai、Claude Code、Claude API、AWS Bedrock、Google Vertex AI、Microsoft Foundry
GitHub Copilot同日上线，Cursor同步支持

安全与对齐

代码缺陷遗漏率比前代降低约4倍
亲社会行为指标达到与Claude Mythos Preview相当水平
欺骗等错位行为率显著低于Opus 4.7

来源: Anthropic + Axios + TechCrunch + 9to5Mac
链接: https://www.anthropic.com/news/claude-opus-4-8

📰 原始来源

https://www.anthropic.com/news/claude-opus-4-8

← 上一篇

Anthropic完成650亿美元H轮融资，估值达9650亿美元

下一篇 →

Google Gemini新增文件生成与导出功能，从聊天工具向工作系统转型

📰 更多动态

行业2026-06-04

SpaceX IPO路演6月4日启动，6月12日纳斯达克挂牌交易

大语言模型2026-05-31

微软为后 OpenAI 时代做准备，物色 AI 初创企业并放弃收购 Cursor

开源项目2026-05-31

腾讯开源 Agent Memory + 微信元宝支持一键总结群聊，AI 社交工具链成型