大语言模型昨天·Anthropic 官方 + WSJ

Anthropic 发布 Claude Opus 4.8,唯一完成 Super-Agent 全基准测试的模型

Anthropic 发布 Claude Opus 4.8,成为首个完成 Super-Agent 全基准测试的模型。配合此前发布的 Claude Design(Anthropic Labs 产品),Claude 在专业设计协作和企业级 Agent 领域持续拓展边界。

Claude Opus 4.8: Super-Agent 新标杆

2026 年 6 月初,Anthropic 发布 Claude Opus 4.8。

关键能力

  • Super-Agent 全基准测试: 唯一完成全部测试的模型
  • 企业应用: Claude Cowork 和 Claude Code 推动企业用户数超越 OpenAI
  • 设计协作: Claude Design 让非设计师也能与 Claude 协作创建专业视觉作品

行业意义

Claude 系列正在从 "聊天机器人" 向 "专业工作伙伴" 转型。Karpathy 加入预训练团队后,下一代 Claude 的预训练效率有望大幅提升。

来源: Anthropic 官方 + WSJ
链接: https://www.anthropic.com/news