大语言模型2026-05-16 16:00·智谱 AI + 腾讯云开发者社区

智谱 GLM-5.1 发布:支持 8 小时长程自主任务执行,编码能力逼近 Claude Opus 4.6

智谱 AI 发布 GLM-5.1 模型升级版,重点提升长程任务执行能力,单次任务可持续自主工作 8 小时,完成规划、执行、测试到修复交付的完整流程。在 Claude Code 编码评测中达到 Opus 4.6 的 94.6%,开源模型编码能力最快逼近闭源头部模型。

GLM-5.1:8 小时自主智能体的里程碑

2026 年 5 月,智谱 AI 官方文档 + 腾讯云开发者社区报道。

技术突破

  • 8 小时持续执行:相较于分钟级交互的主流模型,GLM-5.1 可单次自主工作长达 8 小时
  • 编码能力 94.6%:在 Claude Code 评测中达到 Opus 4.6 的 94.6%,开源最快逼近闭源
  • 完整工作流闭环:从任务规划、代码执行、自动化测试到修复和交付的完整流程
  • Agentic Engineering 升级:延续 GLM-5 的智能体工程方向,进一步增强长程任务能力

行业定位

GLM-5.1 的发布进一步强化了智谱在国产大模型中的"全能旗舰"定位。744B 参数、200K 上下文、8 小时自主执行,这些指标使 GLM-5.1 成为国产模型中面向复杂工程任务的最强选手。

来源: 智谱 AI + 腾讯云
链接: https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1