大语言模型3 天前·智谱AI + 澎湃新闻 + 知乎

智谱发布GLM-5.1开源模型:在SWE-bench Pro基准上首次超越Opus 4.6

智谱AI发布新一代开源模型GLM-5.1,号称全球最强开源模型,支持8小时级持续工作,代码能力超越Claude Opus 4.6。

智谱AI于4月8日正式发布新一代开源模型GLM-5.1,官方称这是目前全球最强的开源模型。据官方介绍,GLM-5.1是唯一达到8小时级持续工作的开源模型,在最接近真实软件开发的SWE-bench Pro基准测试中,实现了国产模型首次超越Anthropic的Claude Opus 4.6。

GLM-5.1的发布标志着开源模型能力正在快速逼近闭源旗舰模型。在此之前,开源模型在编程和推理任务中普遍落后于闭源模型1-2代的差距,而GLM-5.1在软件工程任务上已实现反超。

值得注意的是,智谱AI已于2026年1月通过港交所聆讯并上市,市值一度超5700亿港元。公司披露付费开发者超24万人,为金融机构和政府单位提供本地化部署的ARR收入增长了60倍。这表明开源模型的商业化路径——通过本地部署和企业服务变现——正在被验证。

开源模型的崛起对行业格局有深远影响:中小企业可以用更低的成本获得接近顶级的AI能力,这将加速AI在各行业的渗透。