大语言模型2026-05-07 00:00·CSDN + 腾讯云 + Unite AI + NIST

中国四大 AI 实验室 12 天内密集发布开源代码模型,Agentic 编程能力逼近西方前沿

智谱 GLM-5.1、MiniMax M2.7、月之暗面 Kimi K2.6 和 DeepSeek V4 在两周内相继发布,均以显著低于西方前沿模型的成本实现了接近的 Agentic 编程能力。NIST 评估显示 DeepSeek V4-Pro 在跨领域基准上落后美国前沿约 8 个月。

中国开源 AI 模型进入密集爆发期。

四大模型对比

模型 发布方 参数 许可证 特点
GLM-5.1 Z.ai(智谱) 754B MIT 10 万张昇腾 910B 训练,零 NVIDIA
Kimi K2.6 月之暗面 1T Modified MIT 每 token 激活 32B,成本更低
MiniMax M2.7 MiniMax - - 自我进化 Agent 模型
DeepSeek V4 DeepSeek - - 100 万 token 上下文

关键数据

  • NL2Repo 基准:GLM-5.1 得分 42.7%,超越 Claude Opus 4.6(33.4%)和 GPT-5.4(41.3%)
  • 成本优势:Kimi K2.6 输入 $0.60/M token,比 GLM-5.1 便宜约 43%
  • NIST 评估:DeepSeek V4-Pro 在跨领域基准上落后美国前沿约 8 个月
  • 四强横评:GPT-5.5、DeepSeek V4-Pro、GLM-5.1、MiniMax M2.7 同台竞争

来源: CSDN + 腾讯云 + Unite AI + NIST
链接: https://hwcomputing.csdn.net/69ecd54d0a2f6a37c5a61484.html