Agent2 天前·VentureBeat + MarkTechPost

月之暗面发布 Kimi K2.7-Code:开源编程模型,推理 Token 减少 30%,性能逼近 GPT-5.5

Moonshot AI(月之暗面)发布 Kimi K2.7-Code,基于万亿参数 MoE 架构(384 专家选 8),在 Kimi Code Bench v2 上从 K2.6 的 50.9 提升至 62.0(+21.8%),推理 Token 使用量减少约 30%。已开源(Modified MIT),同步上线 Cloudflare Workers AI、Hugging Face 和 Kimi Code CLI。

AI Master 解读

核心事件

Kimi K2.7-Code 开源发布,推理 Token 减少 30%,编程基准提升 21.8%。

行业影响

该模型基于万亿参数 MoE 架构,在 Kimi Code Bench v2 上达到 62.0,逼近 GPT-5.5(69.0)和 Claude Opus 4.8(67.4)。30% 的推理 Token 节省直接解决了 Agent 工作流中模型「过度思考」导致的成本问题,且采用 OpenAI 兼容 API 可一行切换。

AI Master 建议

建议在 Kimi API 或 Cloudflare Workers AI 上测试 K2.7-Code,评估其作为 GPT-5.5 或 Claude Opus 替代方案的可行性。

Kimi K2.7-Code:开源编程模型效率革命

2026 年 6 月 12 日,Moonshot AI 发布 Kimi K2.7-Code。

架构与性能

指标 K2.6 K2.7-Code GPT-5.5 Claude Opus 4.8
Kimi Code Bench v2 50.9 62.0 69.0 67.4
Program Bench 基准 +11% - -
MLS Bench Lite 基准 +31.5% - -
推理 Token 使用 基准 -30% - -

技术特点

  • MoE 架构: 384 个专家,每 Token 选 8 个 + 1 个共享
  • 总参数: 1T,活跃参数 32B/Token
  • 开源许可: Modified MIT
  • API 兼容: OpenAI SDK 和 Anthropic SDK,一行 base URL 切换

解决「过度思考」

K2.7-Code 的核心改进是减少推理过程中的「过度思考」(overthinking),在保持任务完成质量的前提下,将推理 Token 使用量降低约 30%。这直接降低了 Agent 工作流的运行成本。

可用平台

  • Moonshot API(platform.moonshot.ai)
  • Kimi Code CLI 和 IDE 编程代理
  • Hugging Face(moonshotai/Kimi-K2.7-Code)
  • Cloudflare Workers AI(@cf/moonshotai/kimi-k2.7-code)
  • Ollama / vLLM / SGLang 本地部署

社区争议

部分开发者指出 K2.7-Code 尚未提交 DeepSWE 独立基准测试(该测试区分度更高,70 分跨度 vs SWE-Bench Pro 的 30 分),呼吁更透明的第三方评估。

来源: VentureBeat + MarkTechPost + Cloudflare + Hugging Face
链接: https://venturebeat.com/technology/kimi-k2-7-code-cuts-thinking-tokens-30-practitioners-say-benchmarks-dont-check-out