月之暗面发布 Kimi K2.7-Code:开源编程模型,推理 Token 减少 30%,性能逼近 GPT-5.5
Moonshot AI(月之暗面)发布 Kimi K2.7-Code,基于万亿参数 MoE 架构(384 专家选 8),在 Kimi Code Bench v2 上从 K2.6 的 50.9 提升至 62.0(+21.8%),推理 Token 使用量减少约 30%。已开源(Modified MIT),同步上线 Cloudflare Workers AI、Hugging Face 和 Kimi Code CLI。
AI Master 解读
核心事件
Kimi K2.7-Code 开源发布,推理 Token 减少 30%,编程基准提升 21.8%。
行业影响
该模型基于万亿参数 MoE 架构,在 Kimi Code Bench v2 上达到 62.0,逼近 GPT-5.5(69.0)和 Claude Opus 4.8(67.4)。30% 的推理 Token 节省直接解决了 Agent 工作流中模型「过度思考」导致的成本问题,且采用 OpenAI 兼容 API 可一行切换。
AI Master 建议
建议在 Kimi API 或 Cloudflare Workers AI 上测试 K2.7-Code,评估其作为 GPT-5.5 或 Claude Opus 替代方案的可行性。
Kimi K2.7-Code:开源编程模型效率革命
2026 年 6 月 12 日,Moonshot AI 发布 Kimi K2.7-Code。
架构与性能
| 指标 | K2.6 | K2.7-Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 基准 | +11% | - | - |
| MLS Bench Lite | 基准 | +31.5% | - | - |
| 推理 Token 使用 | 基准 | -30% | - | - |
技术特点
- MoE 架构: 384 个专家,每 Token 选 8 个 + 1 个共享
- 总参数: 1T,活跃参数 32B/Token
- 开源许可: Modified MIT
- API 兼容: OpenAI SDK 和 Anthropic SDK,一行 base URL 切换
解决「过度思考」
K2.7-Code 的核心改进是减少推理过程中的「过度思考」(overthinking),在保持任务完成质量的前提下,将推理 Token 使用量降低约 30%。这直接降低了 Agent 工作流的运行成本。
可用平台
- Moonshot API(platform.moonshot.ai)
- Kimi Code CLI 和 IDE 编程代理
- Hugging Face(moonshotai/Kimi-K2.7-Code)
- Cloudflare Workers AI(@cf/moonshotai/kimi-k2.7-code)
- Ollama / vLLM / SGLang 本地部署
社区争议
部分开发者指出 K2.7-Code 尚未提交 DeepSWE 独立基准测试(该测试区分度更高,70 分跨度 vs SWE-Bench Pro 的 30 分),呼吁更透明的第三方评估。
来源: VentureBeat + MarkTechPost + Cloudflare + Hugging Face
链接: https://venturebeat.com/technology/kimi-k2-7-code-cuts-thinking-tokens-30-practitioners-say-benchmarks-dont-check-out