Agent2 天前·VentureBeat + MarkTechPost

月之暗面发布 Kimi K2.7-Code：开源编程模型，推理 Token 减少 30%，性能逼近 GPT-5.5

Moonshot AI（月之暗面）发布 Kimi K2.7-Code，基于万亿参数 MoE 架构（384 专家选 8），在 Kimi Code Bench v2 上从 K2.6 的 50.9 提升至 62.0（+21.8%），推理 Token 使用量减少约 30%。已开源（Modified MIT），同步上线 Cloudflare Workers AI、Hugging Face 和 Kimi Code CLI。

AI Master 解读

核心事件

Kimi K2.7-Code 开源发布，推理 Token 减少 30%，编程基准提升 21.8%。

行业影响

该模型基于万亿参数 MoE 架构，在 Kimi Code Bench v2 上达到 62.0，逼近 GPT-5.5（69.0）和 Claude Opus 4.8（67.4）。30% 的推理 Token 节省直接解决了 Agent 工作流中模型「过度思考」导致的成本问题，且采用 OpenAI 兼容 API 可一行切换。

AI Master 建议

建议在 Kimi API 或 Cloudflare Workers AI 上测试 K2.7-Code，评估其作为 GPT-5.5 或 Claude Opus 替代方案的可行性。

Kimi K2.7-Code：开源编程模型效率革命

2026 年 6 月 12 日，Moonshot AI 发布 Kimi K2.7-Code。

架构与性能


指标	K2.6	K2.7-Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	基准	+11%	-	-
MLS Bench Lite	基准	+31.5%	-	-
推理 Token 使用	基准	-30%	-	-

技术特点

MoE 架构: 384 个专家，每 Token 选 8 个 + 1 个共享
总参数: 1T，活跃参数 32B/Token
开源许可: Modified MIT
API 兼容: OpenAI SDK 和 Anthropic SDK，一行 base URL 切换

解决「过度思考」

K2.7-Code 的核心改进是减少推理过程中的「过度思考」（overthinking），在保持任务完成质量的前提下，将推理 Token 使用量降低约 30%。这直接降低了 Agent 工作流的运行成本。

可用平台

Moonshot API（platform.moonshot.ai）
Kimi Code CLI 和 IDE 编程代理
Hugging Face（moonshotai/Kimi-K2.7-Code）
Cloudflare Workers AI（@cf/moonshotai/kimi-k2.7-code）
Ollama / vLLM / SGLang 本地部署

社区争议

部分开发者指出 K2.7-Code 尚未提交 DeepSWE 独立基准测试（该测试区分度更高，70 分跨度 vs SWE-Bench Pro 的 30 分），呼吁更透明的第三方评估。

来源: VentureBeat + MarkTechPost + Cloudflare + Hugging Face
链接: https://venturebeat.com/technology/kimi-k2-7-code-cuts-thinking-tokens-30-practitioners-say-benchmarks-dont-check-out

📰 原始来源

https://venturebeat.com/technology/kimi-k2-7-code-cuts-thinking-tokens-30-practitioners-say-benchmarks-dont-check-out

← 上一篇

Google I/O 2026：Search 迎来 25 年最大改造，AI Agent 取代搜索框

Meta Applied AI 部门爆发内部反抗：6500 名工程师称被强制征召，称工作为'灵魂碾碎机'

📰 更多动态

Agent2026-06-14