行业昨天·VentureBeat + Handy AI

Moonshot AI 发布 Kimi K2.7-Code:推理 Token 减少 30%,开源编码模型性价比碾压前沿闭源

月之暗面发布 Kimi K2.7-Code 开源编码模型,1T 参数 MoE 架构(32B 活跃),256K 上下文窗口,API 价格仅 $0.95/百万输入 Token,较 K2.6 推理 Token 消耗降低 30%。

AI Master 解读

核心事件

Kimi K2.7-Code 开源发布,主打「减少过度思考」,推理效率大幅提升

行业影响

这是开源编码模型首次在推理效率维度上系统性优化,而非单纯追求基准分数。K2.7-Code 在 MCP Mark Verified 上报告 81.1 分(Opus 4.8 为 76.4),但 VentureBeat 指出独立基准验证尚待跟进。Modified MIT 许可证允许商业使用,对于运行大量 Agent 工作流的团队,推理 Token 效率直接影响成本。

AI Master 建议

建议在非关键路径上测试 K2.7-Code 替换 K2.6 或 GPT-5.5,评估实际成本节省。

Moonshot AI 发布 Kimi K2.7-Code

2026 年 6 月 12 日,月之暗面(Moonshot AI)发布 Kimi K2.7-Code,这是 K2 系列的第五次重大迭代,也是首次在名称中加入「Code」标识。

核心参数

  • 架构: 1T 参数 MoE(32B 活跃参数)
  • 上下文窗口: 262K tokens
  • 许可证: Modified MIT(大规模商业使用需署名)
  • API 定价: $0.95/百万输入 Token,$4.00/百万输出 Token
  • 缓存命中: $0.19/百万 Token
  • 自托管: HuggingFace 权重免费,支持 vLLM/SGLang 部署

相比 K2.6 的核心改进

  1. 推理 Token 减少 30%:专门训练减少「过度思考」,降低推理成本
  2. 直接生成实现代码:不再通过包装现有库,而是直接编写底层实现
  3. 跨语言泛化增强:Rust、Go、Python 表现更稳定
  4. 仅支持 thinking 模式:温度固定为 1.0,不支持确定性调节

基准表现(自报告)

  • MCP Mark Verified: 81.1(Opus 4.8 为 76.4,GPT-5.5 为 92.9)
  • OpenRouter 周榜排名(基于开发者实际 API 路由决策)表现强劲

社区反馈

Reddit 用户报告实际 Token 消耗降低约 26%,接近官方宣称的 30%。但 VentureBeat 指出独立基准验证尚待跟进,自报告数据需谨慎看待。

来源: VentureBeat + Handy AI + OpenRouter + Reddit
链接: https://venturebeat.com/technology/kimi-k2-7-code-cuts-thinking-tokens-30-practitioners-say-benchmarks-dont-check-out