行业昨天·VentureBeat + Handy AI
Moonshot AI 发布 Kimi K2.7-Code:推理 Token 减少 30%,开源编码模型性价比碾压前沿闭源
月之暗面发布 Kimi K2.7-Code 开源编码模型,1T 参数 MoE 架构(32B 活跃),256K 上下文窗口,API 价格仅 $0.95/百万输入 Token,较 K2.6 推理 Token 消耗降低 30%。
AI Master 解读
核心事件
Kimi K2.7-Code 开源发布,主打「减少过度思考」,推理效率大幅提升
行业影响
这是开源编码模型首次在推理效率维度上系统性优化,而非单纯追求基准分数。K2.7-Code 在 MCP Mark Verified 上报告 81.1 分(Opus 4.8 为 76.4),但 VentureBeat 指出独立基准验证尚待跟进。Modified MIT 许可证允许商业使用,对于运行大量 Agent 工作流的团队,推理 Token 效率直接影响成本。
AI Master 建议
建议在非关键路径上测试 K2.7-Code 替换 K2.6 或 GPT-5.5,评估实际成本节省。
Moonshot AI 发布 Kimi K2.7-Code
2026 年 6 月 12 日,月之暗面(Moonshot AI)发布 Kimi K2.7-Code,这是 K2 系列的第五次重大迭代,也是首次在名称中加入「Code」标识。
核心参数
- 架构: 1T 参数 MoE(32B 活跃参数)
- 上下文窗口: 262K tokens
- 许可证: Modified MIT(大规模商业使用需署名)
- API 定价: $0.95/百万输入 Token,$4.00/百万输出 Token
- 缓存命中: $0.19/百万 Token
- 自托管: HuggingFace 权重免费,支持 vLLM/SGLang 部署
相比 K2.6 的核心改进
- 推理 Token 减少 30%:专门训练减少「过度思考」,降低推理成本
- 直接生成实现代码:不再通过包装现有库,而是直接编写底层实现
- 跨语言泛化增强:Rust、Go、Python 表现更稳定
- 仅支持 thinking 模式:温度固定为 1.0,不支持确定性调节
基准表现(自报告)
- MCP Mark Verified: 81.1(Opus 4.8 为 76.4,GPT-5.5 为 92.9)
- OpenRouter 周榜排名(基于开发者实际 API 路由决策)表现强劲
社区反馈
Reddit 用户报告实际 Token 消耗降低约 26%,接近官方宣称的 30%。但 VentureBeat 指出独立基准验证尚待跟进,自报告数据需谨慎看待。
来源: VentureBeat + Handy AI + OpenRouter + Reddit
链接: https://venturebeat.com/technology/kimi-k2-7-code-cuts-thinking-tokens-30-practitioners-say-benchmarks-dont-check-out