行业昨天·Ars Technica
小米MiMo-V2.5推理速度达ChatGPT和Claude的15倍,1T参数每秒1000 tokens
小米与推理合作伙伴TileRT联合推出MiMo-V2.5-Pro-UltraSpeed模型,在1万亿参数规模下实现每秒1000 tokens推理速度,在标准8-GPU节点上运行。Ars Technica报道称其速度是ChatGPT和Claude的15倍。这一突破得益于小米自研的推理优化技术和TileRT的高效部署方案。
AI Master 解读
核心事件
小米MiMo-V2.5-Pro-UltraSpeed实现1T参数模型每秒1000 tokens推理,速度达ChatGPT/Claude的15倍。
行业影响
影响分析: 推理速度是AI产品体验的核心瓶颈之一。小米在推理优化上的突破证明,通过架构创新和部署优化,超大模型也能实现实时响应。这对边缘场景和实时交互应用意义重大。
AI Master 建议
关注小米的推理优化技术细节,这可能为行业提供降本提速的新思路。推理速度的竞争将成为下一阶段AI竞争的重要维度。
小米MiMo推理速度达ChatGPT和Claude的15倍
2026年6月,Ars Technica报道,小米与TileRT联合推出的MiMo-V2.5-Pro-UltraSpeed模型实现了突破性推理速度。
核心数据
- 参数量: 1万亿
- 推理速度: 每秒1000 tokens
- 硬件: 标准8-GPU节点
- 对比: ChatGPT/Claude速度的15倍
技术亮点
- 小米自研推理优化架构
- TileRT高效部署方案
- 在 commodity 硬件上实现(非专用加速芯片)
行业意义
- 实时交互: 超大模型也能实现毫秒级响应
- 成本降低: 标准硬件即可运行,无需专用加速器
- 竞争格局: 推理速度成为与模型能力并重的竞争维度