行业昨天·Ars Technica

小米MiMo-V2.5推理速度达ChatGPT和Claude的15倍,1T参数每秒1000 tokens

小米与推理合作伙伴TileRT联合推出MiMo-V2.5-Pro-UltraSpeed模型,在1万亿参数规模下实现每秒1000 tokens推理速度,在标准8-GPU节点上运行。Ars Technica报道称其速度是ChatGPT和Claude的15倍。这一突破得益于小米自研的推理优化技术和TileRT的高效部署方案。

AI Master 解读

核心事件

小米MiMo-V2.5-Pro-UltraSpeed实现1T参数模型每秒1000 tokens推理,速度达ChatGPT/Claude的15倍。

行业影响

影响分析: 推理速度是AI产品体验的核心瓶颈之一。小米在推理优化上的突破证明,通过架构创新和部署优化,超大模型也能实现实时响应。这对边缘场景和实时交互应用意义重大。

AI Master 建议

关注小米的推理优化技术细节,这可能为行业提供降本提速的新思路。推理速度的竞争将成为下一阶段AI竞争的重要维度。

小米MiMo推理速度达ChatGPT和Claude的15倍

2026年6月,Ars Technica报道,小米与TileRT联合推出的MiMo-V2.5-Pro-UltraSpeed模型实现了突破性推理速度。

核心数据

  • 参数量: 1万亿
  • 推理速度: 每秒1000 tokens
  • 硬件: 标准8-GPU节点
  • 对比: ChatGPT/Claude速度的15倍

技术亮点

  • 小米自研推理优化架构
  • TileRT高效部署方案
  • 在 commodity 硬件上实现(非专用加速芯片)

行业意义

  1. 实时交互: 超大模型也能实现毫秒级响应
  2. 成本降低: 标准硬件即可运行,无需专用加速器
  3. 竞争格局: 推理速度成为与模型能力并重的竞争维度