大语言模型2026-05-23 07:00·AITOP100

智谱联合 TileRT 推出 GLM-5.1 高速版 API,推理速度提升显著

智谱 AI 与 TileRT 合作推出 GLM-5.1 高速版 API,在保持模型精度的同时大幅提升推理速度,为实时应用场景提供更低延迟的推理服务。

GLM-5.1 高速版正式上线

2026 年 5 月 22 日,AITOP100 报道。

性能提升

  • 推理加速: 相比 GLM-5 标准版,高速版推理速度提升明显,适合对延迟敏感的场景
  • 精度保持: 通过 TileRT 的推理优化技术,在加速的同时保持了模型输出质量
  • API 兼容: 完全兼容现有 GLM API 接口,用户可无缝迁移

应用前景

高速版 API 的推出使 GLM 系列模型能够进入更多实时交互场景,如智能客服、实时翻译和在线游戏 NPC 等。

来源: AITOP100
链接: https://www.aitop100.cn/daily-ai-news