GLM-5.1 高速版正式上线
2026 年 5 月 22 日,AITOP100 报道。
性能提升
- 推理加速: 相比 GLM-5 标准版,高速版推理速度提升明显,适合对延迟敏感的场景
- 精度保持: 通过 TileRT 的推理优化技术,在加速的同时保持了模型输出质量
- API 兼容: 完全兼容现有 GLM API 接口,用户可无缝迁移
应用前景
高速版 API 的推出使 GLM 系列模型能够进入更多实时交互场景,如智能客服、实时翻译和在线游戏 NPC 等。
来源: AITOP100
链接: https://www.aitop100.cn/daily-ai-news