低延迟语音 AI 面临 Web 基础设施的意外限制
2026 年 5 月 9 日,Simon Willison 博客报道。
问题本质
- WebRTC 为保持低延迟会激进丢弃音频数据包
- 对 LLM 来说,不完整的 prompt 意味着垃圾回复
- Discord 曾尝试在浏览器内重传 WebRTC 音频包但失败
- Luke Curley(Moq.dev):「我不是特别想要快速回复,我想要好回复」
矛盾点
OpenAI 低延迟语音 AI 依赖 WebRTC 实现端到端低延迟,但 WebRTC 的设计哲学是「延迟优先于质量」——这对电话会议合理,对 LLM 语音交互却适得其反。
来源: Simon Willison Blog + moq.dev
链接: https://simonwillison.net/2026/May/9/luke-curley/