AI 工具2026-05-09 16:00·Simon Willison Blog + moq.dev

WebRTC 的音频降级问题:OpenAI 低延迟语音 AI 的隐性代价

Discord 工程师 Luke Curley 指出 WebRTC 为降低延迟会激进地丢弃音频数据包,导致 LLM 语音输入质量下降。用户宁愿多等 200ms 获得准确转录,也不愿牺牲质量换速度。这揭示了低延迟语音 AI 在 Web 端的根本矛盾。

低延迟语音 AI 面临 Web 基础设施的意外限制

2026 年 5 月 9 日,Simon Willison 博客报道。

问题本质

  • WebRTC 为保持低延迟会激进丢弃音频数据包
  • 对 LLM 来说,不完整的 prompt 意味着垃圾回复
  • Discord 曾尝试在浏览器内重传 WebRTC 音频包但失败
  • Luke Curley(Moq.dev):「我不是特别想要快速回复,我想要好回复」

矛盾点

OpenAI 低延迟语音 AI 依赖 WebRTC 实现端到端低延迟,但 WebRTC 的设计哲学是「延迟优先于质量」——这对电话会议合理,对 LLM 语音交互却适得其反。

来源: Simon Willison Blog + moq.dev
链接: https://simonwillison.net/2026/May/9/luke-curley/