AI 技术2026-05-10 00:00·Simon Willison Blog + moq.dev

OpenAI 低延迟语音的 WebRTC 困境:网络差时主动丢弃 prompt,用户无法选择「等待」

Discord 工程师指出 OpenAI 低延迟语音方案中 WebRTC 的设计问题:为保持低延迟主动丢弃音频包,用户宁愿多等 200ms 保证 prompt 完整但 WebRTC 不允许。浏览器中无法重传 WebRTC 音频包。

WebRTC 的 AI 语音困境:延迟 vs 完整性

2026 年 5 月 9 日,Simon Willison 引用 Discord 工程师 Luke Curley 对 OpenAI 低延迟语音 AI 的批评。

核心问题

WebRTC 的设计哲学是「延迟优先于完整性」:

  • 主动丢弃音频包以保持低延迟
  • 网络不佳时用户 prompt 被降级或丢弃
  • 用户宁愿多等 200ms 保证 prompt 完整,但 WebRTC 不允许
  • 浏览器中无法重传 WebRTC 音频包

根本矛盾

会议通话需要快速来回 → WebRTC 选择正确
LLM 交互 prompt 不完整 = 垃圾回复 → WebRTC 选择错误

来源: Simon Willison Blog + moq.dev
链接: https://simonwillison.net/2026/May/9/luke-curley/