← 首页/AI 资讯

应用2026-05-12 16:00·OpenAI Blog + TechCrunch

OpenAI 推出新语音智能 API 功能：低延迟语音 AI 的大规模实践

OpenAI 在 API 中新增了多项语音智能功能，同时公开了其如何实现大规模低延迟语音 AI 的技术细节。语音 AI 正在从'能用'走向'好用'。

OpenAI 在两个层面推进了语音 AI 能力。

一方面，在 ChatGPT API 中新增了语音智能功能，让开发者能够构建更自然的语音交互应用。

另一方面，OpenAI 公开了其低延迟语音 AI 的大规模实践：

端到端延迟：优化到人类对话级别的延迟（<200ms）
规模部署：支持数百万并发用户的同时语音交互
成本控制：通过推理优化和模型压缩，降低语音交互的单位成本

TechCrunch 同时报道了 Wispr Flow 在印度市场的语音 AI 尝试——印度语言多样性和口音差异使得语音 AI 落地格外困难，但也意味着巨大的市场空间。

语音 AI 正在从演示级产品走向生产级基础设施。

来源： OpenAI Blog + TechCrunch
链接： https://openai.com/index/delivering-low-latency-voice-ai-at-scale/

📰 原始来源

https://openai.com/index/delivering-low-latency-voice-ai-at-scale/

← 上一篇

Mozilla 用 Claude Mythos 加固 Firefox：AI 编码进入安全关键领域

下一篇 →

多款 AI 虚拟伴侣 App 擦边严重：充值 13 元就可定制色情 AI 人设

📰 更多动态

行业2026-05-13 04:00

世界银行发布 2026 年世界发展报告：AI 正在重塑全球发展格局

行业2026-05-13 04:00

OpenAI 和 Anthropic 主导 2026 AI 竞赛：模型、企业与算力全面领先

安全2026-05-13 04:00

Google Chrome 被曝静默下载 4GB AI 模型到用户设备：未经同意，涉嫌违法