OpenAI 正在把语音能力深度集成到其 API 平台。
新功能亮点
- 实时语音理解:API 现在可以接收音频流并实时返回文本理解和语义分析
- 情感识别:语音模型能识别说话者的情绪状态和语调变化
- 多语言交互:支持跨语言语音对话,实时翻译
- 低延迟:端到端延迟控制在 200ms 以内
应用场景
- 智能客服系统
- 实时会议翻译
- 语音驱动的 AI Agent
来源: TechCrunch + OpenAI Blog
链接: https://techcrunch.com/2026/05/07/openai-launches-new-voice-intelligence-features-in-its-api/