MOSS-TTS

开源多模态 & 视觉3.1k

OpenMOSS 团队开源的高保真语音生成模型家族,支持语音合成、声音生成和多语言语音

🎯适用场景:高保真语音合成,适合语音助手、有声内容生成等场景

#text-to-speech#voice#speech-generation#open-source

📥 收录于 2026/6/6

📊 仓库数据

Stars3,134
语言Python

优点

  • 高保真语音质量
  • 支持多语言
  • 中国团队出品,中文效果好

⚠️ 限制

  • 需要 GPU 推理资源
  • 模型体积较大

🔗 相关工具

sherpa-onnx

开源13k↑+4

github.com/k2-fsa/sherpa-onnx

基于 ONNX 的多平台语音处理引擎,支持语音转文字(ASR)、文字转语音(TTS)、说话人分离、语音增强和 VAD 等功能,可在 Android/iOS/Raspberry Pi/嵌入式设备上运行。(12K+ stars)

🎯离线语音识别、嵌入式 TTS、语音助手后端、会议转录

#speech-to-text#text-to-speech#onnx#speech+1
语言C++
🍴 Forks1,453
🔄 更新2026/6/6
📥 收录2026/5/21

VibeVoice

开源48k↑+55

github.com/microsoft/VibeVoice

微软开源的前沿语音 AI 模型,支持高质量语音合成与声音克隆,适用于多语种 TTS 与语音交互场景

🎯机器人控制、仿真与边缘部署、语音合成与实时语音交互

#voice#speech#microsoft#开源
语言Python
🍴 Forks5,375
🔄 更新2026/6/6
📥 收录2026/5/18

MockingBird

开源37k

github.com/babysor/MockingBird

5 秒克隆声音,37K+ stars。5 秒克隆声音生成任意语音的实时语音合成工具,支持多语种语音克隆

🎯语音合成与实时语音交互

#ai#deep-learning#pytorch#speech+1
语言Python
🍴 Forks5,213
📅 上线2021/8/7
🔄 更新2026/6/5
📥 收录2026/5/20

CosyVoice

开源21k↑+6

github.com/FunAudioLLM/CosyVoice

阿里 FunAudioLLM 多语言语音生成大模型,提供推理、训练和部署全栈能力,支持跨语种合成和声音克隆。

🎯多语言语音合成、声音克隆、实时语音交互

#text-to-speech#voice-cloning#tts#multi-lingual
语言Python
🍴 Forks2,479
🔄 更新2026/6/6
📥 收录2026/5/31

index-tts

开源21k↑+2

github.com/index-tts/index-tts

工业级可控高效 TTS,4.4K+ stars。工业级可控高效的零样本文本转语音方案,支持语音克隆和风格控制

🎯机器人控制、仿真与边缘部署、语音合成与实时语音交互

#bigvgan#cross-lingual#indextts#text-to-speech+1
语言Python
🍴 Forks2,592
📅 上线2025/2/6
🔄 更新2026/6/6
📥 收录2026/5/20

edge-tts

开源11k↑+4

github.com/rany2/edge-tts

edge-tts 是一个 Python 库,利用微软 Edge 浏览器的在线语音合成服务实现文本转语音,无需安装 Edge 或 Windows,也不需要 API Key,支持多种语言和声音选择

🎯语音合成 / TTS

#speech-synthesis#text-to-speech#tts
语言Python
🍴 Forks1,040
📅 上线2026/3/22
🔄 更新2026/6/6
📥 收录2026/5/24