MLX Audio

基于 Apple MLX 框架的语音合成与识别库,支持 TTS、STT 和 STT,在 Apple Silicon 上高效运行。

🎯适用场景:在 Mac 上本地运行高质量的语音合成和识别

#tts#stt#speech#mlx#apple-silicon#text-to-speech

📥 收录于 2026/6/10

📊 仓库数据

Stars7,334
Forks628
语言Python
更新2026/6/12

📈 Stars 变化 2 天 +20· 统计区间 6/10 18:12 → 6/12 07:12(2 天)

优点

  • Apple Silicon 原生优化,推理速度极快
  • 同时支持 TTS、STT 和语音转换
  • 基于 Transformers 生态,模型兼容性好

⚠️ 限制

  • 仅限 Apple Silicon 硬件
  • 模型选择相对有限

🔗 相关工具

VibeVoice

开源49k+57

github.com/microsoft/VibeVoice

微软开源的前沿语音 AI 模型,支持高质量语音合成与声音克隆,适用于多语种 TTS 与语音交互场景

🎯机器人控制、仿真与边缘部署、语音合成与实时语音交互

#voice#speech#microsoft#开源
语言Python
🍴 Forks5,472
🔄 更新2026/6/12
📥 收录2026/5/18

MockingBird

开源37k+3

github.com/babysor/MockingBird

5 秒克隆声音,37K+ stars。5 秒克隆声音生成任意语音的实时语音合成工具,支持多语种语音克隆

🎯语音合成与实时语音交互

#ai#深度学习#pytorch#speech+1
语言Python
🍴 Forks5,209
📅 上线2021/8/7
🔄 更新2026/6/11
📥 收录2026/5/20

Fish Speech

开源31k+25

github.com/fishaudio/fish-speech

SOTA 开源 TTS,30K+ stars。最先进的开源文本转语音方案,支持高质量语音合成和多语种语音克隆

🎯语音合成与实时语音交互

#llama#Transformer#tts#valle+1
语言Python
🍴 Forks2,622
📅 上线2023/10/10
🔄 更新2026/6/12
📥 收录2026/5/20

CosyVoice

开源22k+29

github.com/FunAudioLLM/CosyVoice

阿里 FunAudioLLM 多语言语音生成大模型,提供推理、训练和部署全栈能力,支持跨语种合成和声音克隆。

🎯多语言语音合成、声音克隆、实时语音交互

#语音合成#voice-cloning#tts#multi-lingual
语言Python
🍴 Forks2,485
🔄 更新2026/6/12
📥 收录2026/5/31

Index Tts

开源21k+28

github.com/index-tts/index-tts

工业级可控高效 TTS,4.4K+ stars。工业级可控高效的零样本文本转语音方案,支持语音克隆和风格控制

🎯机器人控制、仿真与边缘部署、语音合成与实时语音交互

#bigvgan#cross-lingual#indextts#语音合成+1
语言Python
🍴 Forks2,608
📅 上线2025/2/6
🔄 更新2026/6/12
📥 收录2026/5/20

Edge Tts

开源11k+20

github.com/rany2/edge-tts

edge-tts 是一个 Python 库,利用微软 Edge 浏览器的在线语音合成服务实现文本转语音,无需安装 Edge 或 Windows,也不需要 API Key,支持多种语言和声音选择

🎯语音合成 / TTS

#语音合成#tts
语言Python
🍴 Forks1,042
📅 上线2026/3/22
🔄 更新2026/6/12
📥 收录2026/5/24