LocalAI

开源多模态 & 视觉 › 语音识别 ASR 推理 & 运维 › 推理引擎⭐ 47k↑+4

开源本地 AI 引擎，45,607+ stars。完全兼容 OpenAI API 的本地 AI 推理引擎，支持 LLM、语音识别、图像生成等多种模型，数据完全本地处理保护隐私

🎯适用场景：生产环境模型推理服务、多模态内容理解与生成

#本地部署#隐私保护#OpenAI 兼容#多模型

📥 收录于 2026/4/20

访问工具 📖 官方文档

📊 仓库数据

Stars47,205

Forks4,182

语言Go

上线2023/3/19

更新2026/6/28

📈 Stars 变化 ↑6 小时 +4· 统计区间 6/28 18:12 → 6/29 00:15（6 小时）

✅ 优点

•数据完全本地处理
•OpenAI API 兼容无缝切换
•支持多种模型
•隐私安全有保障

⚠️ 限制

•硬件要求较高
•推理速度不如云服务
•部分高级模型不支持本地运行

🔗 相关工具

FunASR

开源⭐ 19k↑+18

github.com/modelscope/FunASR

阿里 ModelScope 出品的工业级语音识别工具包，170 倍实时、50+ 语言、说话人分离、情绪检测、流式识别，并提供 OpenAI 兼容 API。16K+ stars，是中文语音 AI 的标杆项目

🎯语音识别转写、会议记录自动转录、智能客服语音理解

#ASR#语音识别#多语言#流式识别+1

语言Python

🍴 Forks1,894

🔄 更新2026/6/28

📥 收录2026/6/2

OpenAI Whisper

开源⭐ 104k↑+11

github.com/openai/whisper

OpenAI 开源语音识别模型，99.9K+ stars。支持 99 种语言自动语音识别与翻译，可本地部署保护隐私，广泛用于会议转录、字幕生成等场景

🎯多语言语音转文字、音频转录、本地私有化语音识别

#语音识别#多语言#转录

语言Python

🍴 Forks12,635

📅 上线2022/9/17

🔄 更新2026/6/28

📥 收录2026/4/11

Whisper.cpp

开源⭐ 51k↑+5

github.com/ggml-org/whisper.cpp

OpenAI Whisper C/C++ 移植，48,793+ stars。高性能语音识别引擎，将 OpenAI Whisper 移植到 C/C++，支持 99 种语言的语音转文字，CPU 即可高效运行

🎯多模态内容理解与生成

#语音识别#Whisper#C++#跨平台

语言C++

🍴 Forks5,708

📅 上线2022/9/26

🔄 更新2026/6/28

📥 收录2026/4/20

DeepSpeech

开源⭐ 27k

github.com/mozilla/DeepSpeech

DeepSpeech 是 Mozilla 开发的开源语音转文字引擎，基于深度学习技术，支持离线和嵌入式运行。可从树莓派到高性能 GPU 服务器实时运行，是语音识别领域的经典开源项目。26K+ stars。

🎯离线语音转文字、嵌入式语音识别、隐私优先的语音应用

#深度学习#Deepspeech#Embedded#机器学习

语言C++

🍴 Forks4,086

🔄 更新2026/6/28

📥 收录2026/6/3

Faster Whisper

开源⭐ 24k↑+3

github.com/SYSTRAN/faster-whisper

基于 CTranslate2 的加速版 Whisper 语音转文字引擎，支持多种量化格式和 GPU 加速，提供高性能语音识别和转录能力

🎯高性能语音识别和转录

#speech-to-text#whisper#推理#量化

语言Python

🍴 Forks1,954

🔄 更新2026/6/28

📥 收录2026/5/31

WhisperX

开源⭐ 23k↑+7

github.com/m-bain/whisperX

Whisper 增强版语音识别工具，支持词级时间戳和说话人分离（Diarization）。在 OpenAI Whisper 基础上大幅提升语音转文字精度，是 AI 语音处理流水线的标准组件。22K stars

🎯多模态内容理解与生成

#语音识别#Whisper#说话人分离#时间戳

语言Python

🍴 Forks2,326

📅 上线2023/1/1

🔄 更新2026/6/28

📥 收录2026/6/5

← 浏览全部 1238 个工具