Faster Whisper

开源多模态 & 视觉 › 语音识别 ASR⭐ 24k↑+15

基于 CTranslate2 的加速版 Whisper 语音转文字引擎，支持多种量化格式和 GPU 加速，提供高性能语音识别和转录能力

🎯适用场景：高性能语音识别和转录

#speech-to-text#whisper#推理#量化

📥 收录于 2026/5/31

访问工具

📊 仓库数据

Stars24,264

Forks1,980

语言Python

协议MIT

更新2026/7/14

📈 Stars 变化 ↑13 小时 +15· 统计区间 7/13 23:54 → 7/14 13:02（13 小时）

✅ 优点

•比原始 Whisper 快 4 倍，显存占用降低
•支持多种量化格式

⚠️ 限制

•仅支持 x86_64 和 aarch64
•CTranslate2 依赖增加部署复杂度

🔗 相关工具

Sherpa Onnx

开源⭐ 14k↑+7

github.com/k2-fsa/sherpa-onnx

基于 ONNX 的多平台语音处理引擎，支持语音转文字（ASR）、文字转语音（TTS）、说话人分离、语音增强和 VAD 等功能，可在 Android/iOS/Raspberry Pi/嵌入式设备上运行。（12K+ stars）

🎯离线语音识别、嵌入式 TTS、语音助手后端、会议转录

#speech-to-text#语音合成#onnx#speech+1

语言C++

🍴 Forks1,552

🔄 更新2026/7/14

📥 收录2026/5/21

Go OpenAI

开源⭐ 11k↑+2

github.com/sashabaranov/go-openai

Go 语言的 OpenAI API 客户端，10K+ stars。支持 ChatGPT、GPT-5、GPT-Image-1、Whisper API 等，是 Go 生态接入 OpenAI 的首选方案

🎯Go 语言 LLM API 接入与路由

#chatgpt#go#golang#openai+1

语言Go

🍴 Forks1,697

🔄 更新2026/7/14

📥 收录2026/5/29

Silero VAD

开源⭐ 9.6k↑+2

github.com/snakers4/silero-vad

企业级预训练语音活动检测器，轻量高效。支持流式和离线模式，可精确检测语音起止点，是语音识别、会议转录、客服质检等场景的基础设施

🎯语音识别前置处理、会议/客服音频分割、实时语音流检测

#voice-activity-detection#speech-processing#audio#whisper+1

语言Python

🍴 Forks803

📅 上线2021/6/1

🔄 更新2026/7/14

📥 收录2026/6/4

OpenAI Whisper

开源⭐ 105k↑+29

github.com/openai/whisper

OpenAI 开源语音识别模型，99.9K+ stars。支持 99 种语言自动语音识别与翻译，可本地部署保护隐私，广泛用于会议转录、字幕生成等场景

🎯多语言语音转文字、音频转录、本地私有化语音识别

#语音识别#多语言#转录

语言Python

🍴 Forks12,755

📅 上线2022/9/17

🔄 更新2026/7/14

📥 收录2026/4/11

Whisper.cpp

开源⭐ 52k↑+15

github.com/ggml-org/whisper.cpp

OpenAI Whisper C/C++ 移植，48,793+ stars。高性能语音识别引擎，将 OpenAI Whisper 移植到 C/C++，支持 99 种语言的语音转文字，CPU 即可高效运行

🎯多模态内容理解与生成

#语音识别#Whisper#C++#跨平台

语言C++

🍴 Forks5,905

📅 上线2022/9/26

🔄 更新2026/7/14

📥 收录2026/4/20

LocalAI

开源⭐ 48k↑+5

github.com/mudler/LocalAI

开源本地 AI 引擎，45,607+ stars。完全兼容 OpenAI API 的本地 AI 推理引擎，支持 LLM、语音识别、图像生成等多种模型，数据完全本地处理保护隐私

🎯生产环境模型推理服务、多模态内容理解与生成

#本地部署#隐私保护#OpenAI 兼容#多模型

语言Go

🍴 Forks4,229

📅 上线2023/3/19

🔄 更新2026/7/14

📥 收录2026/4/20

← 浏览全部 1285 个工具