开源、精准易用的视频语音识别与剪辑工具,集成 LLM 的 AI 剪辑功能。

🎯适用场景:视频创作者快速提取字幕、生成精彩片段剪辑

#video#speech-recognition#clip#llm#audio

📥 收录于 2026/6/15

📊 仓库数据

Stars5,810

优点

  • 语音识别准确率高
  • LLM 驱动的自动剪辑,效率高

⚠️ 限制

  • 对硬件有一定要求
  • 长视频处理耗时较长

🔗 相关工具

AutoClip

开源5.6k+10

github.com/zhouxiaoka/autoclip

AI-powered 智能视频高光提取与剪辑工具,自动识别视频精彩片段并生成剪辑。

🎯自动从长视频中提取精彩片段用于社交媒体分享

#ai-video#video-editing#highlight#clip+1
语言Python
🍴 Forks1,129
🔄 更新2026/6/14
📥 收录2026/6/9

MoneyPrinterTurbo

开源88k+279

github.com/harry0703/MoneyPrinterTurbo

AI 短视频生成工具,56,087+ stars。利用大模型一键生成高清短视频,自动完成选题、文案、配音、字幕、画面生成全流程。是国内最受欢迎的 AI 短视频自动化工具。

🎯多模态内容理解与生成

#短视频#AI 创作#自动化#中文
语言Python
🍴 Forks12,572
📅 上线2024/2/1
🔄 更新2026/6/15
📥 收录2026/4/21

Sora 2

付费83k

openai.com/sora

OpenAI 的旗舰级视频生成模型,基于 Diffusion Transformer 架构。支持最长 60 秒视频生成,在物理模拟(流体、光影、碰撞)方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用,是 2026 年质量最高的文生视频模型。

🎯多模态内容理解与生成

#视频生成#文生视频#商用#Diffusion Transformer+1
语言Python
🍴 Forks9,535
🔄 更新2026/4/30
📥 收录2026/4/22

Umi-OCR

开源45k+18

github.com/hiroi-sora/Umi-OCR

Umi-OCR 是一款免费开源的离线 OCR 文字识别软件,支持截屏识别、批量导入图片识别、PDF 文档识别,可排除水印和页眉页脚干扰,支持扫描和生成二维码,内置多国语种识别库。44K+ stars。

🎯日常文字识别、批量 OCR 处理、离线环境下的文字提取

#Ocr#Ocr-python#Paddleocr#Qml
语言Python
🍴 Forks4,446
🔄 更新2026/6/14
📥 收录2026/6/3

LivePortrait

开源19k+5

github.com/KlingAIResearch/LivePortrait

让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步,可生成逼真的肖像动画视频。18K+ stars,是开源数字人和肖像动画领域的标杆项目

🎯多模态内容理解与生成

#肖像动画#数字人#视频生成#口型同步
语言Python
🍴 Forks1,932
🔄 更新2026/6/14
📥 收录2026/5/19

Wan 2.1

开源16k+4

github.com/Wan-Video/Wan2.1

阿里巴巴通义万相视频生成模型 Wan 2.1,支持高质量文本到视频生成,支持多种分辨率和时长,开源权重可商用

🎯AI 视频生成、文本到视频转换、创意内容制作

#视频生成#文本到视频#阿里巴巴#开源权重+1
语言Python
🍴 Forks2,856
🔄 更新2026/6/14
📥 收录2026/6/8