AI ShortVideo Pipeline

开源多模态 & 视觉 › 视频生成⭐ 470

端到端 AI 短视频生产流水线 — FastAPI 编排 + Spring Boot 网关，多模型容灾、熔断器、计量、全链路可观测，AI 质量门控含 CLIP 一致性和音画同步自修复。

🎯适用场景：企业级端到端 AI 短视频自动化生产

#短视频#生产流水线#多模型容灾#质量门控

📥 收录于 2026/6/28

访问工具

📊 仓库数据

Stars470

语言Python

协议MIT

上线2026/5/18

更新2026/6/28

✅ 优点

•多模型容灾 + 熔断器
•AI 质量门控
•全链路可观测

⚠️ 限制

•部署复杂
•依赖多个外部服务
•偏企业场景

🔗 相关工具

MoneyPrinterTurbo

开源⭐ 94k↑+117

github.com/harry0703/MoneyPrinterTurbo

AI 短视频生成工具，56,087+ stars。利用大模型一键生成高清短视频，自动完成选题、文案、配音、字幕、画面生成全流程。是国内最受欢迎的 AI 短视频自动化工具。

🎯多模态内容理解与生成

#短视频#AI 创作#自动化#中文

语言Python

🍴 Forks13,569

📅 上线2024/2/1

🔄 更新2026/6/28

📥 收录2026/4/21

Trend2Video Pro

开源⭐ 212

github.com/2417467487-hub/Trend2Video-Pro

趋势到视频全自动 Agent 框架 — 从热点趋势分析到短视频成片，含 Chrome 扩展、Streamlit UI、Edge-TTS 配音，支持 FastAPI 编排。

🎯从热点趋势自动生成可发布的短视频内容

#趋势分析#自动视频#Agent 框架#短视频

语言Python

📅 上线2026/5/25

🔄 更新2026/6/28

📥 收录2026/6/28

Pika 2.0

免费+付费

pika.art

专注短视频生成的 AI 平台，擅长 3-10 秒短视频和动画风格内容。支持 Lip Sync（口型同步）、风格迁移和关键帧控制。界面简洁，适合社交媒体内容创作者快速生成吸引眼球的短视频。

🎯多模态内容理解与生成

#视频生成#短视频#动画#Lip Sync+1

📥 收录2026/4/22

Sora 2

付费⭐ 83k

openai.com/sora

OpenAI 的旗舰级视频生成模型，基于 Diffusion Transformer 架构。支持最长 60 秒视频生成，在物理模拟（流体、光影、碰撞）方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用，是 2026 年质量最高的文生视频模型。

🎯多模态内容理解与生成

#视频生成#文生视频#商用#Diffusion Transformer+1

语言Python

🍴 Forks9,535

📥 收录2026/4/22

Umi-OCR

开源⭐ 46k↑+6

github.com/hiroi-sora/Umi-OCR

Umi-OCR 是一款免费开源的离线 OCR 文字识别软件，支持截屏识别、批量导入图片识别、PDF 文档识别，可排除水印和页眉页脚干扰，支持扫描和生成二维码，内置多国语种识别库。44K+ stars。

🎯日常文字识别、批量 OCR 处理、离线环境下的文字提取

#Ocr#Ocr-python#Paddleocr#Qml

语言Python

🍴 Forks4,487

🔄 更新2026/6/28

📥 收录2026/6/3

LivePortrait

开源⭐ 19k↑+1

github.com/KlingAIResearch/LivePortrait

让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步，可生成逼真的肖像动画视频。18K+ stars，是开源数字人和肖像动画领域的标杆项目

🎯多模态内容理解与生成

#肖像动画#数字人#视频生成#口型同步

语言Python

🍴 Forks1,940

🔄 更新2026/6/28

📥 收录2026/5/19

← 浏览全部 1233 个工具