Trend2Video Pro
趋势到视频全自动 Agent 框架 — 从热点趋势分析到短视频成片,含 Chrome 扩展、Streamlit UI、Edge-TTS 配音,支持 FastAPI 编排。
🎯适用场景:从热点趋势自动生成可发布的短视频内容
📥 收录于 2026/6/28
📊 仓库数据
✅ 优点
- •趋势分析 + 视频生成一体化
- •含 Chrome 扩展
- •Edge-TTS 零成本配音
⚠️ 限制
- •依赖外部 API
- •视频质量取决于模型
- •项目较新
🔗 相关工具
MoneyPrinterTurbo
github.com/harry0703/MoneyPrinterTurbo
AI 短视频生成工具,56,087+ stars。利用大模型一键生成高清短视频,自动完成选题、文案、配音、字幕、画面生成全流程。是国内最受欢迎的 AI 短视频自动化工具。
🎯多模态内容理解与生成
AI ShortVideo Pipeline
github.com/myccarl/ai-shortVideo-pipeline
端到端 AI 短视频生产流水线 — FastAPI 编排 + Spring Boot 网关,多模型容灾、熔断器、计量、全链路可观测,AI 质量门控含 CLIP 一致性和音画同步自修复。
🎯企业级端到端 AI 短视频自动化生产
Pika 2.0
pika.art
专注短视频生成的 AI 平台,擅长 3-10 秒短视频和动画风格内容。支持 Lip Sync(口型同步)、风格迁移和关键帧控制。界面简洁,适合社交媒体内容创作者快速生成吸引眼球的短视频。
🎯多模态内容理解与生成
Sora 2
openai.com/sora
OpenAI 的旗舰级视频生成模型,基于 Diffusion Transformer 架构。支持最长 60 秒视频生成,在物理模拟(流体、光影、碰撞)方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用,是 2026 年质量最高的文生视频模型。
🎯多模态内容理解与生成
Umi-OCR
github.com/hiroi-sora/Umi-OCR
Umi-OCR 是一款免费开源的离线 OCR 文字识别软件,支持截屏识别、批量导入图片识别、PDF 文档识别,可排除水印和页眉页脚干扰,支持扫描和生成二维码,内置多国语种识别库。44K+ stars。
🎯日常文字识别、批量 OCR 处理、离线环境下的文字提取
LivePortrait
github.com/KlingAIResearch/LivePortrait
让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步,可生成逼真的肖像动画视频。18K+ stars,是开源数字人和肖像动画领域的标杆项目
🎯多模态内容理解与生成