ViMax

开源多模态 & 视觉7.2k

智能体视频生成框架,7.2K+ stars。集导演、编剧、制片人和视频生成器于一体的 Agentic Video Generation 方案,是 AI 视频创作的前沿探索

🎯适用场景:智能体驱动的视频内容创作

#视频生成#Agentic AI#AI 导演#智能体

📊 仓库数据

Stars7,155
Forks500
语言Python
更新2026/5/24

优点

  • Agentic 视频生成前沿探索
  • 导演-编剧-制片全链路
  • HKUDS 出品学术水平高

⚠️ 限制

  • 相对较新,文档和示例较少
  • 需要强 GPU 资源
  • 生成质量待大规模验证

🔗 相关工具

Pixelle-Video

开源19k↑+50

github.com/AIDC-AI/Pixelle-Video

AI 全自动短视频引擎,19K+ stars。支持脚本生成、AI 配音、字幕合成、批量生产等完整短视频工作流,是 AIGC 短视频创作的一站式解决方案

🎯 多模态内容理解与生成

#短视频#AIGC#视频生成#自动化
语言Python
🍴 Forks2,761
📅 上线2025/11/7
🔄 更新2026/5/24

LivePortrait

开源18k

github.com/KlingAIResearch/LivePortrait

让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步,可生成逼真的肖像动画视频。18K+ stars,是开源数字人和肖像动画领域的标杆项目

🎯 多模态内容理解与生成

#肖像动画#数字人#视频生成#口型同步
语言Python
🍴 Forks1,913
🔄 更新2026/5/23

Open Generative AI

开源17k↑+25

github.com/Anil-matcha/Open-Generative-AI

Open Generative AI 是 Higgsfield AI、Freepik AI、Krea AI、Openart AI 的开源替代方案。提供免费的、无限制的 AI 图像和视频生成工作室,集成 200+ 模型(Flux、Midjourney、Kling、Sora、Veo 等)。无内容过滤器,完全自部署,MIT 许可证。GitHub 7,993 stars,本周增长 2,417 星。与商业图像生成平台不同,Open Generative AI 完全开源且无内容限制——用户可以在本地运行所有模型,不受任何平台的审查或限制。适合需要完整 AI 生成能力且对内容无限制的用户。

🎯 多模态内容理解与生成

#开源#图像生成#视频生成#200+ 模型+3
语言JavaScript
🍴 Forks2,809
📅 上线2025/8/15
🔄 更新2026/5/24

Wan 2.2

开源16k↑+5

github.com/Wan-Video/Wan2.2

开源大规模视频生成模型,16K+ stars。支持高质量文本到视频和图像到视频生成,是开源视频生成领域的最新标杆

🎯 开源视频生成,适用于内容创作、广告制作、教育视频

#视频生成#文生视频#开源#AIGC
语言Python
🍴 Forks1,959
🔄 更新2026/5/24

CogVideo

开源13k

github.com/zai-org/CogVideo

智谱开源的文本/图像到视频生成模型,13K+ stars。包括 CogVideoX (2024) 和 CogVideo (ICLR 2023),是开源视频生成的重要方案

🎯 开源视频生成研究,视频内容创作,AI 视频模型微调

#视频生成#文生视频#智谱#ICLR
语言Python
🍴 Forks1,295
🔄 更新2026/5/23

WaooWaoo

开源12k↑+12

github.com/waooAI/waoowaoo

工业级全流程 AI 影视生产平台,12K+ stars。从短视频到长片的全流程可控 AI 影视生产,支持好莱坞标准工作流,是国内领先的 AI Agent 视频生成平台

🎯 AI 影视内容生产、短视频自动生成

#AI 影视#视频生成#AI Agent#影视工作流
语言TypeScript
🍴 Forks2,783
🔄 更新2026/5/21