HunyuanVideo

开源多模态 & 视觉 › 视频生成⭐ 12k↑+3

腾讯混元大规模视频生成模型框架，12K+ stars。系统性框架覆盖视频生成的训练和推理全流程，支持高质量文生视频和图生视频

🎯适用场景：高质量文生视频、图生视频生成

#视频生成#文生视频#扩散模型#腾讯混元

📥 收录于 2026/5/24

访问工具

📊 仓库数据

Stars12,325

Forks1,274

语言Python

协议Apache-2.0

更新2026/7/10

📈 Stars 变化 ↑12 小时 +3· 统计区间 7/10 12:08 → 7/11 00:11（12 小时）

✅ 优点

•腾讯出品，技术实力强
•系统性框架覆盖全流程
•支持多种视频生成模式
•Apache-2.0 可商用

⚠️ 限制

•需要大规模 GPU 集群
•训练成本高昂
•推理速度较慢

🔗 相关工具

VideoCrafter

开源⭐ 5.1k

github.com/AILab-CVC/VideoCrafter

VideoCrafter2 高质量视频扩散模型，突破数据限制实现高质量视频生成，支持文本到视频和图像到视频。

🎯高质量视频生成——适合需要文本/图像到视频生成的开发者和创作者

#视频生成#扩散模型#文生视频#图生视频

语言Python

🍴 Forks414

🔄 更新2026/7/10

📥 收录2026/5/28

Sora 2

付费⭐ 83k

openai.com/sora

OpenAI 的旗舰级视频生成模型，基于 Diffusion Transformer 架构。支持最长 60 秒视频生成，在物理模拟（流体、光影、碰撞）方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用，是 2026 年质量最高的文生视频模型。

🎯多模态内容理解与生成

#视频生成#文生视频#商用#Diffusion Transformer+1

语言Python

🍴 Forks9,535

📥 收录2026/4/22

Wan 2.2

开源⭐ 17k↑+10

github.com/Wan-Video/Wan2.2

开源大规模视频生成模型，16K+ stars。支持高质量文本到视频和图像到视频生成，是开源视频生成领域的最新标杆

🎯开源视频生成，适用于内容创作、广告制作、教育视频

#视频生成#文生视频#开源#AIGC

语言Python

🍴 Forks2,066

🔄 更新2026/7/10

📥 收录2026/5/23

CogVideo

开源⭐ 13k↑+2

github.com/zai-org/CogVideo

智谱开源的文本/图像到视频生成模型，13K+ stars。包括 CogVideoX (2024) 和 CogVideo (ICLR 2023)，是开源视频生成的重要方案

🎯开源视频生成研究，视频内容创作，AI 视频模型微调

#视频生成#文生视频#智谱#ICLR

语言Python

🍴 Forks1,310

🔄 更新2026/7/10

📥 收录2026/5/23

混元视频 1.5

开源⭐ 4.5k↑+2

github.com/Tencent-Hunyuan/HunyuanVideo-1.5

腾讯混元出品的领先轻量级视频生成模型，4.4K+ stars。支持文生视频和图生视频，是中文场景视频生成的优质开源方案

🎯视频生成与多模态内容创作

#image-to-video#文生视频#视频生成#tencent

语言Python

🍴 Forks232

🔄 更新2026/7/10

📥 收录2026/5/29

LivePortrait

开源⭐ 19k↑+7

github.com/KlingAIResearch/LivePortrait

让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步，可生成逼真的肖像动画视频。18K+ stars，是开源数字人和肖像动画领域的标杆项目

🎯多模态内容理解与生成

#肖像动画#数字人#视频生成#口型同步

语言Python

🍴 Forks1,948

🔄 更新2026/7/10

📥 收录2026/5/19

← 浏览全部 1267 个工具