HunyuanVideo
腾讯混元大规模视频生成模型框架,12K+ stars。系统性框架覆盖视频生成的训练和推理全流程,支持高质量文生视频和图生视频
🎯适用场景:高质量文生视频、图生视频生成
📥 收录于 2026/5/24
📊 仓库数据
📈 Stars 变化 ↑1 天 +6· 统计区间 6/10 18:12 → 6/12 00:28(1 天)
✅ 优点
- •腾讯出品,技术实力强
- •系统性框架覆盖全流程
- •支持多种视频生成模式
- •Apache-2.0 可商用
⚠️ 限制
- •需要大规模 GPU 集群
- •训练成本高昂
- •推理速度较慢
🔗 相关工具
VideoCrafter
github.com/AILab-CVC/VideoCrafter
VideoCrafter2 高质量视频扩散模型,突破数据限制实现高质量视频生成,支持文本到视频和图像到视频。
🎯高质量视频生成——适合需要文本/图像到视频生成的开发者和创作者
Sora 2
openai.com/sora
OpenAI 的旗舰级视频生成模型,基于 Diffusion Transformer 架构。支持最长 60 秒视频生成,在物理模拟(流体、光影、碰撞)方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用,是 2026 年质量最高的文生视频模型。
🎯多模态内容理解与生成
Wan 2.2
github.com/Wan-Video/Wan2.2
开源大规模视频生成模型,16K+ stars。支持高质量文本到视频和图像到视频生成,是开源视频生成领域的最新标杆
🎯开源视频生成,适用于内容创作、广告制作、教育视频
CogVideo
github.com/zai-org/CogVideo
智谱开源的文本/图像到视频生成模型,13K+ stars。包括 CogVideoX (2024) 和 CogVideo (ICLR 2023),是开源视频生成的重要方案
🎯开源视频生成研究,视频内容创作,AI 视频模型微调
混元视频 1.5
github.com/Tencent-Hunyuan/HunyuanVideo-1.5
腾讯混元出品的领先轻量级视频生成模型,4.4K+ stars。支持文生视频和图生视频,是中文场景视频生成的优质开源方案
🎯视频生成与多模态内容创作
LivePortrait
github.com/KlingAIResearch/LivePortrait
让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步,可生成逼真的肖像动画视频。18K+ stars,是开源数字人和肖像动画领域的标杆项目
🎯多模态内容理解与生成