VideoCrafter

开源多模态 & 视觉5.1k

VideoCrafter2 高质量视频扩散模型,突破数据限制实现高质量视频生成,支持文本到视频和图像到视频。

🎯适用场景:高质量视频生成——适合需要文本/图像到视频生成的开发者和创作者

#视频生成#扩散模型#文生视频#图生视频

📥 收录于 2026/5/28

📊 仓库数据

Stars5,061
语言Python
更新2026/5/27

优点

  • 5K+ stars 开源视频生成头部项目
  • 支持文本到视频和图像到视频
  • 生成质量高
  • 完全开源可自部署

⚠️ 限制

  • 需要 GPU 资源
  • 生成速度较慢
  • 训练数据有限制

🔗 相关工具

Wan 2.2

开源16k

github.com/Wan-Video/Wan2.2

开源大规模视频生成模型,16K+ stars。支持高质量文本到视频和图像到视频生成,是开源视频生成领域的最新标杆

🎯开源视频生成,适用于内容创作、广告制作、教育视频

#视频生成#文生视频#开源#AIGC
语言Python
🍴 Forks1,968
🔄 更新2026/5/27
📥 收录2026/5/23

CogVideo

开源13k↑+1

github.com/zai-org/CogVideo

智谱开源的文本/图像到视频生成模型,13K+ stars。包括 CogVideoX (2024) 和 CogVideo (ICLR 2023),是开源视频生成的重要方案

🎯开源视频生成研究,视频内容创作,AI 视频模型微调

#视频生成#文生视频#智谱#ICLR
语言Python
🍴 Forks1,297
🔄 更新2026/5/27
📥 收录2026/5/23

HunyuanVideo

开源12k

github.com/Tencent-Hunyuan/HunyuanVideo

腾讯混元大规模视频生成模型框架,12K+ stars。系统性框架覆盖视频生成的训练和推理全流程,支持高质量文生视频和图生视频

🎯高质量文生视频、图生视频生成

#视频生成#文生视频#Diffusion#腾讯混元
语言Python
🍴 Forks1,247
🔄 更新2026/5/27
📥 收录2026/5/24

LTX-Video

开源10k↑+2

github.com/Lightricks/LTX-Video

Lightricks 开源视频生成模型,10K+ stars。支持文生视频和图生视频,基于 Diffusion Transformer 架构,是轻量级高质量视频生成的代表项目

🎯轻量级文生视频、图生视频生成

#视频生成#图生视频#Diffusion Transformer#轻量化
语言Python
🍴 Forks1,012
🔄 更新2026/5/27
📥 收录2026/5/24

Sora 2

付费

openai.com/sora

OpenAI 的旗舰级视频生成模型,基于 Diffusion Transformer 架构。支持最长 60 秒视频生成,在物理模拟(流体、光影、碰撞)方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用,是 2026 年质量最高的文生视频模型。

🎯多模态内容理解与生成

#视频生成#文生视频#商用#Diffusion Transformer+1
🔄 更新2026/4/30
📥 收录2026/4/22

diffusers

开源34k↑+2

github.com/huggingface/diffusers

🤗 扩散模型工具库,6.5K+ stars。最先进的图像、视频和音频扩散模型,Hugging Face 出品的生成式 AI 核心工具

🎯多模态内容理解与生成

#扩散模型#图像生成#Hugging Face#Stable Diffusion
语言Python
🍴 Forks7,001
📅 上线2022/5/30
🔄 更新2026/5/27
📥 收录2026/5/17