Matrix-Game

开源多模态 & 视觉 › 视频生成⭐ 2.3k↑+1

实时交互式世界模型，支持长程记忆和流式视频生成，由昆仑万维 Skywork 团队开源。

🎯适用场景：交互式视频生成——通过实时输入控制，生成长程连贯的视频内容。

#开源#python#世界模型

📥 收录于 2026/6/9

访问工具

📊 仓库数据

Stars2,276

Forks248

语言Python

更新2026/7/24

📈 Stars 变化 ↑11 小时 +1· 统计区间 7/24 12:26 → 7/24 23:22（11 小时）

✅ 优点

•实时交互式世界模型，前沿研究方向
•支持流式生成和长程记忆
•Skywork 团队出品，技术实力强

⚠️ 限制

•研究阶段产品，稳定性有限
•硬件需求较高

🔗 相关工具

Wan 2.2

开源⭐ 17k↑+8

github.com/Wan-Video/Wan2.2

开源大规模视频生成模型，16K+ stars。支持高质量文本到视频和图像到视频生成，是开源视频生成领域的最新标杆

🎯开源视频生成，适用于内容创作、广告制作、教育视频

claude-real-video

开源⭐ 1.8k↑+8

github.com/HUANGCHIHHUNGLeo/claude-real-video

让 Claude / LLM 真正「看懂」视频的开源工具。通过场景感知去重抽取关键帧（基于 ffmpeg + 场景切换检测），避免冗余帧浪费 token，再把精简后的帧序列交给多模态模型分析。1832 stars，MIT 许可。

🎯把长视频压缩为少量有代表性的关键帧再交给 LLM 做内容理解，节省 token 并提升视频问答准确性

#视频理解#关键帧抽取#Claude#多模态+2

story-to-handdrawn-video

NEW开源⭐ 602

github.com/gnipbao/story-to-handdrawn-video

一个开源 Agent skill，能把中文故事文案或一组有序图片自动转成手绘日记漫画风格的视频。适合作为内容创作流水线的技能节点，由 AI agent 调用完成从文案到成片的批量生成。595 stars，MIT 许可。

🎯把中文故事文案或有序图片批量转为手绘日记风视频，作为 Agent 内容创作技能

#视频生成#手绘风#Agent skill#内容创作+2

MoneyPrinterTurbo

开源⭐ 99k↑+138

github.com/harry0703/MoneyPrinterTurbo

AI 短视频生成工具，56,087+ stars。利用大模型一键生成高清短视频，自动完成选题、文案、配音、字幕、画面生成全流程。是国内最受欢迎的 AI 短视频自动化工具。

🎯多模态内容理解与生成

Sora 2

付费⭐ 83k

openai.com/sora

OpenAI 的旗舰级视频生成模型，基于 Diffusion Transformer 架构。支持最长 60 秒视频生成，在物理模拟（流体、光影、碰撞）方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用，是 2026 年质量最高的文生视频模型。

🎯多模态内容理解与生成

#视频生成#文生视频#商用#Diffusion Transformer+1

OpenCut

开源⭐ 78k↑+148

github.com/OpenCut-app/OpenCut

开源 CapCut 替代品，76K+ stars。提供专业级视频编辑能力，完全开源免费。支持多轨道编辑、特效、转场、音频处理等功能。

🎯开源视频编辑器——CapCut 免费替代品

#视频编辑#开源 CapCut#多媒体#免费