Video Spec Builder

开源多模态 & 视觉 › 视频生成⭐ 490↑+2

视频分镜脚本生成技能——将视频创意转化为精确到秒的分镜脚本 video-spec.md，可交给 HyperFrames 渲染。支持 Claude Code / Cursor / Codex。470 stars。

🎯适用场景：AI 辅助视频制作——从创意到精确分镜脚本，衔接程序化视频渲染工作流

#视频分镜#脚本生成#HyperFrames#Claude Code#视频制作

📥 收录于 2026/6/22

访问工具

📊 仓库数据

Stars490

Forks61

语言JavaScript

上线2026/5/16

更新2026/6/24

📈 Stars 变化 ↑6 小时 +2· 统计区间 6/24 00:08 → 6/24 06:11（6 小时）

✅ 优点

•精确到秒的分镜脚本
•与 HyperFrames 无缝衔接
•多编辑器兼容

⚠️ 限制

•依赖 HyperFrames 渲染
•较新项目
•需要视频制作基础

🔗 相关工具

Lottie by Diffusion Studio

NEW开源⭐ 3.7k↑+7

github.com/diffusionstudio/lottie

用 Claude Code 或 Codex 生成生产级 Lottie 动画，3.4K+ stars，设计师与开发者协作利器。

🎯AI 编程助手直接生成高质量 Lottie 动画文件

#Lottie#动画生成#AI 设计#Claude Code

语言TypeScript

🍴 Forks202

📅 上线2026/6/10

🔄 更新2026/6/24

📥 收录2026/6/20

MoneyPrinterTurbo

开源⭐ 92k↑+84

github.com/harry0703/MoneyPrinterTurbo

AI 短视频生成工具，56,087+ stars。利用大模型一键生成高清短视频，自动完成选题、文案、配音、字幕、画面生成全流程。是国内最受欢迎的 AI 短视频自动化工具。

🎯多模态内容理解与生成

#短视频#AI 创作#自动化#中文

语言Python

🍴 Forks13,226

📅 上线2024/2/1

🔄 更新2026/6/24

📥 收录2026/4/21

Sora 2

付费⭐ 83k

openai.com/sora

OpenAI 的旗舰级视频生成模型，基于 Diffusion Transformer 架构。支持最长 60 秒视频生成，在物理模拟（流体、光影、碰撞）方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用，是 2026 年质量最高的文生视频模型。

🎯多模态内容理解与生成

#视频生成#文生视频#商用#Diffusion Transformer+1

语言Python

🍴 Forks9,535

📥 收录2026/4/22

Umi-OCR

开源⭐ 45k↑+2

github.com/hiroi-sora/Umi-OCR

Umi-OCR 是一款免费开源的离线 OCR 文字识别软件，支持截屏识别、批量导入图片识别、PDF 文档识别，可排除水印和页眉页脚干扰，支持扫描和生成二维码，内置多国语种识别库。44K+ stars。

🎯日常文字识别、批量 OCR 处理、离线环境下的文字提取

#Ocr#Ocr-python#Paddleocr#Qml

语言Python

🍴 Forks4,470

🔄 更新2026/6/24

📥 收录2026/6/3

LivePortrait

开源⭐ 19k↑+1

github.com/KlingAIResearch/LivePortrait

让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步，可生成逼真的肖像动画视频。18K+ stars，是开源数字人和肖像动画领域的标杆项目

🎯多模态内容理解与生成

#肖像动画#数字人#视频生成#口型同步

语言Python

🍴 Forks1,939

🔄 更新2026/6/24

📥 收录2026/5/19

Wan 2.2

开源⭐ 16k↑+2

github.com/Wan-Video/Wan2.2

开源大规模视频生成模型，16K+ stars。支持高质量文本到视频和图像到视频生成，是开源视频生成领域的最新标杆

🎯开源视频生成，适用于内容创作、广告制作、教育视频

#视频生成#文生视频#开源#AIGC

语言Python

🍴 Forks2,030

🔄 更新2026/6/24

📥 收录2026/5/23

← 浏览全部 1170 个工具