Video Spec Builder
视频分镜脚本生成技能——将视频创意转化为精确到秒的分镜脚本 video-spec.md,可交给 HyperFrames 渲染。支持 Claude Code / Cursor / Codex。470 stars。
🎯适用场景:AI 辅助视频制作——从创意到精确分镜脚本,衔接程序化视频渲染工作流
📥 收录于 2026/6/22
📊 仓库数据
📈 Stars 变化 ↑6 小时 +2· 统计区间 6/24 00:08 → 6/24 06:11(6 小时)
✅ 优点
- •精确到秒的分镜脚本
- •与 HyperFrames 无缝衔接
- •多编辑器兼容
⚠️ 限制
- •依赖 HyperFrames 渲染
- •较新项目
- •需要视频制作基础
🔗 相关工具
Lottie by Diffusion Studio
github.com/diffusionstudio/lottie
用 Claude Code 或 Codex 生成生产级 Lottie 动画,3.4K+ stars,设计师与开发者协作利器。
🎯AI 编程助手直接生成高质量 Lottie 动画文件
MoneyPrinterTurbo
github.com/harry0703/MoneyPrinterTurbo
AI 短视频生成工具,56,087+ stars。利用大模型一键生成高清短视频,自动完成选题、文案、配音、字幕、画面生成全流程。是国内最受欢迎的 AI 短视频自动化工具。
🎯多模态内容理解与生成
Sora 2
openai.com/sora
OpenAI 的旗舰级视频生成模型,基于 Diffusion Transformer 架构。支持最长 60 秒视频生成,在物理模拟(流体、光影、碰撞)方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用,是 2026 年质量最高的文生视频模型。
🎯多模态内容理解与生成
Umi-OCR
github.com/hiroi-sora/Umi-OCR
Umi-OCR 是一款免费开源的离线 OCR 文字识别软件,支持截屏识别、批量导入图片识别、PDF 文档识别,可排除水印和页眉页脚干扰,支持扫描和生成二维码,内置多国语种识别库。44K+ stars。
🎯日常文字识别、批量 OCR 处理、离线环境下的文字提取
LivePortrait
github.com/KlingAIResearch/LivePortrait
让静态肖像照片“活起来”的 AI 肖像动画工具。支持单张照片驱动面部表情、头部姿态和口型同步,可生成逼真的肖像动画视频。18K+ stars,是开源数字人和肖像动画领域的标杆项目
🎯多模态内容理解与生成
Wan 2.2
github.com/Wan-Video/Wan2.2
开源大规模视频生成模型,16K+ stars。支持高质量文本到视频和图像到视频生成,是开源视频生成领域的最新标杆
🎯开源视频生成,适用于内容创作、广告制作、教育视频