Runway Gen-4
Runway 的最新视频生成模型,支持多模态输入(文本、图像、视频片段)。提供专业级时间轴控制、视频编辑(风格迁移、对象替换)等高级功能。Web 界面 + API 双模式,是专业视频创作者的首选平台。
🎯适用场景:专业视频制作、广告、影视后期、社交媒体内容
📊 仓库数据
✅ 优点
- •功能最全面的视频生成平台
- •支持视频编辑和时间轴控制
- •多模态输入灵活
- •专业级工具链
⚠️ 限制
- •订阅费用较高
- •学习曲线中等
- •免费额度有限
🔗 相关工具
Sora 2
付费openai.com/sora
OpenAI 的旗舰级视频生成模型,基于 Diffusion Transformer 架构。支持最长 60 秒视频生成,在物理模拟(流体、光影、碰撞)方面表现卓越。通过 ChatGPT Plus/Pro 订阅可用,是 2026 年质量最高的文生视频模型。
🎯 视频内容创作、广告制作、影视预可视化、教育内容
OMI
开源⭐ 12k↑+44github.com/BasedHardware/omi
OMI 是开源的随身 AI 硬件——一个 AI 项链,能"看到"你的屏幕、"听到"你的对话,并告诉你该做什么。11.4K+ stars,单周增长 2,896 星。它将多模态 AI 集成到可穿戴设备中,实时分析视觉和音频输入,提供智能建议和提醒。采用 Dart 实现,支持 iOS 和 Android,是 2026 年 "AI 硬件化" 趋势的代表作之一
🎯 随身 AI 助手、会议记录、生活提醒、多模态交互体验
Open Generative AI
开源⭐ 9.2k↑+421github.com/Anil-matcha/Open-Generative-AI
Open Generative AI 是 Higgsfield AI、Freepik AI、Krea AI、Openart AI 的开源替代方案。提供免费的、无限制的 AI 图像和视频生成工作室,集成 200+ 模型(Flux、Midjourney、Kling、Sora、Veo 等)。无内容过滤器,完全自部署,MIT 许可证。GitHub 7,993 stars,本周增长 2,417 星。与商业图像生成平台不同,Open Generative AI 完全开源且无内容限制——用户可以在本地运行所有模型,不受任何平台的审查或限制。适合需要完整 AI 生成能力且对内容无限制的用户。
🎯 AI 图像/视频生成工作室、开源替代商业 AI 绘画平台、本地部署多模型生成环境、无限制创意内容生成
Midjourney v7
付费www.midjourney.com
全球领先的 AI 图像生成服务,v7 版本在艺术感、风格多样性和细节质量上持续领跑。通过 Discord 或 Web 界面使用,支持多种艺术风格、角色一致性、局部重绘等高级功能。社区活跃,每日生成数百万张图像,是设计师和创作者的首选工具。2026 年推出 API,支持企业级集成。
🎯 艺术创作、概念设计、插画、品牌视觉
Pika 2.0
免费+付费pika.art
专注短视频生成的 AI 平台,擅长 3-10 秒短视频和动画风格内容。支持 Lip Sync(口型同步)、风格迁移和关键帧控制。界面简洁,适合社交媒体内容创作者快速生成吸引眼球的短视频。
🎯 社交媒体内容、动画短片、短视频广告、TikTok/Reels 内容
Stable Diffusion WebUI
开源⭐ 163k↑+9github.com/AUTOMATIC1111/stable-diffusion-webui
最流行的 Stable Diffusion Web UI,162,491+ stars。提供直观的图形界面,支持文生图、图生图、ControlNet、LoRA 微调、Inpainting 等核心功能,是 AI 图像生成领域的事实标准工具
🎯 AI 图像生成、艺术创作、模型微调、设计辅助