pytorch-CycleGAN-and-pix2pix
基于PyTorch实现的图像到图像转换工具,支持CycleGAN和pix2pix等模型,适用于风格迁移、图像增强等场景。
🎯适用场景:图像风格迁移、照片转艺术风格、图像增强
📊 仓库数据
✅ 优点
- •开源免费,社区活跃
- •支持多种预训练模型,开箱即用
- •文档完善,易于上手
⚠️ 限制
- •需要GPU加速,训练时间较长
- •模型文件较大,对存储空间有要求
🔗 相关工具
kornia
开源⭐ 11kgithub.com/kornia/kornia
几何计算机视觉库,11K+ stars。面向空间 AI 的几何计算机视觉库,提供 OpenCV 风格的 PyTorch 原生计算机视觉操作
🎯 多模态内容理解与生成
Mmagic
免费⭐ 7.4k↓1github.com/open-mmlab/mmagic
OpenMMLab 多模态工具箱,8.6K+ stars。多模态高级生成和智能创建工具箱,支持图像生成、视频生成等多种任务
🎯 多模态内容理解与生成
MockingBird
开源⭐ 37kgithub.com/babysor/MockingBird
5 秒克隆声音,37K+ stars。5 秒克隆声音生成任意语音的实时语音合成工具,支持多语种语音克隆
🎯 语音合成与实时语音交互
rerun
开源⭐ 11k↑+1github.com/rerun-io/rerun
多模态数据可视化 SDK,11K+ stars。用于记录、存储、查询和可视化多模态和多速率数据的开源 SDK,Rust 编写
🎯 机器人控制、仿真与边缘部署、多模态内容理解与生成
Stable Diffusion WebUI
开源⭐ 163k↑+3github.com/AUTOMATIC1111/stable-diffusion-webui
最流行的 Stable Diffusion Web UI,162,491+ stars。提供直观的图形界面,支持文生图、图生图、ControlNet、LoRA 微调、Inpainting 等核心功能,是 AI 图像生成领域的事实标准工具
🎯 大模型微调与训练、多模态内容理解与生成
ComfyUI
开源⭐ 114k↑+42github.com/comfyanonymous/ComfyUI
节点式 Diffusion 模型 GUI,109,363+ stars。基于节点的工作流编排,可视化连接各处理模块,是最强大的图像生成工作流工具,支持 SDXL、Flux、Stable Cascade 等最新模型
🎯 AI 工作流编排与自动化、多模态内容理解与生成