Ideogram 2.0

专注于文字排版和 Logo 设计的 AI 图像生成平台。2.0 版本在文本渲染、品牌一致性和矢量图输出方面显著提升。提供商用和开源混合模式,是设计师进行品牌视觉、海报设计和 Logo 创作的高效工具。

🎯适用场景:多模态内容理解与生成

#图像生成#Logo 设计#文字排版#品牌设计#混合模式

📥 收录于 2026/4/22

优点

  • 文字排版质量最佳
  • Logo 设计出色
  • 品牌一致性工具
  • 有免费额度

⚠️ 限制

  • 通用图像质量不如 MJ/Flux
  • 照片级真实感较弱

🔗 相关工具

DiffSynth-Studio

开源13k+1

github.com/modelscope/DiffSynth-Studio

魔搭社区出品的扩散模型创意工作室,12K+ stars。提供强大的扩散模型 GUI、API 和后端,支持图像生成、视频生成和多模态内容创作。基于 ModelScope 生态,是中国开源 AI 生成工具的重要项目

🎯多模态内容理解与生成

#扩散模型#图像生成#视频生成#创意工具
语言Python
🍴 Forks1,239
🔄 更新2026/6/28
📥 收录2026/6/4

VAR-Visual Autoregressive

开源8.7k

github.com/FoundationVision/VAR

NeurIPS 2024 最佳论文奖,视觉自回归图像生成模型,8.7K+ stars。GPT 式自回归建模超越 Diffusion 的图像生成方法,支持超高清图像生成的 SOTA 方案

🎯高质量图像生成、视觉内容创作

#图像生成#自回归模型#NeurIPS 2024#视觉生成
语言Jupyter Notebook
🍴 Forks571
🔄 更新2026/6/24
📥 收录2026/5/24

PromptEnhancer

开源3.7k

github.com/Hunyuan-PromptEnhancer/PromptEnhancer

CVPR 2026 收录的提示词增强工具,将简单提示词重写为清晰结构化版本,显著提升图像生成质量。由腾讯混元团队开发,是文生图/图像编辑流水线中的提示词优化利器。3.7K stars

🎯多模态内容理解与生成

#提示词增强#CVPR 2026#图像生成#混元
语言Python
🍴 Forks325
📅 上线2025/1/1
🔄 更新2026/6/26
📥 收录2026/6/5

HunyuanImage 3.0

免费3.2k

github.com/tencent-hunyuan/hunyuanimage-3.0

混元图像 3.0,7.5K+ stars。腾讯混元原生多模态图像生成模型,强大的中文图像生成能力

🎯多模态内容理解与生成

#图像生成#native-multimodal-model
语言Python
🍴 Forks167
📅 上线2025/9/27
🔄 更新2026/6/28
📥 收录2026/5/13

Deep Live Cam

开源94k+22

github.com/hacksider/Deep-Live-Cam

实时人脸替换工具,91,252+ stars。仅需一张照片即可实现实时视频换脸和一键视频 Deepfake,基于 AI 视觉模型实现高精度面部替换。支持摄像头实时预览和离线视频处理,是 AI 换脸领域最受欢迎的开源项目。

🎯多模态内容理解与生成

#Deepfake#人脸替换#计算机视觉#实时
语言Python
🍴 Forks13,756
📅 上线2024/3/15
🔄 更新2026/6/28
📥 收录2026/4/21

openpilot

开源62k+95

github.com/commaai/openpilot

自动驾驶操作系统,60,671+ stars。comma.ai 开源的高级驾驶辅助系统(ADAS),支持 275+ 款车型的自适应巡航、车道保持等自动驾驶辅助功能

🎯多模态内容理解与生成

#自动驾驶#ADAS#汽车#计算机视觉
语言Python
🍴 Forks11,081
📅 上线2016/11/24
🔄 更新2026/6/29
📥 收录2026/4/20