首页/知识库/生成式 AI 学习导览

生成式 AI 学习导览

✍️ AI Master📅 创建 2026-04-16📖 15 min 阅读
💡

文章摘要

从 Diffusion 模型到 GAN,掌握 AI 图像、音频、视频生成技术。理解 Stable Diffusion 的原理,学会用 ControlNet 精确控制生成结果。

0什么是生成式 AI?

判别式 AI:判断一张图是猫还是狗。
生成式 AI:给你画一只猫。

2022 年 Stable Diffusion 开源,2023 年 DALL·E 和 Midjourney 爆发,2026 年 AI 视频(Sora、Veo)成为现实。生成式 AI 已经从"好玩"变成"好用"。

1技术全景

生成式 AI 的技术全景:

VAE(变分自编码器)— 编码、隐空间、解码

GAN(生成对抗网络)— 生成器 vs 判别器

Diffusion Model — 加噪、去噪、生成

ControlNet — 精确控制生成结果

2学习建议

重点: Diffusion 模型——这是当前最主流、最实用的生成技术。

实战: 用 Stable Diffusion + ControlNet 生成一张你指定构图和姿势的图片。

💡 先学会用 Midjourney 或 Stable Diffusion WebUI,再深入理解背后的数学原理。

架构图示 1

架构图示 2

继续你的 AI 学习之旅

浏览更多 AI 知识库文章,或者探索 GitHub 上的优质 AI 项目