GAN（生成对抗网络）

两个网络互相较劲

亦作、亦称：生成对抗网络 · Generative Adversarial Network

生成对抗网络（GAN）是 Ian Goodfellow 等人于 2014 年在蒙特利尔大学提出的生成模型框架，通过让生成器与判别器相互博弈来学习数据分布，曾是图像生成领域的主流范式。其对抗训练思想催生了 StyleGAN、CycleGAN 等大量变体，深刻影响了整个生成式 AI 的发展方向。

概述

GAN 的本质是两个神经网络之间的极小极大博弈，训练目标是达到纳什均衡。

GAN 以训练不稳定著称，两大核心问题至今仍是研究热点。

研究者通过改进损失函数、网络结构和训练策略，衍生出大量影响力显著的变体。

DCGAN（2015）：将全连接层替换为深度卷积网络，大幅提升图像生成质量和训练稳定性，奠定后续图像 GAN 的标准骨架
WGAN / WGAN-GP（2017）：用 Wasserstein 距离替代 JS 散度作为损失，从理论层面缓解梯度消失和模式崩塌
条件 GAN（cGAN）：在生成器和判别器中引入类别标签等条件信息，实现可控生成
CycleGAN（2017）：引入「循环一致性损失」，无需配对数据即可完成跨域图像风格迁移（如马↔斑马）
StyleGAN / StyleGAN2（2019/2020，NVIDIA）：通过风格映射网络与自适应实例归一化实现对生成图像属性的分层精细控制，曾代表图像生成的最高水平
BigGAN（2018，DeepMind）：超大批次训练的类别条件 GAN，在 ImageNet 上实现当时最优图像质量

GAN 从提出到繁荣再到被部分取代，历经约十年演进。

2014：Goodfellow 等人在 NIPS 发表原始 GAN 论文，在 MNIST 上首次演示对抗生成框架
2015：DCGAN 将卷积网络引入 GAN，首次实现较高质量自然图像生成
2017：WGAN 改善训练稳定性；CycleGAN、Pix2Pix 使图像翻译走向实用；Progressive GAN 引入渐进式分辨率提升
2018：BigGAN 展示大规模 GAN 在 ImageNet 级别数据集上的出色表现
2019：StyleGAN（NVIDIA）发布，生成人脸图像质量达到以假乱真水平
2020：StyleGAN2 修复水滴伪影；DDPM 重新引发扩散模型关注，开始挑战 GAN 地位
2022 年后：扩散模型（如 Stable Diffusion）凭借更稳定的训练和更好的多样性逐步在高分辨率图像生成中超越 GAN，GAN 在实时推理等场景中仍保有优势

GAN 的对抗训练思想在多个领域催生了实用技术。

扩散模型的崛起并未完全取代 GAN，两者各有适用场景。

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

从知识库精选 3 篇文章，帮助深入理解该术语。

本页内容为本站原创撰写；维基百科链接仅作延伸参考。