Discriminator（判别器）

判别器就是 GAN 里那个『鉴定师』，专门看生成器造的假货够不够真，输出一个 0 到 1 的打分

亦作、亦称：判别器 · GAN判别器 · critic · 鉴别器 · D网络

判别器是 GAN 框架的核心组件之一，通过区分真实数据与合成数据来驱动生成器不断提升质量。从 2014 年原始 GAN 的简单分类器到 WGAN 的评论器，判别器设计的每次演进都显著提升了对抗训练的稳定性与生成效果。

概述

判别器（Discriminator）是生成对抗网络（GAN）中两个核心网络之一，其任务是区分真实数据与生成器产生的合成数据。

输入：来自真实数据集或生成器输出的数据样本（如图像）
输出：该样本为真实数据的概率，范围 [0, 1]（标准 GAN）或连续评分（WGAN）
目标：最大化正确分类真实样本和合成样本的能力
训练信号：来自真实标签（真为 1，假为 0）的二元交叉熵损失
理想收敛状态：对任意样本输出 0.5，表明生成器已完全模拟真实分布

工作原理

判别器通过逐层下采样提取特征，最终输出真实性概率，其核心流程如下。

特征提取：通过多层步长卷积（Strided Convolution）逐步降低空间分辨率并提取语义特征
- 归一化：隐藏层常使用层归一化（Layer Norm） 或谱归一化（Spectral Norm） 稳定训练
-激活函数：隐藏层使用 LeakyReLU（负斜率约 0.2）以保留负值信息，输出层使用 Sigmoid
- 损失计算：对真实样本最大化 log D(x)，对合成样本最大化 log(1 - D(G(z)))
-交替更新：通常每更新一次生成器前，先更新判别器 1～5 次以保持其判别能力领先

主要变体与架构演进

从原始 GAN 到现代稳定架构，判别器设计经历了多次重要演进。

标准 GAN 判别器（2014）：全连接层构成，用于低维数据，训练不稳定
- DCGAN 判别器（2015）：引入步长卷积替代池化，配合 批归一化，显著提升图像判别能力
- WGAN 评论器（Critic，2017）：去除 Sigmoid 输出层，输出无界连续评分，通过权重截断（Weight Clipping） 强制 1-Lipschitz 约束
-WGAN-GP（2017）：用梯度惩罚（Gradient Penalty）替代权重截断，训练更稳定
- PatchGAN 判别器（2016）：在 Pix2Pix 中引入，判断图像局部块（Patch）的真假，适合高分辨率图像翻译
-多尺度判别器（2018）：pix2pixHD 中使用多个判别器分别处理不同分辨率，提升细节保真度

应用场景

判别器不仅用于 GAN 训练，其思想还延伸至更广泛的 AI 应用场景。

图像生成质量控制：驱动 StyleGAN、BigGAN 等模型生成高保真人脸、场景图像
图像翻译：Pix2Pix、CycleGAN 中判别器监督跨域图像风格一致性
数据增强：判别器辅助生成医学影像、工业缺陷样本，扩充小样本数据集
对抗鲁棒性训练：判别器思想用于检测对抗样本（Adversarial Examples）
感知损失（Perceptual Loss）：提取判别器中间层特征作为图像质量的感知相似度度量
奖励模型类比：RLHF 中的奖励模型（Reward Model）与判别器在功能上类似，均负责评估输出质量

局限与常见误区

理解判别器的局限有助于在实际项目中做出合理设计决策。

过强判别器导致梯度消失：判别器过快收敛会使生成器梯度趋近于零，无法有效学习，即梯度消失问题
模式崩溃（Mode Collapse）：判别器对某类样本过拟合，导致生成器只输出能骗过判别器的少数模式
误区：判别器训练后不再有用：实际上训练好的判别器特征层可迁移用于图像质量评估、下游分类等任务
误区：判别器越强越好：判别器与生成器需要保持势力均衡，判别器过强会阻碍生成器学习
评估困难：判别器的损失值不能直接反映生成质量，需配合 FID、IS 等外部指标综合评估

发展脉络

判别器的设计随 GAN 生态系统的演进不断优化，推动了生成式 AI 的发展。

2014：Goodfellow 等提出原始 GAN，判别器为简单全连接网络，首次实现对抗式训练框架
2015：DCGAN 引入卷积判别器，配合批归一化，大幅提升稳定性和图像生成质量
2016：Pix2Pix 提出 PatchGAN 判别器，专注局部纹理细节，适用于图像翻译任务
2017：WGAN 将判别器改造为评论器（Critic），引入 Wasserstein 距离解决梯度消失和模式崩溃；WGAN-GP 用梯度惩罚进一步优化
2018：谱归一化（Spectral Normalization）成为判别器标配，提升 Lipschitz 约束的实现效率
2019：StyleGAN 的判别器引入小批量标准差（Minibatch Std）层，抑制模式崩溃
2022 至今：扩散模型崛起后，GAN 判别器在高速推理场景仍有竞争力，并被探索与扩散模型结合用于引导生成

常见误解

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

「判别器就是 GAN 里那个『鉴定师』，专门看生成器造的假货够不够真，输出一个 0 到 1 的打分」
「很多人以为判别器训练完就没用了，其实它的特征提取能力可以迁移，用来做图像质量评估或下游分类任务」
「WGAN 里的判别器不再输出概率，而是输出一个无界的连续分数，所以更准确的叫法是评论器（Critic）」

延伸阅读

从知识库精选 3 篇文章，帮助深入理解该术语。

外部参考

维基百科：查看「Discriminator」词条

本页内容为本站原创撰写；维基百科链接仅作延伸参考。

Discriminator（判别器）

概述

工作原理

主要变体与架构演进

应用场景

局限与常见误区

发展脉络

常见误解

相关术语

延伸阅读

GAN 生成对抗网络原理与应用

Actor-Critic：A2C 与 A3C

模仿学习：从行为克隆到逆强化学习

外部参考

概述

工作原理

主要变体与架构演进

应用场景

与相邻概念的区别

局限与常见误区

发展脉络

常见误解

相关术语

延伸阅读

GAN 生成对抗网络原理与应用

Actor-Critic：A2C 与 A3C

模仿学习：从行为克隆到逆强化学习

外部参考