标签噪声如何影响模型？有哪些缓解方法？

Question 1

标签噪声如何影响模型？有哪些缓解方法？

Accepted Answer

对模型的影响 标签噪声指训练样本的标签部分错误。它直接抬高了模型可达到的最优误差——即使模型完美拟合真实规律，仍会在错标样本上"出错"，所以泛化误差的上界随噪声率上升而变差。 更隐蔽的问题是记忆效应：深度网络等高容量模型容量足够大时，会先学到干净样本的规律，训练后期逐渐"记住"噪声标签，导致验证误差先降后升。交叉熵这类无界损失对错标样本会产生很大梯度，进一步放大其负面影响。 缓解方法 1. 鲁棒损失函数：MAE、Generalized Cross Entropy（GCE）、对称交叉熵（SCE）等对离群标签梯度有界，比交叉熵更抗噪。 2. 样本筛选/清洗：置信学习（confident learning）利用模型预测概率与给定标签的联合分布估计错标样本并剔除或重标；也可按训练损失值过滤高损失的可疑样本（small-loss trick，如 Co-teaching）。 3. 正则化与早停：噪声多在训练后期被记忆，配合强正则、Mixup、标签平滑与早停，可在记忆噪声前停止。 4. 样本加权 / 半监督：给可疑样本降权，或把低置信样本当作无标签数据做半监督学习。

Question 2

为什么 MAE 比交叉熵对标签噪声更鲁棒？

Accepted Answer

MAE（绝对误差）对所有样本的梯度大小有界且较均衡，错标样本不会主导更新；交叉熵在预测与标签严重不符时梯度爆发式增大，使少量错标样本贡献过大梯度，从而更容易被模型迁就和记忆。

Question 3

置信学习（confident learning）的基本原理是什么？

Accepted Answer

它假设标签噪声与样本特征无关（类条件噪声），用交叉验证得到的预测概率估计"给定标签"与"真实标签"的联合分布混淆矩阵，据此识别每类中预测置信度高却与标签冲突的样本作为错标，进行剔除或重标，再重新训练。

标签噪声如何影响模型？有哪些缓解方法？

核心要点

标准回答

常见误区

追问

延伸学习