GNN 的过平滑（Over-smoothing）问题是什么？如何缓解？

Question 1

Accepted Answer

现象（独占一行）

过平滑指 GNN 层数堆得过深时，反复的邻居聚合让相邻乃至全图节点的表示越来越相似、最终收敛到几乎无法区分，导致节点分类等任务精度不升反降。

成因

一层 GCN 的聚合本质是邻接上的加权平均，等价于一步图上的拉普拉斯平滑。多层叠加相当于多次平滑/随机游走，表示会趋向一个只与节点度数相关的平稳分布，特征中的高频（区分性）信息被不断抹平。

缓解手段

一是结构上加残差/跳跃连接（Residual、JK-Net 把各层表示拼接或取最大），让深层仍保留浅层的判别信息；二是归一化，如 PairNorm 显式约束节点对之间的距离不塌缩；三是 DropEdge——训练时随机丢弃部分边，减缓信息混合并起正则作用；四是直接控制层数，多数图任务 2–4 层即够。详见 GNN 架构。

Question 2

DropEdge 为什么能缓解过平滑？

Accepted Answer

训练时随机删除一部分边，相当于让每个 epoch 看到的图更稀疏，减慢了邻居信息的混合速度、延缓表示趋同；同时它对图结构做了数据增强，起到正则化、降低过拟合的作用。

Question 3

过平滑和过拟合是同一回事吗？

Accepted Answer

不是。过拟合是模型在训练集表现好、泛化差，属容量/数据问题；过平滑是随深度增加节点表示同质化、连训练集区分度都下降，是 GNN 传播机制的固有问题，需用跳连、归一化、DropEdge 等针对性手段。

GNN 的过平滑（Over-smoothing）问题是什么？如何缓解？

核心要点

标准回答

常见误区

追问

延伸学习