核心要点
能定义现象:层数过深时反复聚合让所有节点表示收敛趋同,丧失可区分性,下游精度下降
能解释成因:多次邻居平均近似图上的拉普拉斯平滑/随机游走,最终趋向与度数相关的平稳分布
能给缓解手段:残差/跳跃连接、PairNorm/归一化、DropEdge、控制层数、JK-Net 跨层聚合
能指出权衡:深层带来更大感受野但加剧过平滑,多数任务 2–4 层即够
标准回答
现象(独占一行)
过平滑指 GNN 层数堆得过深时,反复的邻居聚合让相邻乃至全图节点的表示越来越相似、最终收敛到几乎无法区分,导致节点分类等任务精度不升反降。
成因
一层 GCN 的聚合本质是邻接上的加权平均,等价于一步图上的拉普拉斯平滑。多层叠加相当于多次平滑/随机游走,表示会趋向一个只与节点度数相关的平稳分布,特征中的高频(区分性)信息被不断抹平。
缓解手段
一是结构上加残差/跳跃连接(Residual、JK-Net 把各层表示拼接或取最大),让深层仍保留浅层的判别信息;二是归一化,如 PairNorm 显式约束节点对之间的距离不塌缩;三是 DropEdge——训练时随机丢弃部分边,减缓信息混合并起正则作用;四是直接控制层数,多数图任务 2–4 层即够。详见 GNN 架构。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。