核心要点

  • 能讲结构差异:图无规则网格,节点邻居数不固定、无空间顺序,CNN 依赖固定网格与邻域

  • 能讲排列不变:GNN 聚合须对邻居排列不变;CNN 卷积核位置固定、对像素顺序敏感

  • 能讲权重共享:CNN 共享同一卷积核扫整图,GNN 共享同一聚合/变换函数作用于所有节点

  • 能点出关系:图像是规则网格图,CNN 可视为 GNN 在该特例上的实现

标准回答

本质区别(独占一行)

普通卷积工作在规则的欧式网格(图像像素阵)上,邻域大小与相对位置固定;图卷积工作在不规则图上,每个节点邻居数不同、且邻居之间没有空间顺序。

三点对比

一是结构:CNN 假设固定 (3\times3) 这类规则邻域,能用滑动窗口;图上节点度数可变、无网格坐标,无法用固定窗口。二是排列不变性:图的邻居是无序集合,GNN 聚合必须用 sum/mean/max 这类排列不变函数,结果不依赖邻居编号;而 CNN 卷积核每个位置有独立权重,对像素的空间顺序是敏感的(这正是它能识别方向、纹理的原因)。三是权重共享方式:CNN 在所有空间位置共享同一组卷积核权重;GNN 在所有节点共享同一聚合与变换函数。

两者关系

图像可看作一种特殊的规则网格图,每个像素恰好连接固定的上下左右邻居。因此 CNN 可视为 GNN 在规则网格上的特例,GNN 把卷积的「局部聚合 + 权重共享」思想推广到了任意拓扑。

常见误区

⚠️ 常见踩坑

别说「GNN 就是把 CNN 套到图上」——关键差异在排列不变性与可变邻居数;CNN 的卷积核对位置敏感,正因图缺乏固定的空间顺序,才不能直接照搬带方向的卷积核。

追问

追问 1既然图像是规则图,为什么不直接用 GNN 处理图像?

可以但不划算。图像的规则网格让 CNN 能用高度优化的卷积、利用方向性卷积核且计算高效;用通用 GNN 会丢掉这种规则先验、聚合也多为排列不变而损失方向信息,效率和效果都不如专用 CNN。

追问 2CNN 的池化在 GNN 里对应什么?

对应图池化(Graph Pooling),如 readout 的 sum/mean/max 把节点表示汇成图级向量,或 DiffPool、TopK Pooling 这类可学习的层次化下采样,逐步把图粗化为更小的图。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。