标准回答
本质区别(独占一行)
普通卷积工作在规则的欧式网格(图像像素阵)上,邻域大小与相对位置固定;图卷积工作在不规则图上,每个节点邻居数不同、且邻居之间没有空间顺序。
三点对比
一是结构:CNN 假设固定 (3\times3) 这类规则邻域,能用滑动窗口;图上节点度数可变、无网格坐标,无法用固定窗口。二是排列不变性:图的邻居是无序集合,GNN 聚合必须用 sum/mean/max 这类排列不变函数,结果不依赖邻居编号;而 CNN 卷积核每个位置有独立权重,对像素的空间顺序是敏感的(这正是它能识别方向、纹理的原因)。三是权重共享方式:CNN 在所有空间位置共享同一组卷积核权重;GNN 在所有节点共享同一聚合与变换函数。
两者关系
图像可看作一种特殊的规则网格图,每个像素恰好连接固定的上下左右邻居。因此 CNN 可视为 GNN 在规则网格上的特例,GNN 把卷积的「局部聚合 + 权重共享」思想推广到了任意拓扑。
常见误区
⚠️ 常见踩坑
别说「GNN 就是把 CNN 套到图上」——关键差异在排列不变性与可变邻居数;CNN 的卷积核对位置敏感,正因图缺乏固定的空间顺序,才不能直接照搬带方向的卷积核。
追问
追问 1:既然图像是规则图,为什么不直接用 GNN 处理图像?
可以但不划算。图像的规则网格让 CNN 能用高度优化的卷积、利用方向性卷积核且计算高效;用通用 GNN 会丢掉这种规则先验、聚合也多为排列不变而损失方向信息,效率和效果都不如专用 CNN。
追问 2:CNN 的池化在 GNN 里对应什么?
对应图池化(Graph Pooling),如 readout 的 sum/mean/max 把节点表示汇成图级向量,或 DiffPool、TopK Pooling 这类可学习的层次化下采样,逐步把图粗化为更小的图。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。