核心要点

  • 池化对特征图做降采样,减少空间尺寸与计算量、扩大后续层感受野

  • 带来一定的平移不变性:局部小位移不改变池化结果,提升鲁棒性

  • 最大池化取窗口内最大值,突出最显著/最强响应的特征,适合纹理、边缘等

  • 平均池化取窗口均值,保留整体背景信息,平滑特征;全局平均池化常替代全连接层做分类头

标准回答

池化的作用

池化是 CNN 中的降采样操作,在每个局部窗口上聚合特征,主要作用有三:减小特征图尺寸从而降低计算与参数、扩大后续卷积的感受野、引入局部平移不变性使模型对小位移更鲁棒。

最大池化 vs 平均池化

  • 最大池化(Max Pooling):取窗口最大值,保留最强响应,能突出边缘、纹理等显著特征,对识别「是否存在某特征」更有效,是分类网络中的常见选择;
  • 平均池化(Average Pooling):取窗口均值,保留区域整体信息、平滑噪声,丢失尖锐细节较多。

全局平均池化(GAP)

把每个通道的整张特征图平均成一个值,直接得到通道维向量替代全连接层,参数更少、抗过拟合,是现代分类网络(如 ResNet)的常用收尾。

选择原则

需要突出显著特征、做特征检测时用 max;需要保留整体分布或做最终聚合时用 avg/GAP。

常见误区

⚠️ 常见踩坑

把池化和卷积步长降采样混为一谈——池化无可学习参数;以为池化必不可少,实际上很多现代网络用步长卷积替代池化完成降采样。

追问

追问 1为什么很多新网络用步长卷积代替池化?

步长卷积同样能降采样,但其降采样方式是可学习的,能根据数据自适应地保留有用信息,而池化是固定的聚合规则。因此 ResNet 等架构倾向用 stride=2 的卷积替代部分池化层,兼顾降维与表达能力。

追问 2池化带来的平移不变性有什么局限?

池化只提供局部、小幅度的平移不变性,对大位移、旋转、尺度变化无能为力,且过度池化会丢失精确的空间定位信息。对需要精确定位的任务(如分割、检测)要谨慎使用,常借助数据增强或专门结构来增强不变性。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。