池化（Pooling）的作用是什么？最大池化与平均池化怎么选？

Question 1

Accepted Answer

池化的作用 池化是 CNN 中的降采样操作，在每个局部窗口上聚合特征，主要作用有三：减小特征图尺寸从而降低计算与参数、扩大后续卷积的感受野、引入局部平移不变性使模型对小位移更鲁棒。 最大池化 vs 平均池化 - 最大池化（Max Pooling）：取窗口最大值，保留最强响应，能突出边缘、纹理等显著特征，对识别「是否存在某特征」更有效，是分类网络中的常见选择； - 平均池化（Average Pooling）：取窗口均值，保留区域整体信息、平滑噪声，丢失尖锐细节较多。 全局平均池化（GAP） 把每个通道的整张特征图平均成一个值，直接得到通道维向量替代全连接层，参数更少、抗过拟合，是现代分类网络（如 ResNet）的常用收尾。 选择原则 需要突出显著特征、做特征检测时用 max；需要保留整体分布或做最终聚合时用 avg/GAP。

Question 2

为什么很多新网络用步长卷积代替池化？

Accepted Answer

步长卷积同样能降采样，但其降采样方式是可学习的，能根据数据自适应地保留有用信息，而池化是固定的聚合规则。因此 ResNet 等架构倾向用 stride=2 的卷积替代部分池化层，兼顾降维与表达能力。

Question 3

池化带来的平移不变性有什么局限？

Accepted Answer

池化只提供局部、小幅度的平移不变性，对大位移、旋转、尺度变化无能为力，且过度池化会丢失精确的空间定位信息。对需要精确定位的任务（如分割、检测）要谨慎使用，常借助数据增强或专门结构来增强不变性。

池化（Pooling）的作用是什么？最大池化与平均池化怎么选？

核心要点

标准回答

常见误区

追问

延伸学习