手撕代码：实现 2D 卷积

Question 1

手撕代码：实现 2D 卷积？

Accepted Answer

2D 卷积本质是卷积核在输入特征图上滑动，每滑到一个位置就把覆盖的局部区域与卷积核做逐元素相乘再求和，得到输出的一个像素。实现要点有三：先用 padding 在输入四周补零以控制输出尺寸与保留边缘信息；用 stride 决定窗口每次移动的步长；输出尺寸由公式 (H + 2P − K)/S + 1 决定。下面给出单输入/单核的直观滑窗实现（含 stride 与 padding）：

Question 2

复杂度是多少？工程上如何加速？

Accepted Answer

单核朴素实现为 O(H_out·W_out·K²)，多通道多核再乘以 C_in·C_out。工程上用 im2col 把每个滑窗展平成列、再用一次大矩阵乘 (GEMM) 完成所有卷积，充分利用 BLAS/GPU；小核常用 Winograd，大核或 FFT 卷积进一步降复杂度。

Question 3

深度学习里卷积和数学定义的卷积有何区别？

Accepted Answer

数学卷积要把核翻转（180°）再滑动，而深度学习框架（如 PyTorch 的 Conv2d）实际做的是「互相关」——不翻转核直接滑窗相乘。因为核是学出来的，翻转与否只是参数的镜像，效果等价，所以业界统一称作卷积。

手撕代码：实现 2D 卷积

核心要点

标准回答

常见误区

追问

延伸学习