深度学习技巧之Padding
卷积神经网络是深度学习中处理图像的利器。在卷积神经网络中,Padding是一种非常常见的操作。本片博客将简要介绍Padding的原理。
首先,我们看一下正常的卷积操作:

如上图所示,左图是一个5×5的图像(绿色),我们使用一个3×3的卷积核(kernal,或者是滤波器,filter)进行卷积操作(黄色),最终可以得到一个3×3的结果(右边的红色图像)。
使用卷积操作处理图像带来了两个问题:首先是图像由原来的5×5的矩阵变成了3×3的结果,这使得输入的图像缩小(shrink)了。在一个大型的卷积神经网络中,如果一个图像经过了几百次的卷积操作,那么会使得图片缩小的很厉害。其次,可以看到,这种扫描方式会使得边缘角落的像素被扫到的次数少于中间的像素。例如,左上角第一个像素1,自始至终只会被扫描到1次,而最中间的1会被扫描到9次。这种操作会使我们都是图片的边缘信息。
为了缓解上述问题,我们会对图片做填充操作(padding)。即在图片边缘加一条边。

