在深度学习中,我们经常会听到感受野这个词语,那么感受野究竟是什么呢?
在卷积神经网络中,感受野的定义是 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。
RCNN论文中有一段描述,Alexnet网络pool5输出的特征图上的像素在输入图像上有很大的感受野(have very large receptive fields (195 × 195 pixels))和步长(strides (32×32 pixels) ), 这两个变量的数值是如何得出的呢?
感受野计算时有下面的几个情况需要说明:
即strides(i) = stride(1)*stride(2)*…*strides(i-1)
关于感受野大小的计算采用top to down的方式,即先计算最深层在前一层的感受野,然后逐渐传递到第一层,使用的方式可以表示如下:
RF = 1 #待计算的feature map上的感受野大小
For layer in (top layer To down layer):
RF = ((RF-1)*stride) + fsize
stride表示卷积的步长;fsize表示卷积层滤波器的大小。