例如一只鸟,要辨别是不是一只鸟,可以分为几个neuron,每个neuron辨别一个部位,而又一个图像是X*X*3的三维tensor,其中3为channel,即RGB
其中receptive field的分布如下
其中最经典的分布:因为要看全部的channel,所以不用管深度,将高和宽称为kernel size,一般3x3够用了,一般一个receptive field会有一组neuron去守备,而不只是一个
其中receptive field可以移动stride个位置,一般是1或2,因为需要他们之间彼此重叠,但是如果平移之后会超出影像范围,可以padding,如补0
按照这个方式,就会在图像每个位置都被receptive field覆盖,即都有neuron侦测
一张图片里鸟嘴的位置可能不同,但是每个位置都receptive field,每个receptive field都neuron,所以位置不同也可以侦测。那么这些侦测鸟嘴的neuron的功能一样,只是侦测范围不同,那我们真的需要每一个侦测范围都要侦测鸟嘴的neuron吗?我们能不能让不同receptive field的neuron共享参数
总结一下,receptive field+参数共享即得convolutional layer,而用convolutional layer的network即为CNN,专门为影像设计的,虽然他的model bias比较大
但是CNN一旦将图片缩放或者旋转,结果就出问题了
标签:鸟嘴,receptive,neuron,field,CNN,侦测 From: https://www.cnblogs.com/ybx-tih/p/18049840