目录
卷积
卷积层的结构参数
**卷积核大小(Kernel Size): **定义卷积操作的感受野。
步幅(Stride): 定义卷积核遍历图像时的步幅大小,默认值常设为1。设置大于1的值后对图像进行下采样,类似于池化操作。
边界扩充(Padding): 定义了网络层处理样本边界的方式。当卷积核大于1且不进行边界扩充,输出尺寸将相应缩小;当卷积核以标准方式进行边界扩充,则输出数据的空间尺寸将与输入相等。
输入与输出通道(Channels): 构建卷积层时需定义输入通道I,并由此确定输出通道O。这样,可算出每个网络层的参数量是I x O x K,其中K为卷积核的参数个数。例如某个网络层有64个大小为3 x 3的卷积核,则对应K值为3 x 3 = 9。
计算公式
\[o=\frac{i+2 p-k}{s}+1 \]特殊卷积
-
输出尺寸与输入尺寸相同,这种padding称为same padding,又称half padding。
其中$ p=k/2
\[\begin{aligned} o & =(i-k)+2 p+1 \\ & =i+2\left\lfloor\frac{k}{2}\right\rfloor-(k-1) \\ & =i+2\left\lfloor\frac{2 n+1}{2}\right\rfloor-(2 n+1-1) \\ & =i+2 n-2 n \\ & =i\end{aligned} \]
$, \(k是奇数, k=2n+1\) -
输出尺寸比输入尺寸大,这种padding成为full padding。一般的卷积相对于输入大小会减小输出大小,通过适当的零填充可以使输出尺寸大于输入尺寸,这种卷积方法成为全填充。当\(p=k-1\)填充时,输出维度为:
\[\begin{aligned} o & =i+2(k-1)-k+1 \\ & =i+2(k-1)-(k-1) \\ & =i+(k-1)\end{aligned} \]