卷积神经网络

一、简介

之前我们说神经网络它是个特征提取器，但是它能提什么特征？我们叫做结构化的数据，也就是说常见的一些指标，例如我们今天说身高、年龄、体重。但是在图像数据当中，我们说每一个特征或者叫每一个像素点，它并不是身高、体重和年龄这种相对来说可以独立的，但是图像当中的点和点之间肯定是有关系的，所以说卷积神经网络是专门解决图像这个问题的。我们并不是单独的去看每一个像素点，而是用一些滑动窗口在原始图当中一个个去滑，目的是不仅仅看一个像素点，而是看它周围的区域，一整个区域我们选出来一个特征，再一个区域选出来一个特征，那不断的滑动位置后，我们现在就原始的一张输入图像得到了我们接下来很多很多的特征点。

二、应用领域

卷积神经网络（CNN）主要应用于计算机视觉领域。

目标检测
分类与检索
超分辨率重构
医学任务
无人驾驶
人脸识别

三、与传统网络的区别

传统网络的输入是一列特征，而卷积神经网络的输入是一张图片。

四、整体架构

五、卷积层

1、卷积的作用

通俗地讲，卷积就是把原始图像分成不同的小区域，通过带有权重参数的小窗口滑动，提取一个个小区域的的特征，得到一张特征图。

2、卷积核

卷积核就是我们上面提到的小窗口，携带权重参数矩阵。卷积核的通道数应该和原始图像保持一致。

3、图像颜色通道

图像是三维的，w x h x c，c表示通道数。一般图像有RGB三通道，把三个通道分别做特征提取，再加起来。

4、特征值的计算

将原始图像的三个通道的对应区域，与卷积核的权重参数矩阵做内积运算（对应位置相乘再相加），将结果相加。最后，与偏置一起相加得到这一区域的特征值。滑动过所有区域即完成一次卷积，得到包含每个区域特征值的特征图。

5、卷积层

卷积只进行一次吗？卷积一次的效果当然不好，我们采用堆叠的卷积层提取特征。

3表示3通道
6表示6个卷积核堆叠
10表示10个卷积核堆叠

6、卷积层的参数

滑动窗口步长。滑动窗口时移动的长度或者移动的单元格数。步长越小，提取的特征越丰富；步长越大，提取的特征越少。一般情况下设置为1，特殊任务就视情况而定。

卷积核尺寸。与步长类似，卷积核越小，就是越小力度地提取，得到的特征越丰富。一般设置为3x3。
填充（padding）。我们可以发现，越靠近边界的点就越被使用得少，越靠近中心的点被利用得越多。为了弥补边界缺失的信息，采用边缘填充的方法。
卷积核个数

7、卷积结果计算公式

8、卷积参数共享

每个区域都使用相同的卷积核，共享卷积参数。

六、池化层

1、池化的作用

由于特征数量过多·，且并不是所有的特征都是重要的，所以使用池化压缩特征，或者称为“下采样”。池化可以对特征进行筛选。

2、池化类型

最大池化（max pooling）。选择每个区域中最大的特征值。注：效果最好，使用最多。

平均池化。

七、整体网络架构

每个卷积层都和RELU搭配使用，卷积两次就池化一次。我们已经知道，卷积神经网络的输入是三维的图像，而传统神经网络的输入是特征向量。图像在经过卷积之后得到的特征，应该输入到全连接层中，得到最后分类的结果。所以，在最后的POOL和FC层之间，还有一个扁平化操作，将多维特征拉成一个向量。下图是一个七层的卷积神经网络。