MobileNet模型可应用于各种识别任务,以实现高效的设备智能。
摘要:我们为移动和嵌入式视觉应用提供了一类称为MobileNet的高效模型。MobileNets基于一种流线型架构,使用深度可分离卷积构建轻量级深层神经网络。我们引入了两个简单的全局超参数,可以有效地在延迟和准确性之间进行权衡。这些超参数允许模型生成器根据问题的约束为其应用程序选择适当大小的模型。我们在资源和精度权衡方面进行了大量实验,与其他流行的ImageNet分类模型相比,我们表现出了强大的性能。然后,我们展示了MobileNet在广泛的应用和用例中的有效性,包括目标检测、细粒度分类、人脸属性和大规模地理定位。
将(a)中的标准卷积滤波器替换为两层:深度卷积(b)和点卷积(c),以构建深度可分离滤波器。
(a)输入的feature map有M个,输出的feature map有N个。Standard convolution呢,是采用N个大小为DKDK的卷积核进行操作(注意卷积核大小是DKDK)
Depthwise convolution :一个卷积核负责一个通道,一个通道只被一个卷积核卷积;则这里有M个DKDK的卷积核;
Pointwise convolution:为了达到输出N个feature map的操作,所以采用N个1*1的卷积核进行卷积,这里的卷积方式和传统的卷积方式是一样的,只不过采用了1*1的卷积核;其目的就是让新的每一个feature map包含有上一层各个feature map的信息!在此理解为将depthwise convolution的输出进行“串”起来。
左:带batchnorm和ReLU的标准卷积层。右图:带深度层和点层的深度可分离卷积,后跟batchnorm和ReLU
实验结果:后面则是一些具体的实验,表明mobileNet在参数量和精度上的权衡。
微信公众号:
下载对应的论文,在公众号中回复:paper