首页 > 其他分享 >07-GoogLenet 图像分类

07-GoogLenet 图像分类

时间:2023-01-12 14:45:48浏览次数:40  
标签:输出 07 卷积 GoogLenet 图像 Inception 100 256 结构

Inception 结构的主要思路是用密集成分来近似最优的局部稀疏结构。原始Inception 结构如下图所示:

 

   显然从上图中可以看出,原始Inception 结构采用 1 × 1、 3 × 3和 5 × 5三种卷积核的卷积层进行并行提取特征,这可以加大网络模型的宽度,不同大小的卷积核也就意味着原始Inception 结构可以获取到不同大小的感受野,上图中的最后拼接就是将不同尺度特征进行深度融合。

  同时在原始Inception 结构之所以卷积核大小采用1、3和5,主要是为了方便对齐。设定卷积步长stride=1之后,只要分别设定pad=0、1、2,那么卷积之后便可以得到相同维度的特征,然后这些特征就可以直接深度融合了。

  最后文章说很多地方都表明pooling挺有效,所以原始Inception结构里面也加入了最大池化层来降低网络模型参数。特别重要的是网络越到后面,特征越抽象,而且每个特征所涉及的感受野也更大了,因此随着层数的增加,GoogLeNet中3x3和5x5卷积的比例也要增加。

  但是原始Inception结构中 5 × 5 、卷积核仍然会带来巨大的计算量。降低 5 × 5 卷积核带来的计算量,GoogLeNet中借鉴了NIN(Network in Network)的思想使用 1 × 1 卷积层与 5 × 5卷积层相结合来实现参数降维。

  对于 1 × 1卷积层与 5 × 5卷积层实现参数降维,在这里也举一个简单的例子进行说明。假如上一层的输出为 100 × 100 × 128,经过具有 256个输出的5×5卷积层之后(stride=1,pad=2),输出数据为 100 × 100 × 256。其中,那么卷积层的参数为 128 × 5 × 5 × 256。此时如果上一层输出先经过具有 32个输出的 1 × 1卷积层,再经过具有 256个输出的 5 × 5卷积层,那么最终的输出数据仍为为 100 × 100 × 256,但卷积参数量已经减少为 128 × 1 × 1 × 32 + 32 × 5 × 5 × 256,相比之下参数大约减少了4倍。

  因此在 3 × 3和 5 × 5卷积层之前加入合适的 1 × 1卷积层可以在一定程度上减少模型参数,那么在GoogLeNet中基础Inception结构也就做出了相应的改进,改进后的Inception结构如下图所示。

 

 

 

 

 

 GoogLeNet的整体网络架构如下:

 

 参考:https://blog.csdn.net/qq_30091945/article/details/105128249

 

标签:输出,07,卷积,GoogLenet,图像,Inception,100,256,结构
From: https://www.cnblogs.com/zhaopengpeng/p/17046611.html

相关文章

  • LeetCode刷题(107)~制造字母异位词的最小步骤数【巧妙】
    题目描述给你两个长度相等的字符串s和t。每一个步骤中,你可以选择将t中的任一字符替换为另一个字符。返回使t成为s的字母异位词的最小步骤数。字母异位词指字母......
  • 1807. 替换字符串中的括号内容
    1807.替换字符串中的括号内容给你一个字符串 s ,它包含一些括号对,每个括号中包含一个非空 的键。比方说,字符串 "(name)is(age)yearsold" 中,有 两个 括号对,分别......
  • 06 滚动条操作1.0 - 调整图像亮度
    06滚动条操作1.0-调整图像亮度opencv知识点:创建滚动条-createTrackbar()处理滚动条事件的函数-TrackbarCallback()本课所解决的问题:如何创建滚动条?如何通......
  • [转]Python PDF文件转png图像文件
    13个有趣的Python高级脚本:PythonPDF文件转png图像文件# PDF to Imagesimport fitzpdf = 'sample_pdf.pdf'doc = fitz.open(pdf)for page in doc: ......
  • 06-DenseNet 图像分类
          DenseNet代码实现(pytorch):1importtorch2importtorch.nnasnn3importtorchvision45print("PyTorchVersion:",torch.__ver......
  • 04 图像像素的读写操作
    04图像像素的读写操作opencv知识点:获取/改变图像的某个像素-Mat::at图像像素-数组遍历图像像素-指针遍历本课所解决的问题:如何获取/改变图像的某个像素?......
  • HTTP请求错误400、401、402、403、404、405、406、407、412、414、500、501、502解析
    HTTP错误400400请求出错由于语法格式有误,服务器无法理解此请求。不作修改,客户程序就无法重复此请求。HTTP错误401401.1未授权:登录失败此错误表明传输给服务器......
  • [LeetCode] 1807. Evaluate the Bracket Pairs of a String
    Youaregivenastring s thatcontainssomebracketpairs,witheachpaircontaininga non-empty key.Forexample,inthestring "(name)is(age)yearsold",......
  • day07-Vue04
    Vue0412.Vue2脚手架模块化开发目前开发模式的问题:开发效率低不够规范维护和升级,可读性比较差12.1基本介绍官网地址什么是VueCli脚手架12.2环境配置,搭建项目......
  • CQOI2007,洛谷P4710涂色
    题目描述假设你有一条长度为\(5\)的木版,初始时没有涂过任何颜色。你希望把它的\(5\)个单位长度分别涂上红、绿、蓝、绿、红色,用一个长度为\(5\)的字符串表示这个目......