首页 > 其他分享 >深度学习阅读笔记(四)之卷积网络CNN

深度学习阅读笔记(四)之卷积网络CNN

时间:2023-06-21 19:32:20浏览次数:36  
标签:卷积 分类 网络 笔记 神经网络 权值 CNN


卷积神经网络

  17.《基于卷积神经网络的木材缺陷识别》(具体应用)

(1)主要内容:采用卷积神经网络(CNN)来建立木材缺陷识别系统。详细介绍了CNN网络的基本结构和技术特点。详细介绍了实验CNN网络模型的构件。

(2)采用方法:卷积神经网络(CNN)

(3)特点:权值共享,下采样,局部感受野

(4)优点:卷积神经网络在处理二维图像时有多个独特优点,如无需复杂的特征提取,可以将二维图像直接输入到神经网络中,大大减少了预处理的难度; 局部野和权值共享技术减少了参数空间,大幅度降低了算法的复杂度; 次抽样技术增强了网络鲁棒性,能容忍图像一定程度的畸变   缺点:

(5)实验:详细叙述了模型建立的过程,值得参考。

(6)下一步工作:

(7)值得注意的地方:渐进式学习算法:为减少训练时间,设计一个渐近式学习方法,根据输出的错误样本类别来决定添加该类的样本,降低了算法消耗的时间,获得较高的精度。

 

  18.《基于卷积神经网络的叶片分类识别》(具体应用)

(1)主要内容:简述了CNN发展历史;简要介绍了CNN基本概念和基本结构;详细叙述了基于CNN构件的识别系统。

(2)CNN发展历史:1)1959年,Hubel和Wiese发现了猫的视觉系统是分级的,后来学者们提出“深度学习模型”来描述这种结构。  2)1980年,Kunihiko Fukushima提出的Neocognitron首次引进了CNN 的概念,这也是首个深度学习模型。 3)1988年,LeCun等人将BP算法引入CNN。 4)2003年,Behnke 写了一本关于CNN的著作,对CNN进行了总结。同年,Simard等人对CNN 进行了简化。 5)2011 年,Ciresan等人进一步对CNN 进行了改进,并实现了它的GPU 版本。

(3)采用方法:卷积神经网络。

(4)特点:

(5)优点:使叶片分类操作变得简单,而且提高了分类的精度。   缺点:

(6)实验:详细叙述了实验模型建立过程。

(7)下一步工作:并行化实现CNN网络。获取更多的数据来训练CNN网络,将该模型进行推广应用。

 类似文章:《Flexible, High Performance Convolutional Neural Networks for Image Classification》 不同之处在于:本文基于GPU具体实现了CNN网络,并且实际进行了分类实验和数字字符识别实验,验证CNN的分类效果。

 

  19.《Notes on Convolutional Neural Networks》(公式推导)

(1)主要内容:简述了卷积神经网络(CNN)起源,详细叙述了CNN卷积,下采样,特征组合和具体计算公式和梯度计算公式的推导。简述了部分常规训练方法。

(2)采用方法:

(3)结果:

(4)下一步工作:

(5)值得注意的地方:卷积网络计算的关键在于:1)前向传播时,下采样卷积网络的输出特征图。2)后向传播时,上采样上一层的残差(),以使其与下一层卷积网络的输出特征图大小相匹配。3)计算sigmoid函数及其导数。

  19.《Tiled convolutional neural networks》

(1)主要内容:对卷积神经网络改进,提出平铺卷积神经网路(Tiled CNN),目的是为了增强网络转移不变性的能力。基于地形学独立分析算法,给出了训练TCNN的学习算法,并给出了两个例子证明。

(2)改进方式:不要求相邻的隐含层节点拥有相同的权重,而是要求K步以外的节点相互之间拥有相同的权重,目的是为了增强网络转移不变性的能力。池化和下采样方式与传统CNN一样。

(3)特点:

(4)优点:1)从无标记数据中学习到更多复杂的不便特性,使网络结构具有更强的转移不变性。2)只需要无标记样本进行训练,是训练流程更为简单。3)增强了抗过拟合的能力。   缺点:增加了需要训练参数个数;需要大量的样本进行网络参数训练和调整。

(5)结果:k=2时,通过实验证明分类效果优于传统的CNN网络,TiledCNN比传统的CNN具有更强的抗畸变的能力。

(6)下一步工作:探索把Tiled-CNN应用与其他领域。

(7)值得注意的地方:

 

  20.《Exploring Convolutional Neural Network Structures and Optimization Techniques for Speech Recognition》

(1)主要内容:通过实验分析比较了CNN的卷积权值共享结构与深度神经网络(DNN)没有卷积层的差别;并从时域和频域两个角度来比较卷积的效果。提出了权值缓冲池技术,用于自动调整缓冲池的大小,并通过实验验证。通过比较预训练玻尔兹曼机(RBN)和卷积玻尔兹曼机(CRBM),分析预训练对于卷积网络的影响。

(2)采用方法:同(1)

(3)结果:1)含有卷积层的CNN网络分类效果高于不含卷积层的深度神经网络。原因:CNN网络对于声音的小的频率扰动存在不变形,抗扰动和畸变能力优于DBN网络。2)有限权值共享分类效果高于整体权值共享结构。 原因:局部权值共享在各个特征图里面采样到不同的离散的的特征;相反,整体权值共享只能所有的特征图里面采集到相同的连续的特征。 3)随时域卷积的效果明显高于随频域卷积的效果。启发:实际应用时注意考虑频域声音信号的干扰。4)权重最大池技术使得识别效果得到提升。启发:识别和分类时考虑不同特征,自动调整缓冲池大小和结构,提升算法效率和分类准确率。 5)考虑用采用CRBM预训练CNN的卷积层,提高分类精度。

(6)下一步工作:对池化层进行改进,使其能够自动的根据采样到特征不同,自动变换池的结构和大小。

(7)值得注意的地方:1)卷积层和局部权值共享能有效地提高深度网络特征提取的能力,进而提高分类精度或者识别率。2)随时域进行卷积运算。3)采用CRBM预训练CNN卷积层,能有效提高卷积网络分类精度。

 

  21.《Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis》

(1)主要内容:从两个方面,即增大训练样本集和改进CNN结构,来提高用于视觉分析的CNN网络的识别准确率。并且通过实验论证。

(2)采用方法:弹性扭曲来扩大样本集,“do-it-yourself”方法来简化CNN网络结构。

(3)特点:增大训练样本集,结构简化,但分类准确率提高。

(4)优点:增加输入样本集,可以是网络得到充分训练,避免过拟合。简化的CNN结构,使其训练和结构更加简单,不需要复杂的权值衰减,精调整,向量,结构相关的学习速率等参数;同时简化CNN结构具有更为普遍的适用性,更高的准确率。   缺点:

(5)结果:MNIST数据集数字分类实验中,取得了有史以来最好的效果。

(6)下一步工作:

(7)值得注意的地方:卷积网络与一般向量网络(SVM)比较:优点:比一般的向量网络更适合提取输入信号的特征,它不需要知道输入信号。 缺点:获得的只是来源于网络的空间结构关系,而不是输入样本元素之间的关系。

 

  22《3D Convolutional Neural Networks for Human Action Recognition》

(1)主要内容:1)提出通过3D卷积操作核去提取视频数据的时间和空间特征。这些3D特征提取器在空间和时间维度上操作,因此可以捕捉视频流的运动信息。 2)基于3D卷积特征提取器构造了一个3D卷积神经网络。这个架构可以从连续视频帧中产生多通道的信息,然后在每一个通道都分离地进行卷积和下采样操作。最后将所有通道的信息组合起来得到最终的特征描述。 3)提出通过计算高层运动特征得到的辅助输出来增强模型。为了应对不同环境的使用,还综合多个不同的CNN架构去综合判断识别结果。 4)通过实验实验证明3DCNN网络超过了2DCNN网络及其他网络。

(2)采用方法:同(1)

(3)特点:3D卷积:通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积。传统CNN网络是2维的。

(4)优点:提取到更多的特征,提高分类的准确度   缺点:节点和参数增多,网络结构更为复杂,对于网络学习和训练提出更高的要求。

(5)结果:3DCNN网络超过了2DCNN网络及其他网络。

(6)下一步工作:

(7)值得注意的地方:1)一个CNN设计的通用规则就是:在离输出越近的特征图的个数应该越多,这样可以从低级特征图中组合产生更多类型的特征;也可以采用多种

标签:卷积,分类,网络,笔记,神经网络,权值,CNN
From: https://blog.51cto.com/u_13046751/6530906

相关文章

  • 深度学习论文阅读笔记(三)之深度信念网络DBN
    深度神经网络   12.《受限波尔兹曼机简介》(1)主要内容:主要介绍受限玻尔兹曼机(RBM)的基本模型、学习算法、参数设置、评估方法、变形算法等,探讨了RBM在未来值得研究的方向。(2)RBM的基本模型和学习算法(描述比较清楚):对比散度学习算法(Gibbs采样),(3)RBM参数设置(叙述比较详细):1)小批量数据处理......
  • 深度学习阅读笔记(二)之自动编码器SAD
    一、自动编码器(DAE)   7. 《深度自动编码器的研究与展望》   主要内容:讲述了自动编码器的发展由来。阐述了DAE的基本概念和原理;网络模型的构建和训练方法。并对DAE进行了分类,指出了DAE存在的问题和对DAE未来发展的展望。  (1)自动编码器比传统BP网络的优势:免去了人工提取数据......
  • 深度学习学术论文阅读笔记(一)之经典学术论文阅读笔记
    深度学习算法主要分类三大类:自动编码器,深度神经网络和卷积神经网络。下面是对这三种网络分类进行的初步调研。深度学习6篇非常重要的文章:  1.《Learning multiple layers of representation》 / G E. Hinton(1)主要内容:论述采用多层网络表达(深度学习网络:卷积网络,堆叠自动编......
  • 【笔记】大一下数值分析碎碎念——插值
    \(\newcommand\op[1]{\operatorname{#1}}\)插值给定数据点\((x_i,y_i)\),要求找到函数满足\(f(x_i)=y_i\)。线性插值:全局信息维护,光滑性(求导),积分都不太好搞。但是原理简单。多项式?指数?变化快。三角函数?周期性。多项式插值Weierstrass逼近定理:设\(f\in\opC[a,b]\),则......
  • opencv学习笔记(五)
    Sobel算子:Sobel算子是一种常用的图像梯度算子,用于检测图像中的边缘。它基于离散的差分运算,通过计算图像在水平和垂直方向上的梯度来确定边缘的强度和方向。importcv2importnumpyasnp#读取图像image=cv2.imread('input.jpg',cv2.IMREAD_GRAYSCALE)#计算水平方向......
  • MongoDB学习笔记
    MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存......
  • 大型网站技术架构 核心原理与案例分析--阅读笔记
    第一章大型网站架构演化大型网站软件系统的特点大型网站软件系统的特点高并发、大流量高可用海量数据用户分布广法、网络情况复杂安全环境恶劣需求快速变更、发布频繁渐进式发展大型网站架构演化发展历程大型网站的技术挑战主要来自庞大的用户,高并发的访问和海量的数据,任何简单......
  • MySQL笔记整理
    SELECT0+'123.00';SELECT0+'123.0qwe';SELECT0+'qwe1';SELECT0+null;SELECT'123.00'/4;SELECT'123.0qwe'/4;SELECT'qwe1'/4;SELECT'1qwe'/4;SELECTnull/4;SELECTconvert(......
  • iOS开发笔记 - Objective-C和JavaScript的混编
    最近看了一个对Github上面编程语言使用统计的排行榜,JavaScript真可以说是一枝独秀,很难想象20年前,这个语言只是浏览器中的装饰性语言,能做的事情也就是一点特效或者检查一下要提交给服务器的表单是否满足要求。今天的JavaScript已经是一个全栈语言,从客户端到服务器无所不在。很多编程......
  • iOS开发笔记 - 语言篇之Swift
     2014年的苹果全球开发者大会(WWDC),当CraigFederighi向全世界宣布“Wehavenewprogramminglanguage”(我们有了新的编程语言)的时候,全场响起了最热烈和持久的掌声,伴随着掌声到来的语言叫Swift。接下来CraigFederighi更是毫不掩饰的告诉大家,Swift将成为主宰iOS和Mac开发的新语言,甚......