首页 > 其他分享 >深度学习阅读笔记(二)之自动编码器SAD

深度学习阅读笔记(二)之自动编码器SAD

时间:2023-06-21 19:31:45浏览次数:42  
标签:DAE 编码器 分类 笔记 降噪 堆叠 自动 SAD


一、自动编码器(DAE)

   7. 《深度自动编码器的研究与展望》

   主要内容:讲述了自动编码器的发展由来。阐述了DAE的基本概念和原理;网络模型的构建和训练方法。并对DAE进行了分类,指出了DAE存在的问题和对DAE未来发展的展望。

  (1)自动编码器比传统BP网络的优势:免去了人工提取数据特征的巨大工作量,提高了特征提取的效率,降低了原始输入的维数。

了自动编码器的发展由来:

1986 年Rumelhart 提出自动编码器的概念,并将其用于高维复杂数据处。

2006 年,Hinton 对原型自动编码器结构进行改进,进而产生了DAE。

2007 年,Benjio 提出稀疏自动编码器的概念。

2008 年,Vincent提出降噪自动编码器。

2009 年,Benjio 阐述利用堆叠自动编码器构建深度学习神经网络。

2010 年,Salah 提出收缩自动编码器。

2011 年, Jonathan 提出卷积自动编码器,用于构建卷积神经网络。

DAE定义和组成:DAE 是一种利用经过无监督逐层贪心预训练和系统性参数优化的多层非线性网络,从无类标数据中提取高维复杂输入数据的分层特征,并得到原始数据的分布式特征表示的深度学习神经网络结构。DAE 由编码器、解码器和隐含层组成。

  (4)DAE构建:1、改进原编码器结构;2、选择合适的代价函数和优化策略。

  (5)DAE网络参数训练:1、预训练;2、精调。

稀疏理论的DAE,基于统计理论的DAE,基于鲁棒理论的DAE,基于卷积理论的DAE。

  (7)DAE存在问题与展望:深度理论方面问题(3个);建模策略方面问题(3个);工程实践方面问题(3个)。

 

分类中的应用研究》

SD算法:单层稀疏编码器(SAE)用于提取文本特征,然后用两层深度置信网络用于特征分类。最后与用支持向量机(SVM)分类效果比较。

  (2)采用方法:

  (3)特点:

  (4) 优点:适合于处理高维数据,样本数较多的情况下,分类效果明显高于传统分类方法(SVM)      

       缺点:训练集较少情况下,分类效果不如SVM。

  (5)结果:

  (6)下一步工作:

  (7)值得注意的地方:

 

分类(对东西的偏好)研究》

   (1)主要内容:提出DEA算法:采用单层降噪编码器用于特征提取,然后采用k-means算法对提取到的特征进行分类,并将结果与S传统的SVM对比。

   (2)优点:在不平衡率(少数与多数值之比)较高的前提下,DAE 算法分类的效果要优于传统的支持向量机算法。

   (3)缺点:在不平衡率较低时,分类效果不如传统SVM。

   (4)值得注意的地方:

 

  10.《EXTRACTING DEEP BOTTLENECK FEATURES USING STACKED AUTO-ENCODERS》

(1)主要内容:提出了一种新的网络结构来获得深度神经网络的瓶颈特性(隐含层节点的激活程度)。采用堆叠编码器进行特征提取首先对堆叠的编码器进行逐层的非监督训练,然后加入一个瓶颈层和一个隐含层用于分类,然后对整个系统进行微调;训练完成后把整个网络用于预测语音分类。同过采用更大的数据集和在不同的系统环境中进行试验,证明了该方法具有一般适用性。

(2)采用方法:同(1)。

(3)特点:采用堆叠自动编码器来进行特征提取而不是限制玻尔兹曼机(RBM),因为限制玻尔兹曼机不适合于对无关联数据建模。

(4)优点:适合于对无关联数据(图片,语音信号)进行建模和特征提取  

(5)结果:采用更多的无标记数据预训练自动编码器能达到更好的提取效果,特别是在用于有监督微调和系统训练的标记样本很少的时候。降噪编码器是用于初始化深度网络和声学建模。预训练非常有用也非常关键在数据量不足的时候。

(6)下一步工作:寻找更好的输入特征向量(需要提取的特征)和更好的系统组合结构;比较降噪编码器和RBM在预训练和微调时预测独立变量的能力。

(7)值得注意的地方:1)增加自动编码器的数量可以提取出更多有用的特征,但是必须要采用无标记样本进行预训练,尤其是在数据及较少的时候。当隐含层数大于5层之后,识别效果不会有更大的提高。2)堆叠自动编码器与深度信念网络的区别:DBNs有关的研究包括堆叠自动编码器,它是通过用堆叠自动编码器来替换传统DBNs里面的RBMs。1)堆叠自动编码器缺少层的参数化的严格要求。2)与DBNs不同,自动编码器使用判别模型,这样这个结构就很难采样输入采样空间,这就使得网络更难捕捉它的内部表达。但是,降噪自动编码器却能很好的避免这个问题,并且比传统的DBNs更优。3)训练单一的降噪自动编码器的过程和RBMs训练生成模型的过程一样。

 

  11.《Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion》

(1)主要内容:深度探究采用降噪编码器来建立深度网络。通过实验证明,堆叠降噪编码器用于分类实验时得到更小的分类误差,效果超过了深度信念网络(DBN);无监督学习提取到更好的特征,提升了下一步SVM的分类效果。量化实验证明,与普通自动编码器不一样,降噪编码器可以学习图像块的Gabor状边缘特性和字符图像的大笔画特性。通过这些实验证明降噪标准对进行无监督训练以获得对于输入的更好的重构非常有价值。

(2)采用方法:

(3)特点:

(4)优点:   缺点:

(5)结果:

(6)下一步工作:

(7)值得注意的地方:

标签:DAE,编码器,分类,笔记,降噪,堆叠,自动,SAD
From: https://blog.51cto.com/u_13046751/6530909

相关文章

  • 深度学习学术论文阅读笔记(一)之经典学术论文阅读笔记
    深度学习算法主要分类三大类:自动编码器,深度神经网络和卷积神经网络。下面是对这三种网络分类进行的初步调研。深度学习6篇非常重要的文章:  1.《Learning multiple layers of representation》 / G E. Hinton(1)主要内容:论述采用多层网络表达(深度学习网络:卷积网络,堆叠自动编......
  • 【笔记】大一下数值分析碎碎念——插值
    \(\newcommand\op[1]{\operatorname{#1}}\)插值给定数据点\((x_i,y_i)\),要求找到函数满足\(f(x_i)=y_i\)。线性插值:全局信息维护,光滑性(求导),积分都不太好搞。但是原理简单。多项式?指数?变化快。三角函数?周期性。多项式插值Weierstrass逼近定理:设\(f\in\opC[a,b]\),则......
  • opencv学习笔记(五)
    Sobel算子:Sobel算子是一种常用的图像梯度算子,用于检测图像中的边缘。它基于离散的差分运算,通过计算图像在水平和垂直方向上的梯度来确定边缘的强度和方向。importcv2importnumpyasnp#读取图像image=cv2.imread('input.jpg',cv2.IMREAD_GRAYSCALE)#计算水平方向......
  • MongoDB学习笔记
    MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存......
  • 大型网站技术架构 核心原理与案例分析--阅读笔记
    第一章大型网站架构演化大型网站软件系统的特点大型网站软件系统的特点高并发、大流量高可用海量数据用户分布广法、网络情况复杂安全环境恶劣需求快速变更、发布频繁渐进式发展大型网站架构演化发展历程大型网站的技术挑战主要来自庞大的用户,高并发的访问和海量的数据,任何简单......
  • MySQL笔记整理
    SELECT0+'123.00';SELECT0+'123.0qwe';SELECT0+'qwe1';SELECT0+null;SELECT'123.00'/4;SELECT'123.0qwe'/4;SELECT'qwe1'/4;SELECT'1qwe'/4;SELECTnull/4;SELECTconvert(......
  • iOS开发笔记 - Objective-C和JavaScript的混编
    最近看了一个对Github上面编程语言使用统计的排行榜,JavaScript真可以说是一枝独秀,很难想象20年前,这个语言只是浏览器中的装饰性语言,能做的事情也就是一点特效或者检查一下要提交给服务器的表单是否满足要求。今天的JavaScript已经是一个全栈语言,从客户端到服务器无所不在。很多编程......
  • iOS开发笔记 - 语言篇之Swift
     2014年的苹果全球开发者大会(WWDC),当CraigFederighi向全世界宣布“Wehavenewprogramminglanguage”(我们有了新的编程语言)的时候,全场响起了最热烈和持久的掌声,伴随着掌声到来的语言叫Swift。接下来CraigFederighi更是毫不掩饰的告诉大家,Swift将成为主宰iOS和Mac开发的新语言,甚......
  • 图论 学习笔记
    图的基本概念和数据结构圆圈表示节点线是边图是V和E的二元组无向图:边没有方向(边是双向的)有向图:边有方向无权图:所有边的权重都是1有权图:权重不同;在不同的应用里,权重的意义不同 没有的边记作0或者无穷大,具体看实际应用 基本原则是进行搜索的时候,使无法通过这条边数据结构......
  • 线性代数-二次型-坐标变换笔记
    原来的二次型\(f\left(x_{1},x_{2},x_{3}\right)\)经过坐标变换变成了\(g\left(y_{1},y_{2},y_{3}\right)\)这个新的二次型$x^{\mathrm{T}}Ax$经过坐标变换变成$y^{\mathrm{T}}By$原来的二次型矩阵\(A\)变成了\(B\)(也是实对称矩阵)\(A\)和\(B\)之间的之间的关......