首页 > 其他分享 >ResNet论文精读

ResNet论文精读

时间:2024-10-17 13:17:07浏览次数:9  
标签:精读 卷积 梯度 论文 ResNet 残差 152 网络

ResNet是一种深度卷积神经网络架构,由微Kaiming He等人于2015年提出。ResNet的核心在于引入了残差学习的概念,通过构建残差块来解决深度神经网络训练中的梯度消失和梯度爆炸问题,从而使得训练非常深的网络成为可能。
z
左图为普通结构,右图是ResNet的基础架构–残差块,在残差块中,输入可通过跨层数据线路更快地向前传播。

1. 残差学习(Residual Learning)

提出的背景:在传统的深度神经网络中,每一层的输出是直接通过非线性变换(如ReLU激活函数)得到的。然而,随着网络深度的增加,梯度在反向传播过程中可能会逐渐消失或爆炸,导致训练困难。

残差块:ResNet通过引入残差块来解决这个问题。残差块的基本思想是,假设我们希望学习到的映射是 (H(x)),那么我们可以通过学习残差映射 (F(x) = H(x) - x) 来实现。这样,网络的输出可以表示为:
[ H(x) = F(x) + x ]

2. 残差块(Residual Block)

残差块是ResNet的基本构建模块。一个典型的残差块包含以下几个部分:

  • 输入: x x x
  • 卷积层:通常是两个或三个卷积层,每个卷积层后面跟随批量归一化(Batch Normalization)和ReLU激活函数。
  • 跳跃连接(Shortcut Connection):直接将输入 x x x 加到卷积层的输出上。

残差块的数学表达式为:
[ y = F ( x , { W i } ) + x y = F(x, \{W_i\}) + x y=F(x,{Wi​})+x ]
其中, F ( x , { W i } F(x, \{W_i\} F(x,{Wi​} 表示卷积层的输出, W i W_i Wi​是卷积层的权重。
在这里插入图片描述

上图为具体的网络设计

3. ResNet架构

ResNet的架构通常由多个残差块堆叠而成。根据网络的深度,ResNet有不同的变体,如ResNet-18、ResNet-34、ResNet-50、ResNet-101和ResNet-152等。

  • ResNet-18和ResNet-34:使用基本的残差块,每个残差块包含两个3x3的卷积层。
  • ResNet-50、ResNet-101和ResNet-152:使用瓶颈结构(Bottleneck Structure),每个残差块包含三个卷积层:1x1、3x3和1x1的卷积层。1x1的卷积层用于减少和恢复通道数,从而减少计算量。

4. 优势

  • 解决梯度消失问题:通过跳跃连接,梯度可以直接通过残差块传播,减少了梯度消失的风险。
    主要原因如下:
    • 跳跃连接(Shortcut Connection):残差块中的跳跃连接允许梯度直接通过残差块传播,而不需要经过多个非线性变换层。这使得梯度能够更容易地反向传播到网络的早期层,从而减少了梯度消失的风险
    • 梯度直接传播:在传统的深度网络中,梯度需要经过多个非线性层的链式求导,容易导致梯度逐渐变小或变大。而残差块中的跳跃连接使得梯度可以直接通过残差块,避免了梯度在传播过程中的衰减或爆炸。
  • 训练更深的网络:ResNet使得训练非常深的网络成为可能,例如ResNet-152有152层,但仍然可以有效地训练。原因如下:
    • 残差映射:通过学习残差映射 ( F(x) = H(x) - x ),网络可以更容易地学习到恒等映射(Identity Mapping),即 ( F(x) approx0 )。这使得网络在训练过程中更容易收敛,即使网络非常深。

    • 恒等映射的稳定性:恒等映射使得网络在训练过程中保持稳定,不会因为网络深度的增加而导致性能下降。这使得训练非常深的网络成为可能,例如ResNet-152有152层,但仍然可以有效地训练。

  • 提高模型性能:ResNet在多个图像分类任务上取得了显著的性能提升,例如在ImageNet数据集上,ResNet-152达到了当时的最佳性能。

总结

ResNet通过引入残差学习和残差块,成功解决了深度神经网络训练中的梯度消失和梯度爆炸问题,使得训练非常深的网络成为可能。其架构设计简洁有效,在多个图像分类任务上取得了显著的性能提升,成为深度学习领域的一个重要里程碑。

标签:精读,卷积,梯度,论文,ResNet,残差,152,网络
From: https://blog.csdn.net/a13478107907/article/details/142994449

相关文章

  • 基于Node.js+vue钢材销售平台(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景关于钢材销售平台的研究,现有研究主要以传统销售模式为主,对于利用现代信息技术构建专门的钢材销售平台的研究较少。在国内外,传统钢材销售面临着流程繁琐......
  • 基于Node.js+vue个人理财微服务系统(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景关于个人理财微服务系统的研究,现有研究主要集中在传统理财系统的整体架构和功能实现上。在国内外,传统理财系统已经有了较为成熟的开发模式和功能模块,但......
  • 基于Node.js+vue短视频推荐系统(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景随着互联网的迅速发展,短视频行业蓬勃兴起。关于短视频推荐的研究,现有研究主要以用户行为分析和通用推荐算法为主 1。专门针对短视频这一特殊媒体形式,结......
  • 基于Node.js+vue高中生心理健康管理系统(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容选题背景高中生心理健康问题一直是教育领域和社会关注的焦点。随着社会竞争的加剧和学业压力的增大,高中生面临的心理压力也日益增加。近年来,国内外关于高中生心理健......
  • 基于Node.js+vue辅导员职责信息管理系统(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容选题背景辅导员职责信息管理系统的设计与开发,旨在提高辅导员工作效率,优化学生管理流程。当前,关于辅导员职责信息管理的研究主要集中在辅导员工作流程的优化、学生信......
  • 【最新】1000个计算机毕业设计项目推荐(源码+数据库+论文)
     一、计算机毕业设计项目推荐(源码+论文+PPT)需要链接请私信我哦!或者在评论区打出来!2024年最新计算机毕业设计,本科,项目汇总!哈喽,大家好,大四的同学马上要开始做毕业设计了,大家做好准备了吗? 博主给大家详细整理了计算机毕业设计最新项目,对项目有任何疑问,都可以问博主哦!下面......
  • 论文精读:多源域自适应目标检测中的目标相关知识保存(CVPR2022)
    原文标题:Target-RelevantKnowledgePreservationforMulti-SourceDomainAdaptiveObjectDetection中文标题:多源域自适应目标检测中的目标相关知识保存论文地址:https://arxiv.org/pdf/2204.07964代码地址:无官方实现?我有点纳闷难道顶会不公布代码的吗这篇文章是由北......
  • 【开题报告】基于django+vue汽车维修服务系统(论文+源码)计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着汽车工业的快速发展和私家车保有量的急剧增加,汽车维修服务需求日益旺盛。传统的汽车维修服务模式存在信息不对称、服务流程繁琐、客户......
  • 大模型(LLM)最新研究论文介绍(合集)
    目录\1.CTRLA:通过探针引导控制的自适应检索增强生成\2.压缩大型语言模型:使用低秩和低精度分解方法\3.通过LLM知识转移增强零样本面部表情识别\4.大型语言模型(LLMs):部署、代币经济学与可持续性\5.审视大型语言模型提示策略以自动评估学习者创建的计算成果———......
  • Java毕业设计-基于SSM框架的剧本杀预约系统项目实战(附源码+论文)
    大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。......