首页 > 其他分享 >CNN trick

CNN trick

时间:2022-10-17 16:55:29浏览次数:51  
标签:domain 梯度 BN trick 一致 CNN activation

目录

1.BN

  • 1、Why
    克服深度神经网络难以训练的弊病
    从细的说是为了解决“Internal Covariate Shift”问题,统计机器学习中的一个经典假设是“源空间(source domain)和目标空间(target domain)的数据分布(distribution)是一致的”。如果不一致,那么就出现了新的机器学习问题,如,transfer learning/domain adaptation等。而covariate shift就是分布不一致假设之下的一个分支问题,它是指源空间和目标空间的条件概率是一致的,但是其边缘概率不同,神经网络的各层输出,由于它们经过了层内操作作用,其分布显然与各层对应的输入信号分布不同,而且差异会随着网络深度增大而增大,可是它们所能“指示”的样本标记(label)仍然是不变的,这便符合了covariate shift的定义;由于是对层间信号的分析,也即是“internal”的来由,解决“Internal Covariate Shift”办法就是ICS的实现方式,即通过mini-batch来规范化某些层/所有层的输入,从而可以固定每层输入信号的均值与方差。
    说到底BN是为了防止“梯度弥散”。关于梯度弥散,大家都知道一个简单的栗子:0.930≈0.040.9^{30}\approx 0.040.9^{30}\approx 0.04。在BN中,是通过将activation规范为均值和方差一致的手段使得原本会减小的activation的scale变大
  • 2、Where to use
    遇到收敛速度很慢,或梯度爆炸等无法训练的状况时可以尝试BN来解决。另外,在一般使用情况下也可以加入BN来加快训练速度,提高模型精度
    BN可以应用于网络中任意的activation set。文中还特别指出在CNN中,BN应作用在非线性映射前,即对做规范化

标签:domain,梯度,BN,trick,一致,CNN,activation
From: https://www.cnblogs.com/pyclq/p/16799782.html

相关文章

  • 使用Mask R-CNN模型实现人体关键节点标注
    摘要:在本案例中,我们将展示如何对基础的MaskR-CNN进行扩展,完成人体关键节点标注的任务。本文分享自华为云社区《使用MaskR-CNN模型实现人体关键节点标注》,作者:运气男孩......
  • 后CNN探索,如何用RNN进行图像分类
    摘要:RNN可以用于描述时间上连续状态的输出,有记忆功能,能处理时间序列的能力,让我惊叹。本文分享自华为云社区《用RNN进行图像分类——CNN之后的探索》,作者:Yin-Manny。一、......
  • 后CNN探索,如何用RNN进行图像分类
    摘要:RNN可以用于描述时间上连续状态的输出,有记忆功能,能处理时间序列的能力,让我惊叹。本文分享自华为云社区《​​用RNN进行图像分类——CNN之后的探索​​》,作者:Yin-Manny......
  • 【每周CV论文推荐】 初学高效率CNN模型设计应该读的文章
    欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。高效率(紧凑)的CNN模型设计是......
  • MNA-CNN: 如何在美学质量评估中储存照片原始信息
    传统基于深度学习的图片美学评估的要求输入是fixed-size,待评估的照片经常会经过裁剪、缩放和充填等变换,造成图片质量的下降。那如何可以实现对原始图片尺寸进行美学质量评估......
  • 【项目实战课】基于Pytorch的MTCNN与Centerloss人脸识别实战
    欢迎大家来到我们的项目实战课,本期内容是《基于Pytorch的MTCNN与Centerloss人脸识别实战》。所谓项目实战课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主......
  • 猫狗识别-CNN与VGG实现
    本次项目首先使用CNN卷积神经网络模型进行训练,最终训练效果不太理想,出现了过拟合的情况。准确率达到0.72,loss达到0.54。使用预训练的VGG模型后,在测试集上准确率达到0.91,取......
  • 稀疏RCNN:稀疏框架,端到端的目标检测(附源码)
    计算机视觉研究院专栏作者:Edison_GSparseR-CNN抛弃了anchorboxes或者referencepoint等dense概念,直接从asparsesetoflearnableproposals出发,没有NMS后处理,整个网络异......
  • 关于贪心策略的一些小trick
    为什么要写这种如此简单的东西呢就是因为菜啊首先给出关于贪心的三个定义符合贪心选择的特性(GreedyChoiceProperty)我们需要证明我们的第一个选择(贪心选择GreedyCho......
  • 医学影像人工智能实战(四):图像预处理的tricks
    1.空洞填充参考python-opencv去除小面积区域/孔洞填充(二值图像)2.根据连通区域去除假阳性参考深度学习,分割后处理之通过连通成分分析去除假阳性区域,提高分割准确度3.......