Batch、Layer、Instance、Group四种Norm

时间：2024-04-02 23:55:06浏览次数：28

标签：Layer Group hw Batch batch 归一化 GroupNorm BatchNorm channel

归一化Normalization

BatchNorm 的初衷是解决 Internal Covariate Shift 问题。尽可能将 mini-batch 归一化到标准正态分布，使得网络层的输出分布趋于稳定。

Internal Covariate Shift 问题简单来说，是网络学习更新权重后可能会改变输出的分布，导致下一层总是迟一步适应这次的分布。后来的实验与探究证明，BatchNorm 并不能解决 ICS 问题。

在网络层之间引入归一化层，有以下优势：

缓解过拟合，起到正则化效果
改善梯度传递，避免梯度弥散和梯度爆炸，模型适应更大的学习率
避免像是 Sigmoid 这样的激活函数出现饱和问题

BatchNorm

若输入维度为 [batch, channel, hw]，BatchNorm 是在 [batch, hw] 维度进行归一化。换句话说，会进行 channel 次归一化。

推荐将 BatchNorm 层放在激活层之后。

带有 BatchNorm 层的网络训练受 batch_size 大小影响较大（例如 batch_size 过小时会严重影响网络训练效果）。接下来的 LayerNorm、InstanceNorm 和 GroupNorm 能够避免 batch 维度上的归一化，回避了这个问题。

LayerNorm

若输入维度为 [batch, channel, hw]，LayerNorm 是在 [channel, hw] 维度进行归一化。换句话说，会进行 batch 次归一化。

可见，不同于 BatchNorm，这里 LayerNorm 不受 batch 变化的影响。

InstanceNorm

InstanceNorm 仅在 hw 维度进行归一化。换句话说，会进行 batch * channel 次归一化。

GroupNorm

GroupNorm 会将 channel 划分为多个组。若输入维度为 [batch, channel, hw]，GroupNorm 可以说是将之视为 [batch, group, channel // group, hw]，然后在 [channel // group, hw] 维度进行归一化。

当 group=channel 时，GroupNorm 等价于 InstanceNorm；当 group=1 时，GroupNorm 等价于 LayerNorm。

GroupNorm 会进行 batch * group 次归一化。

总结

BatchNorm 很强大。但如果 batch_size 的影响过分恶劣（例如 batch_size 小于 8），使用 GroupNorm 值得一试。

LayerNorm 更适合 RNN 和 NLP 领域；BatchNorm 更适合计算机视觉。

参考来源

将为帅，“一文搞懂BatchNormalization,Layer/Instance/GroupNorm”，https://zhuanlan.zhihu.com/p/152232203
无双谱，“从0到1：批量规范化BatchNormalization(原理篇)”，https://zhuanlan.zhihu.com/p/52736691
DoubleV，“全面解读Group Normalization-（吴育昕-何恺明）”，https://zhuanlan.zhihu.com/p/35005794
Florian June，“BatchNorm and LayerNorm”，https://medium.com/@florian_algo/batchnorm-and-layernorm-2637f46a998b

标签：Layer,Group,hw,Batch,batch,归一化,GroupNorm,BatchNorm,channel
From： https://www.cnblogs.com/chirp/p/18111753

当你遇到layer.alert is not a function怎么办
下面我们来解决layer.alertisnotafunction的方法之一，下面来看一个GIS的例子，在登录之后，地图是加载出来的，当你点击区域定位是出现layer.alertisnotafunction。而我们的代码是没有bug，但是它还是报错。那是因为我们的url的地图出问题了，这是因为切图后的数据没有我们要的数......
Vue+OpenLayers7入门到实战：OpenLayers涂鸦手绘线条、圆形和多边形，涂鸦线条自动收尾连
返回《Vue+OpenLayers7》专栏目录：Vue+OpenLayers7入门到实战前言本章介绍如何使用OpenLayers7在地图上进行绘制图形的功能，上一章中《Vue+OpenLayers7入门到实战：OpenLayers图形绘制功能，OpenLayers实现在地图上绘制线段、圆形和多边形》我们已经讲过多种图形的绘制，本章主要......
2024-03-30：用go语言，集团里有 n 名员工，他们可以完成各种各样的工作创造利润，第 i 种工
2024-03-30：用go语言，集团里有n名员工，他们可以完成各种各样的工作创造利润，第i种工作会产生profit[i]的利润，它要求group[i]名成员共同参与，如果成员参与了其中一项工作，就不能参与另一项工作，工作的任何至少产生minProfit利润的子集称为盈利计划，并且工作的成员总数最多为......
SQL88 返回订单数量总和不小于100的所有订单的订单号(group()，having..)
selectorder_numfromOrderItemsgroupbyorder_numhavingsum(quantity)>=100orderbyorder_num;......
SQL95 从 Products 表中检索所有的产品名称以及对应的销售总数(sum() ，group by..)
selectprod_name,sum(quantity)asquant_soldfromProductsPinnerjoinOrderItemsOIonP.prod_id=OI.prod_idgroupbyprod_name;......
ios使用openlayer地图缩放时卡顿
问题描述h5项目使用openlayer展示地图，并且使用VectorLayer铺点，安卓完全没问题，但是ios上缩放后会突然触发无法缩放并且无法点击拖动缓慢等问题。经排查，是VectorLayer的minZoommaxZoom导致，但不理解原因。问题代码如下importVectorLayerfrom'ol/layer/Vector'vectorLayer......
cgroup、资源池、用户的关系..涉及到GaussDB(DWS)的资源设置
本文分享自华为云社区《GaussDB(DWS)的cgroup、资源池、用户的关系》，作者：nullptr_。1.前言本文主要展示了DWS中cgroup、资源池、用户之间的关系，从而对DWS的资源设置情况有个初步了解。2.相关对象创建脚本gs_ssh-c"gs_cgroup-cSClassN1-Gwn1"gs_ssh-c"gs_cgroup-......
java.sql.BatchUpdateException: Date truncation: Out of range value for column xx
报错:java.sql.BatchUpdateException:Datetruncation:Outofrangevalueforcolumnxxxxx原因:xxx列ddl中为stock_num(12,2)数据库值为0.06需要更新为：0.06-0.21就会出现该错误参考：https://www.jb51.net/article/158166.htmhttps://blog.csdn.net/stone_tomca......
【Unity】调整Player Settings的Resolution设置无效
【背景】Build时修改了PlayerSettings下的Resolution设置，但是再次Building时仍然不生效。【分析】明显是沿用了之前的分辨率设定，所以盲猜解决办法是Build相关的缓存文件，或者修改打包名称。【解决】实测修改版本号无效，必须修改productName才会使Resolution设置生效。......
ModuleNotFoundError: No module named ‘paddle.fluid.layers.utils‘关于paddle和pa
训练模型时候发现的问题：1.ValueError:PretrainedConfiginstancenotfoundinthearguments,youcansetitasargsorkwargswithconfigfield2:ModuleNotFoundError:Nomodulenamed‘paddle.fluid.layers.utils‘对于第一个问题的发生，我先是检查uie-base，但是没......