L1和L2正则

L1和L2正则

时间：2022-12-02 17:06:29浏览次数：40

标签：L1 正则 L2 L0 权值范数

文章目录

正则化

L1正则
L2正则
区别
为什么
权值衰减

正则化

L1正则

L1正则化是所有参数的绝对值之和，这就要求所有参数的绝对值之和最小，求导，导数可能为1或-1，而绝对值的取值是大于等于0的，那么就可能导致某些参数在更新的时候趋于0

L2正则

L2正则化是所有参数平方和，导数为 $L1和L2正则_L1正则$ ，每个参数更新的量与参数 $L1和L2正则_L2正则_02$ 本身相关， $L1和L2正则_L2正则_02$ 在更新时，会逐渐变慢， $L1和L2正则_L2正则_02$ 逐渐变小趋于0，而不会变为0。

区别

L0和L1的区别：

L0范数是指向量中非0的元素的个数，如果我们用L0范数来规则化一个参数矩阵W的话，希望W的大部分元素都是0。
L0范数很难优化求解（NP问题）。
L1范数是L0范数的最优凸近似，而且它比L0范数更容易优化求解。L1范数和L0范数可以实现稀疏，L1因具有比L0范数更好的优化求解特性而广泛应用。

L1和L2的区别：

L1会趋向于产生少量的特征，而其他的特征都为0，L2会选择更多的特征，这些特征都趋于0。
使用L1可以得到稀疏的权值，用L2可以得到平滑的权值。

为什么

更小的权值 $L1和L2正则_L2正则_02$ ，表示网络的复杂度更低，对数据的拟合刚刚好（奥卡姆剃刀法则）。设想一个线性回归模型，如果参数很大，只要数据偏移一点点，就会对结果产生很大的影响；但如果参数足够小，数据偏移的多一点不会对结果造成什么影响，也就是抗扰动能力强。
过拟合的时候，拟合函数的系数往往非常大，因为拟合函数需要顾忌每一个点，最终形成的拟合函数波动很大。在某些很小的区间里，函数值的变化很剧烈，这就意味着函数在某些小区间里的导数值（绝对值）非常大，由于自变量可大可小，所以只有系数足够大，导数值才能很大。

权值衰减

L2正则又被称为权值衰减
当loss不包含正则项是：
$L1和L2正则_L1正则_06$
当使用L2正则时：
$L1和L2正则_L2正则_07$

其中， $L1和L2正则_正则_08$ ，所以具有权值衰减的作用。
在 PyTorch 中，L2 正则项是在优化器中 ( torch.optim ) 实现的，在构造优化器时可以传入 weight decay 参数，对应的是公式中的 $L1和L2正则_L2正则_09$ 。

深度学习如何防止过拟合weight decay 和 dropout

标签：L1,正则,L2,L0,权值,范数
From： https://blog.51cto.com/u_15899958/5907218

SAP MM 为UB类型的STO执行VL10B，报错-没有项目类别表存在（表T184L NL 0002 V)-之对策
SAPMM 为UB类型的STO执行VL10B，报错-没有项目类别表存在（表T184LNL0002V)-之对策业务人员创建好了UB类型的转储单据后，试图执行事务代码VL10B，未能成功，报错如下：......
Python高级-mini-web框架、添加log日志、路由支持正则-笔记
接着上一篇介绍mini-web框架《Python高级-mini-web框架、添加路由、MySQL功能-笔记》8.mini-web框架-路由支持正则importpymysqlimporttimeimportosimportret......
正则表达式
正则表达式正则表达式(regularexpression,RE)是一种字符模式，用于在查找过程中匹配指定的字符。在大多数程序里，正则表达式都被置于两个斜杠之间；例如/l[oO]ve/就是由......
收藏:关于正则表达式的的一些经验
匹配中文字符的正则表达式：[\u4e00-\u9fa5]评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^\x00-\xff]评......
牛客SQL163
思路:题目要求我们统计每篇文章的同一时刻最大在线人数,所以我们观察表结构,通过进入时间和离开时间我们知道一个用户什么时候在线,什么时候不在线也就是说一......
java-正则表达式
1.一般流程Patternp=Pattern.compile("a*b");Matcherm=p.matcher("aaaaab");booleanb=m.matches();或booleanb=Pattern.matches("a*b","aaaaab");booleanb......
buuoj [WUSTCTF2020]level1
1.nowin.exe64bit文件附带一个output.txt逻辑如上，输出在output文件里面储存编写脚本逆向操作就好了data=[0,198,232,816,200,1536,300,6144,984,51200,570,921......
fail2ban 防ssh爆破或攻击
目的：防止ssh爆破fail2ban> Fail2ban是一个根据系统日志动态调整防火墙规则的安全工具，它具有响应迅速、使用方便的特性。 0x00环境说明centos7.90x01安装yum ......
YL17系列接触电阻导通电阻四线毫欧电阻信号隔离转换器0-100mΩ/0-200mΩ/0-500mΩ/0-
特点四线测量法，内置高精度恒流源 1mS高速转换，转换精度0.5%以内工业级温度范围:-40 ~+85℃a 电源、信号：输入/输出3000VDC三隔离 5VDC，12VDC，15VDC，24VDC±10%单电......
使用正则替换文本文件内的一些无用字符
每次提取的心得列表，做成txt文本文件，然后需要放在np里面替换半天，所以写个脚本，自动替换吧importosimportredefreplacetext(search_text,replace_text):#以读写模式打......

文章目录

正则化

L1正则

L2正则

区别

为什么

权值衰减

相关文章

赞助商

阅读排行