首页 > 其他分享 >L1和L2正则

L1和L2正则

时间:2022-12-02 17:06:29浏览次数:33  
标签:L1 正则 L2 L0 权值 范数


文章目录

  • ​​正则化​​
  • ​​L1正则​​
  • ​​L2正则​​
  • ​​区别​​
  • ​​为什么​​
  • ​​权值衰减​​

正则化

L1正则

L1正则化是所有参数的绝对值之和,这就要求所有参数的绝对值之和最小,求导,导数可能为1或-1,而绝对值的取值是大于等于0的,那么就可能导致某些参数在更新的时候趋于0

L2正则

L2正则化是所有参数平方和,导数为L1和L2正则_L1正则,每个参数更新的量与参数L1和L2正则_L2正则_02本身相关,L1和L2正则_L2正则_02在更新时,会逐渐变慢,L1和L2正则_L2正则_02逐渐变小趋于0,而不会变为0。

区别

L0和L1的区别:

  • L0范数是指向量中非0的元素的个数,如果我们用L0范数来规则化一个参数矩阵W的话,希望W的大部分元素都是0。
  • L0范数很难优化求解(NP问题)。
  • L1范数是L0范数的最优凸近似,而且它比L0范数更容易优化求解。L1范数和L0范数可以实现稀疏,L1因具有比L0范数更好的优化求解特性而广泛应用。

L1和L2的区别:

  • L1会趋向于产生少量的特征,而其他的特征都为0,L2会选择更多的特征,这些特征都趋于0。
  • 使用L1可以得到稀疏的权值,用L2可以得到平滑的权值

为什么

更小的权值L1和L2正则_L2正则_02,表示网络的复杂度更低,对数据的拟合刚刚好(奥卡姆剃刀法则)。设想一个线性回归模型,如果参数很大,只要数据偏移一点点,就会对结果产生很大的影响;但如果参数足够小,数据偏移的多一点不会对结果造成什么影响,也就是抗扰动能力强。
过拟合的时候,拟合函数的系数往往非常大,因为拟合函数需要顾忌每一个点,最终形成的拟合函数波动很大。在某些很小的区间里,函数值的变化很剧烈,这就意味着函数在某些小区间里的导数值(绝对值)非常大,由于自变量可大可小,所以只有系数足够大,导数值才能很大。

权值衰减

L2正则又被称为权值衰减
当loss不包含正则项是:
L1和L2正则_L1正则_06
当使用L2正则时:
L1和L2正则_L2正则_07

其中,L1和L2正则_正则_08,所以具有权值衰减的作用。
在 PyTorch 中,L2 正则项是在优化器中 ( torch.optim ) 实现的,在构造优化器时可以传入 weight decay 参数,对应的是公式中的L1和L2正则_L2正则_09

深度学习如何防止过拟合weight decay 和 dropout



标签:L1,正则,L2,L0,权值,范数
From: https://blog.51cto.com/u_15899958/5907218

相关文章

  • SAP MM 为UB类型的STO执行VL10B,报错-没有项目类别表存在(表T184L NL 0002 V)-之对策
    SAPMM 为UB类型的STO执行VL10B,报错-没有项目类别表存在(表T184LNL0002V)-之对策  业务人员创建好了UB类型的转储单据后,试图执行事务代码VL10B,未能成功,报错如下:......
  • Python高级-mini-web框架、添加log日志、路由支持正则-笔记
    接着上一篇介绍mini-web框架​​《Python高级-mini-web框架、添加路由、MySQL功能-笔记》​​​8.mini-web框架-路由支持正则importpymysqlimporttimeimportosimportret......
  • 正则表达式
    正则表达式 正则表达式(regularexpression,RE)是一种字符模式,用于在查找过程中匹配指定的字符。 在大多数程序里,正则表达式都被置于两个斜杠之间;例如/l[oO]ve/就是由......
  • 收藏:关于正则表达式的的一些经验
    匹配中文字符的正则表达式:[\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评......
  • 牛客SQL163
       思路:题目要求我们统计每篇文章的同一时刻最大在线人数,所以我们观察表结构,通过进入时间和离开时间我们知道一个用户什么时候在线,什么时候不在线也就是说一......
  • java-正则表达式
    1.一般流程Patternp=Pattern.compile("a*b");Matcherm=p.matcher("aaaaab");booleanb=m.matches();或booleanb=Pattern.matches("a*b","aaaaab");booleanb......
  • buuoj [WUSTCTF2020]level1
    1.nowin.exe64bit文件附带一个output.txt逻辑如上,输出在output文件里面储存编写脚本逆向操作就好了data=[0,198,232,816,200,1536,300,6144,984,51200,570,921......
  • fail2ban 防ssh爆破或攻击
    目的:防止ssh爆破fail2ban> Fail2ban是一个根据系统日志动态调整防火墙规则的安全工具,它具有响应迅速、使用方便的特性。  0x00环境说明centos7.90x01安装yum ......
  • YL17系列 接触电阻导通电阻四线毫欧电阻信号隔离转换器0-100mΩ/0-200mΩ/0-500mΩ/0-
    特点  四线测量法,内置高精度恒流源 1mS高速转换,转换精度0.5%以内 工业级温度范围:-40 ~+85℃a 电源、信号:输入/输出3000VDC三隔离 5VDC,12VDC,15VDC,24VDC±10%单电......
  • 使用正则替换文本文件内的一些无用字符
    每次提取的心得列表,做成txt文本文件,然后需要放在np里面替换半天,所以写个脚本,自动替换吧importosimportredefreplacetext(search_text,replace_text):#以读写模式打......