首页 > 其他分享 >正则化技术

正则化技术

时间:2023-02-05 12:13:16浏览次数:44  
标签:函数 模型 技术 损失 正则 L2 拟合

目录

参考:

2.3. 线性代数 — 动手学深度学习 2.0.0 documentation (d2l.ai)

4.5. 权重衰减 — 动手学深度学习 2.0.0 documentation (d2l.ai)

1.5 为什么正则化可以减少过拟合?-_吴恩达 deep learning -_bilibili

丢弃法 - 李沐_哔哩哔哩_bilibili


正则化技术用来防止过拟合,所谓过拟合即训练过程中,训练集上的误差持续减少,而与此同时测试集上的误差增大的现象。

防止过拟合的方法

  • 获取更多的数据
  • 选择更合适的网络模型
  • 正则化技术

L2正则化

亦称权重衰减(weight decay)

L2范数

image-20230205114001512

损失函数

未加正则项的损失函数

image-20230205114207063

加上正则项之后的损失函数

image-20230205114140471

为什么L2正则化能够起作用

直观理解

过拟合的原因是由于网络模型的学习能力太过强太,我们需要使用正则化技术来削弱这一能力。

通过在损失函数上加上正则项,若超参数λ设置成一个很大的值,在学习过程中即梯度下降的过程中会使得某些权重w近似于0,相当于在模型中删去了某些节点,简化了模型,进而防止过拟合

image-20230205115254414

Dropout

相当于一个正则项,在隐藏层中间加入噪声,提高模型鲁棒性,用来降低过拟合的。在前向传播过程中,前一个层计算并激活之后,进行一次dropout处理,以 p 的概率将输出置为0,具体公式如下

image-20230202092507141

此公式保证了h'的期望仍为h

image-20230202092721057

另一种理解:dropout的巧妙之处在于,相当于在一个模型的训练过程中,综合考虑了多个模型,对于每一个输入,都是不同的神经网络模型。

注意

  • 只在训练过程中使用
  • 应用在多层前馈神经网络隐藏层输出上(多层感知机)
  • 丢弃法将输出项随机置为0来控制模型复杂性
  • 丢弃概率p为控制模型复杂性的超参数

标签:函数,模型,技术,损失,正则,L2,拟合
From: https://www.cnblogs.com/dctwan/p/17093122.html

相关文章

  • 3.5正则表达式和EXCESS系统
    尾数部分使用正则表达式(按照特定的规则来表示数据的形式即为正则表达式,除小数外,字符串以及数据库等都有各自的正则表达式),可以将表现形式多样的浮点数统一为一种表现形式。......
  • grep中的正则表达式使用
    ◆语法如下图所示、grep的命令行参数非常之多,在此,我们主要介绍如下使用方式:grep[-eexpression][filename]-e指定正则表达式-i不区分大小写-n显示行号  简......
  • shell脚本——正则表达式
     LinuxShell脚本之正则表达式一、常见的管道命令sort命令sort命令可针对文本文件的内容,以行为单位来排序格式:sort [选项] 参数常用选项选项  ......
  • 虚拟化技术知道点230204
    一、桌面虚拟化技术的选择主要为Qemu-KVM、VirtualBox、Vmware1.Qemu-KVM:在Linux平台上使用且运行Linux虚拟机性能最好,并且灵活性很大,唯一不足是运行Windows虚拟机性能......
  • 《分布式技术原理与算法解析》学习笔记Day01
    开篇词|四纵四横,带你透彻理解分布式技术谁更好掌握了分布式技术,谁就更容易在新一轮技术浪潮中获得主动。很多有多年工作经验的人,在分布式上面,也可能会有下面的问题:各......
  • 正则表达式
    正则表达式正则表达式:对特殊的输入格式进行验证;应用matches方法匹配1、\d:匹配一位数字例:Scannerinput=newScanner(System.in);   System.out.println("请输......
  • 10min 0 元获得阿里云计算专项技术认证证书,抵扣个税应纳金额3600
    概述个人所得税里面包含一个叫“专项附加扣除”的项目,这个项目里有个“继续教育”,继续教育里的“职业资格继续教育”,提交证书相关信息,个税可以抵扣3600。考试基本上10分......
  • python基础:多层语法糖、有参装饰器、有参装饰器模板、装饰器修复技术、递归函数
    目录一、多层语法糖二、有参装饰器三、有参装饰器模板四、装饰器修复技术五、递归函数六、作业一、多层语法糖多层语法糖实际应用中出现较少,但是我们也需要了解相关的运......
  • 关于软件技术的一些笔记
    不同的角色:开发人员、运维团队、DevOps工程师开发团队和IT运维团队的技能要求和工作目标可能都不相同。开发人员希望给应用增加新功能,而运维团队的重点则是在应用发布......
  • IM开发者的零基础通信技术入门(十):零基础,史上最强5G技术扫盲
    本文引用了“鲜枣课堂”的《史上最强5G科普》文章内容。为了更好的内容呈现,在引用和收录时内容有改动,转载时请注明原文来源。1、内容概述➊5G技术的关注度越来越高:在此......