L2正则化

亦称权重衰减（weight decay）

L2范数

损失函数

未加正则项的损失函数

加上正则项之后的损失函数

为什么L2正则化能够起作用

直观理解

过拟合的原因是由于网络模型的学习能力太过强太，我们需要使用正则化技术来削弱这一能力。

通过在损失函数上加上正则项，若超参数λ设置成一个很大的值，在学习过程中即梯度下降的过程中会使得某些权重w近似于0，相当于在模型中删去了某些节点，简化了模型，进而防止过拟合

Dropout

相当于一个正则项，在隐藏层中间加入噪声，提高模型鲁棒性，用来降低过拟合的。在前向传播过程中，前一个层计算并激活之后，进行一次dropout处理，以 p 的概率将输出置为0，具体公式如下

此公式保证了h'的期望仍为h

另一种理解：dropout的巧妙之处在于，相当于在一个模型的训练过程中，综合考虑了多个模型，对于每一个输入，都是不同的神经网络模型。

注意

只在训练过程中使用
应用在多层前馈神经网络隐藏层输出上（多层感知机）
丢弃法将输出项随机置为0来控制模型复杂性
丢弃概率p为控制模型复杂性的超参数

标签：函数,模型,技术,损失,正则,L2,拟合
From： https://www.cnblogs.com/dctwan/p/17093122.html

3.5正则表达式和EXCESS系统
尾数部分使用正则表达式（按照特定的规则来表示数据的形式即为正则表达式，除小数外，字符串以及数据库等都有各自的正则表达式），可以将表现形式多样的浮点数统一为一种表现形式。......
grep中的正则表达式使用
◆语法如下图所示、grep的命令行参数非常之多,在此,我们主要介绍如下使用方式:grep[-eexpression][filename]-e指定正则表达式-i不区分大小写-n显示行号简......
shell脚本——正则表达式
LinuxShell脚本之正则表达式一、常见的管道命令sort命令sort命令可针对文本文件的内容，以行为单位来排序格式：sort [选项] 参数常用选项选项 ......
虚拟化技术知道点230204
一、桌面虚拟化技术的选择主要为Qemu-KVM、VirtualBox、Vmware1.Qemu-KVM：在Linux平台上使用且运行Linux虚拟机性能最好，并且灵活性很大，唯一不足是运行Windows虚拟机性能......
《分布式技术原理与算法解析》学习笔记Day01
开篇词|四纵四横，带你透彻理解分布式技术谁更好掌握了分布式技术，谁就更容易在新一轮技术浪潮中获得主动。很多有多年工作经验的人，在分布式上面，也可能会有下面的问题：各......
正则表达式
正则表达式正则表达式：对特殊的输入格式进行验证；应用matches方法匹配1、\d：匹配一位数字例：Scannerinput=newScanner(System.in); System.out.println("请输......
10min 0 元获得阿里云计算专项技术认证证书，抵扣个税应纳金额3600
概述个人所得税里面包含一个叫“专项附加扣除”的项目，这个项目里有个“继续教育”，继续教育里的“职业资格继续教育”，提交证书相关信息，个税可以抵扣3600。考试基本上10分......
python基础：多层语法糖、有参装饰器、有参装饰器模板、装饰器修复技术、递归函数
目录一、多层语法糖二、有参装饰器三、有参装饰器模板四、装饰器修复技术五、递归函数六、作业一、多层语法糖多层语法糖实际应用中出现较少，但是我们也需要了解相关的运......
关于软件技术的一些笔记
不同的角色：开发人员、运维团队、DevOps工程师开发团队和IT运维团队的技能要求和工作目标可能都不相同。开发人员希望给应用增加新功能，而运维团队的重点则是在应用发布......
IM开发者的零基础通信技术入门(十)：零基础，史上最强5G技术扫盲
本文引用了“鲜枣课堂”的《史上最强5G科普》文章内容。为了更好的内容呈现，在引用和收录时内容有改动，转载时请注明原文来源。1、内容概述➊5G技术的关注度越来越高：在此......

正则化技术

L2正则化

L2范数

损失函数

为什么L2正则化能够起作用

Dropout

相关文章

赞助商

阅读排行