首页 > 其他分享 >L1、L2正则化是啥?

L1、L2正则化是啥?

时间:2024-08-24 11:54:47浏览次数:7  
标签:权重 特征选择 模型 化是 正则 L2 L1

L1正则化、L2正则化都是一种用于防止模型过拟合的技术,常用于机器学习和统计建模中。它们的主要区别在于对权重的惩罚方式不同。

L1正则化在损失函数中加入权重绝对值的和作为惩罚项,其数学表达式为:

其中,∣wi∣表示模型参数的绝对值。

L2正则化在损失函数中加入权重平方和作为惩罚项,其数学表达式为::

其中:
Original Loss是模型的原始损失(如均方误差);
wi​ 表示模型的参数(权重);
λ 是正则化参数,控制惩罚项的强度。

通过引入L2正则化,模型会倾向于学习较小的权重值,这样可以减少模型对训练数据的敏感性,从而提高模型在未知数据上的泛化能力

L2正则化的一个重要特性是它会使得权重趋向于零,但不会完全变为零,这与L1正则化(会导致某些权重变为零以实现特征选择)不同。

区别与联系

  1. 惩罚形式

    • L1正则化使用参数的绝对值,因此会傾向于使某些权重完全为零,这可以实现特征选择。
    • L2正则化使用参数的平方,因此更倾向于将权重值减小,但不会完全为零。
  2. 几何意义

    • 在损失函数的图形中,L1正则化的等高线呈菱形,而L2正则化的等高线呈圆形
    • L1正则化的边界能够更容易地与坐标轴相交,从而使得某些权重为零。
  3. 优化结果

    • L1正则化会导致参数稀疏化,适合于特征选择。
    • L2正则化则通常会产生更平滑的模型,更适合于多数特征的情况。

具体例子

假设我们要用线性回归模型来预测房价。假设我们有多个特征,例如房间数量、位置、面积和年龄等。使用这些特征时:

  • L1正则化:在训练过程中,L1正则化可能会将某些不重要特征(如房间数量)对应的权重推向零,从而使得模型只关注实际影响房价的特征(如位置和面积)。这种特性使得L1正则化特别适合于高维数据的情况,尤其是当你认为不所有的特征都是重要的时候。

  • L2正则化:与此相反,L2正则化会对所有特征施加惩罚,但不一定会将某些特征权重变为零。它可能会减小所有特征的影响力,但仍然保留它们的贡献。这对于模型的整体复杂性控制很重要,旨在确保模型尽量符合训练数据同时又避免对噪声的过度拟合。

总结来说,L1和L2正则化可以根据具体问题的需求进行选择,L1适用于需要特征选择的情况,而L2适用于一般的平滑建模

标签:权重,特征选择,模型,化是,正则,L2,L1
From: https://blog.csdn.net/weixin_65489379/article/details/141496252

相关文章

  • centos(linux): 安装管理fail2ban
    一,官网:https://www.fail2ban.org会跳转到代码站:https://github.com/fail2ban/fail2ban二,安装:用yum安装:[root@blog~]#yuminstallfail2ban安装后查看状态:未启动[root@blog~]#systemctlstatusfail2ban.service○fail2ban.service-Fail2BanServiceLo......
  • 哈工大-操作系统L26
    I/O与显示器一.设备的功工作cpu向外设的寄存器发送命令,cpu去执行其它命令,当外设完成之后向cpu发出中断,cpu处理中断,读取数据到内存二.文件视图直接向设备控制器的寄存器写,需要做活动操作,很麻烦open("/dev/xxx")打开不同设备对应的设备文件根据设备属性数据分......
  • P[ostgreSQL16在Windows下安装
    1.官网下载安装包并安装2.安装时遇到问题Problemrunningpost-installstep.Installationmaynotcompletecorrectlty.Thedatabaseclusterinitialisationfailed.解决方法:安装完成后管理员启动cmd,cd到pg的bin目录输入D:\PostgreSQL\bin>initdb.exe-DD:\database......
  • C++ wsl2 ubuntu 环境配置
    目前学习C++,配合Ubuntu进行开发,IDE使用Clion,这里记录一下环境准备WSL2C++一般是用在linux下,这里就用Ubuntu进行开发,考虑到window系统,这里准备用wsl2.虚拟化wsl2要系统支持虚拟化,一般在bios中进行处理,成功之后,任务管理器-->性能适用于Linux的Windows子系统wsl更新ws......
  • gutil140.dll:你的运行时环境体验守护者,被破坏后的自救指南
    gutil140.dll是一个与特定软件或服务相关的动态链接库(DLL)文件,通常与某些应用程序或服务的运行时环境相关。这个DLL文件可能包含了处理运行时环境、资源管理和与其他软件交互等功能所需的函数和资源,对于确保相关应用程序或服务的正常运行非常重要。当gutil140.dll文件被破坏......
  • 基于html2canvas实现网页保存为图片及图片清晰度优化
    一、实现HTML页面保存为图片1.1已知可行方案现有已知能够实现网页保存为图片的方案包括:方案1:将DOM改写为canvas,然后利用canvas的toDataURL方法实现将DOM输出为包含图片展示的dataURI方案2:使用html2canvas.js实现(可选搭配Canvas2Image.js实现网页保存为图片)方案3:使用raster......
  • OFtutorial10_transportEquation解析
    组成OFtutorial10.C源码头文件#include"fvCFD.H"主函数intmain(intargc,char*argv[]){头文件 //Setupthecase,parsecommandlineoptionsandcreatethegrid#include"setRootCase.H"#include"createTime.H"#inclu......
  • 介绍PPTP、L2TP、IPSec、IPS之间的区别
    随着互联网的发展,保护网络通信的安全越来越重要。PPTP、L2TP、IPSec、IPS是常见的网络安全协议和技术,在保护网络通信安全方面发挥着不同的作用和特点。下面介绍PPTP、L2TP、IPSec、IPS之间的区别。点对点隧道协议(PPTP)是一种用于在公共网络上建立虚拟专用网络(VPN)的通信协议。它......
  • L1-085 试试手气 分数 15
    //10'30"#include<bits/stdc++.h>usingnamespacestd;boolarr[10][10];intmain(){for(inti=1;i<=6;++i){inttmp;cin>>tmp;arr[i][tmp]=true;}intn;cin>>n;......
  • 基于v4l2框架应用层的摄像头梳理
    ------------恢复内容开始------------#1.官方的测试程序###代码路径media/v4l/capture.c点击查看代码/**V4L2videocaptureexample**Thisprogramcanbeusedanddistributedwithoutrestrictions.#**ThisprogramisprovidedwiththeV4L2A......