首页 > 其他分享 >如何减少过拟合?

如何减少过拟合?

时间:2023-04-29 10:55:30浏览次数:40  
标签:拟合 如何 正则 L2 L0 L1 范数 减少

过拟合

即过度拟合train集分布,泛化能力差

解决方案

  • 正则化

    • L0,L1,L2

    • dropout

    • early stop

  • 数据增强

正则化

正则化是一类通过限制模型复杂度,从而避免过拟合,提高泛化能力的方法,包括引入一些约束规则,增加先验、提前停止等。

L0,L1,L2正则化

指给目标函数增加关于模型权重的L0,L1,L2范数,来约束模型的复杂程度

  • L0范数:向量中的非零个数

    • 难以优化,通常不用
  • L1范数:向量中各元素绝对值之和

    • L1正则化: $Costfuncation=Loss+\lambda\sum \left | w \right | $
  • L2范数:向量中各元素平方之和

    • L2正则化: \(Costfuncation=Loss+\lambda\sum \left \| w \right \|^2\)

下图可视化可以发现:

  • L1正则化更倾向于让一些维度的参数减少到0,适用于模型压缩

  • L2正则化更倾向于让参数整体更小,更通用

image

Dropout

在训练阶段动态的让一些节点失效

  • 避免节点之间学到复杂的耦合关系

  • 也相当于将一个网络变成多个网络的累加

early stop

在验证集上的loss开始上升时就停止训练,通常会指定patience,还可以忽略一定阈值内的loss的波动

数据增强(Data Augmentation)

扩充现有数据,提升泛化能力

关于nlp任务中的数据增强方式,具体请看nlp中的数据增强方法

标签:拟合,如何,正则,L2,L0,L1,范数,减少
From: https://www.cnblogs.com/shiiiilong/p/17363689.html

相关文章

  • 【数据挖掘&机器学习】招聘网站的职位招聘数据的分位数图、分位数-分位数图以及散点图
    一.本次需求背景本文主题:招聘网站的职位招聘数据的分位数图、分位数-分位数图以及散点图、使用线性回归算法拟合散点图处理详解之前的文章我们已经对爬取的数据做了清洗处理,然后又对其数据做了一个薪资数据的倾斜情况以及盒图离群点的探究。我们这次的需求是:使用散点图、使用......
  • 如何搭建表白墙网站(LoveWall),Linux搭建网站教程
    用宝塔面板和开源表白墙程序LoveWall搭建一个表白墙网站。LoveWall是一个基于Thinkphp开发的表白墙。特色功能点赞发评论发弹幕多校区分享页涉证、涉H、暴力、违禁物等名词进行检测waitUpdate。下面是搭建教程:一、注册域名域名就是你的网站的网址,比如:blog.zeruns.tech就是我......
  • ML-误差、偏差、过拟合、正则化
    机器学习在损失函数中加入正则项,称为Regularize正则化。目的是防止过拟合。原理是:加上限制后,缩小了解空间,从而减少过拟合的可能性。L0范数表示向量中非零元素个数,但L0范数的求解是个NP-Hard问题;L1范数也可以实现稀疏,而且更容易求解。L2范数不如L1范数更能够降低复杂度,但是处处可......
  • ETL数据仓测试如何测试
     在我们了解ETL测试之前,先了解有关商业智能和数据仓库的重要性。让我们开始吧-什么是BI?商业智能是收集原始数据或业务数据并将其转化为有用和更有意义的信息的过程。原始数据是一个组织每日事务的记录,如与客户的互动,财务管理和员工管理等。这些数据将用于“报告,分析,数据挖掘,......
  • 如何自定义starter
    背景使用过SpringBoot的小伙伴都应该知道,一个SpringBoot项目就是由一个一个starter组成的,一个starter代表该项目的SpringBoot启动依赖,除了官方已有的starter,我们可以根据自己的需要自定义新的starter。我们经常会看到或者使用到各种***-starter。比如下面几种:spring-boo......
  • 汇编_如何暂存数据
    由双重循环引发的思考内存中定义了二维字符串数组,使用双重循环完成字符遍历。由于loop指令只认cx寄存器,在循环的过程中为了避免cx值被覆写,需要在内层循环前,将外层循环的cx值暂存起来。使用寄存器完成大小写转换assumecs:codesg,ds:datasgdatasgsegmentdb'ibm......
  • 如何避免跨越红线?——安全管理的重要性
    在现代社会中,安全管理已经成为了一个非常重要的话题。尤其是在一些危险行业中,如建筑、化工等领域,安全管理更是至关重要。然而,很多人并不知道如何有效地避免跨越红线,从而导致了许多不必要的安全事故。因此,如何避免跨越红线成为了每个人都应该关注的问题。首先,要明确什么是“红线”。......
  • Eclipse中如何修改SVN的地址
    Eclipse中如何修改SVN的地址在工作环境调整时,有的时候SVN服务器的地址需要修改,而正在开发中的项目在Eclipse中有些代码没有提交,此时怎么修改SVN的地址呢?以下有一个简单的办法:一、在Eclipse中选择Windows->ShowView->others就会出现如图:选中SVN资源库,会出现如下图所示的画面然后......
  • 小鹅通视频课件课程下载工具,如何在电脑端下载小鹅通频课件PDF,PPT到本地
    一.安装小鹅通下载器1.获取学无止下载器https://www.xuewuzhi.cn/xiaoetech_downloader2.下载安装后,然后点击桌面快捷方式运行即可。注意:杀毒软件可能会阻止外部exe文件运行,并将其当做成病毒,直接添加信任即可,本软件绝对没有木马病毒。二.使用说明1.学无止下载器介绍学无......
  • Vue项目如何配置、切换主题颜色(mixin + scss方式,简单高效)
    Action一.首先,引入scss依赖(node-sass,sass-loader)npminstallnode-sasssass-loader--save-dev1二.项目样式文件目录介绍1.此处我将项目中的公共样式文件放到了src/style目录下,其中index.scss是以供全局使用的一些基本样式,在main.js文件中引入即可全局使用(图2)。_theme.scs......