首页 > 其他分享 >机器学习的正则化

机器学习的正则化

时间:2022-10-06 16:46:07浏览次数:34  
标签:机器 函数 模型 epoch 学习 正则 化项 神经元

什么是正则化?

正则化是在机器学习中防止过拟合,提高模型的泛化能力的一种技术,我们训练模型就是对目标函数求解,而目标函数就是误差函数(损失函数)加正则化项,正则化项当中的 λ 被称为正则化系数,越大,这个限制越强。需要值得注意的是,正则化往往用在线性函数上面,如线性回归、逻辑回归,SVM等,复杂的神经网络可能无法使用。

正则化如何限制模型能力?

线性模型:一般正则项到特殊

 

M是模型的阶次(表现形式是数据的维度),比如M=2,就是一个平面(二维)内的点,这里我们主要探究q的取值

当M=2时,即W={W1,W2};横坐标是1,纵坐标是W2,绿线是俯视图的其中一条等高线。而z轴(垂直于平面)的值就是正则化项的取值。

蓝色圆圈上的点就是我们寻找误差函数的过程,红色圈圈是是正则化项的表示,这两者组成的是我们的目标函数,也就是说考虑这两项使得目标函数最优。二次正则项(左图)的优势是处处可导,方便计算,且保留原始维度(特征);一次正则项(有图)可以降低维度,得到稀疏的权重矩阵,,但是不是处处可微的,计算有一些麻烦。

神经网络

early stopping

 Early stopping是一种迭代次数截断的方法来防止过拟合的方法,即在模型对训练数据集迭代收敛之前停止迭代来防止过拟合。

 具体做法:每个epoch(或每N个epoch)结束后,在验证集上获取测试结果,随着epoch的增加,如果在验证集上发现测试误差上升,则停止训练,将停止之后的权重作为网络的最终参数。

缺点:缺点显而易见,可能没训练到理想的误差值就停止了,不能做出很复杂的判断。

Dropout

Dropout 指的是在训练过程中每次按一定的概率(比如50%)随机地“删除”一部分隐藏单元(神经元),所谓删除就是将神经元的激活函数设为0,让其不起作用。

它消除或者减弱了神经元节点间的联合,降低了网络对单个神经元的依赖,从而增强了泛化能力。

 

参考链接:https://charlesliuyx.github.io/2017/10/03/%E3%80%90%E7%9B%B4%E8%A7%82%E8%AF%A6%E8%A7%A3%E3%80%91%E4%BB%80%E4%B9%88%E6%98%AF%E6%AD%A3%E5%88%99%E5%8C%96/#Why-amp-What-正则化

标签:机器,函数,模型,epoch,学习,正则,化项,神经元
From: https://www.cnblogs.com/HOI-Yzy/p/16743184.html

相关文章

  • c语言程序编程学习
    #define_CRT_SECURE_NO_WARNINGS1#include<stdio.h>//1.字面常量1234......//2.const修饰的常变量constintn=10n是变量,但是是常属性,所以n是常变量//3.#de......
  • 10月6日列表学习
    names=["张三","李四","王五","麻六"]names.append("赵二")#添加names.insert(0,"赵二")#指定插入names.reverse()#反转names.sort()#排序names2=[1,2,3,4]......
  • 干货 | 快速端到端嵌入学习用于视频中的目标分割
    公众号ID|ComputerVisionGzq学习群|扫码在主页获取加入方式暗中观察默默关注那我们开始进入今天的主题,接下来主要和大家分享目标在视频中的实时分割技术,来,一起学习吧!背景及动......
  • Java课堂学习总结
    对于Java字段的初始化来说,共有以下几种方法:1.类的构造函数(构造方法):当创建一个对象时,其构造函数就会自动调用。构造方法必须与类名相同,无返回值。如果程序员没有定义一......
  • 字符串,变量,常量,转义字符,学习笔记
    字符串:编程中表示文本的数据类型。所有用引号括起来的数据,都是字符串。在编程语言中,我们用字符串这种数据类型来表示和存储文本。在引号的内部,数据可以是英文、中文、数字......
  • Linux正则表达式 - 语法
    正则表达式- 语法摘自:https://www.runoob.com/regexp/regexp-syntax.html 正则表达式(regularexpression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是......
  • java学习笔记32
    面向对象(类与对象的创建)类与对象的关系类是一种抽象的数据类型,它是对某一类事物整体的描述/定义,但是并不能代表某一个具体的事物。动物植物手机电脑...person类,pet......
  • 三--4.正则表达式与正则集
    1.正则表达式与正则集 2.正则文法与正则式        ......
  • 学习总结
    本周总结1.列表2.字典3.集合4.元组5.分支结构和循环结构6.垃圾回收机制1.列表1.类型转换 list(其他数据类型) ps:能够被for循环的数据类型都可以转成列表 prin......
  • Linux笔记丨文件管理类常用命令学习笔记
    今天的笔记内容是:linux常用文件管理类基础命令file、cut、in、more、less、mktemp、mv、paste、split、read的学习笔记。Linux文件管理file命令识别文件的编码方式和......