首页 > 其他分享 >机器学习笔记(二)

机器学习笔记(二)

时间:2022-10-24 21:36:49浏览次数:56  
标签:偏差 机器 错误率 曲线 笔记 学习 查全率 代价


机器学习笔记(二)

文章目录

调参

大多数学习算法都有些参数(parameter) 需要设定,参数配置不同,学得模型的性能往往有显著差别,这就是通常所说的”参数调节”或简称”调参” (parameter tuning)。

学习算法的很多参数是在实数范围内取值,因此,对每种参数取值都训练出模型来是不可行的。常用的做法是:对每个参数选定一个范围和步长λ,这样使得学习的过程变得可行。

最后需要注意的是:当选定好模型和调参完成后,我们需要使用初始的数据集D重新训练模型,即让最初划分出来用于评估的测试集也被模型学习,增强模型的学习效果。

以上就是调参的有关基本的内容。

性能度量

性能度量(performance measure)是衡量模型泛化能力的评价标准,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果。

最常见的性能度量

在回归任务中,即预测连续值的问题,最常用的性能度量是“均方误差”(mean squared error),很多的经典算法都是采用了MSE作为评价函数,如下所示:

机器学习笔记(二)_方差


在分类任务中,即预测离散值的问题,最常用的是错误率和精度,错误率是分类错误的样本数占样本总数的比例,精度则是分类正确的样本数占样本总数的比例,易知:错误率+精度=1。其中,错误率以及精度的表达式如下所示:

机器学习笔记(二)_深度学习_02

查准率/查全率/F1

错误率和精度虽然常用,但不能满足所有的需求,例如:在推荐系统中,我们只关心推送给用户的内容用户是否感兴趣(即查准率),或者说所有用户感兴趣的内容我们推送出来了多少(即查全率)。因此,使用查准/查全率更适合描述这类问题。对于二分类问题,分类结果混淆矩阵与查准/查全率定义如下:

机器学习笔记(二)_方差_03

正如天下没有免费的午餐,查准率和查全率是一对矛盾的度量。例如我们想让推送的内容尽可能用户全都感兴趣,那只能推送我们把握高的内容,这样就漏掉了一些用户感兴趣的内容,查全率就低了;如果想让用户感兴趣的内容都被推送,那只有将所有内容都推送上,宁可错杀一千,不可放过一个,这样查准率就很低了。

“P-R曲线”正是描述查准/查全率变化的曲线,P-R曲线定义如下:根据学习器的预测结果(一般为一个实值或概率)对测试样本进行排序,将最可能是“正例”的样本排在前面,最不可能是“正例”的排在后面,按此顺序逐个把样本作为“正例”进行预测,每次计算出当前的P值和R值,如下图所示:

机器学习笔记(二)_人工智能_04

P-R曲线如何评估呢?若一个学习器A的P-R曲线被另一个学习器B的P-R曲线完全包住,则称:B的性能优于A。若A和B的曲线发生了交叉,则谁的曲线下的面积大,谁的性能更优。但一般来说,曲线下的面积是很难进行估算的,所以衍生出了“平衡点”(Break-Event Point,简称BEP),即当P=R时的取值,平衡点的取值越高,性能更优。

ROC与AUC

ROC曲线与P-R曲线十分类似,都是按照排序的顺序逐一按照正例预测,不同的是ROC曲线以“真正例率”(True Positive Rate,简称TPR)为横轴,纵轴为“假正例率”(False Positive Rate,简称FPR),ROC偏重研究基于测试样本评估值的排序好坏。

如下面的两幅图片所示:

机器学习笔记(二)_机器学习_05

机器学习笔记(二)_机器学习_06

另外,AUC的表达式如下所示:

机器学习笔记(二)_深度学习_07

代价敏感错误率以及代价曲线

以二类为例,我们引入代价矩阵:

机器学习笔记(二)_深度学习_08

代价敏感错误率的表达式为:

机器学习笔记(二)_泛化_09

机器学习笔记(二)_泛化_10


同样对于ROC曲线,在非均等错误代价下,演变成了“代价曲线”,代价曲线横轴是取值在[0,1]之间的正例概率代价,式中p表示正例的概率,纵轴是取值为[0,1]的归一化代价。

机器学习笔记(二)_人工智能_11

机器学习笔记(二)_方差_12


代价曲线的绘制很简单:设ROC曲线上一点的坐标为(TPR,FPR) ,则可相应计算出FNR,然后在代价平面上绘制一条从(0,FPR) 到(1,FNR) 的线段,线段下的面积即表示了该条件下的期望总体代价;如此将ROC 曲线土的每个点转化为代价平面上的一条线段,然后取所有线段的下界,围成的面积即为在所有条件下学习器的期望总体代价,如图所示:

机器学习笔记(二)_机器学习_13

比较检验

假设检验

“假设”指的是对样本总体的分布或已知分布中某个参数值的一种猜想,例如:假设总体服从泊松分布,或假设正态总体的期望u=u0。回到本篇中,我们可以通过测试获得测试错误率,但直观上测试错误率和泛化错误率相差不会太远,因此可以通过测试错误率来推测泛化错误率的分布,这就是一种假设检验。

交叉检验t验证

机器学习笔记(二)_人工智能_14

McNemar检验

MaNemar主要用于二分类问题,与成对t检验一样也是用于比较两个学习器的性能大小。主要思想是:若两学习器的性能相同,则A预测正确B预测错误数应等于B预测错误A预测正确数,即e01=e10,且|e01-e10|服从N(1,e01+e10)分布。

机器学习笔记(二)_人工智能_15

因此,如下所示的变量服从自由度为1的卡方分布,即服从标准正态分布N(0,1)的随机变量的平方和,下式只有一个变量,故自由度为1,检验的方法同上:做出假设—>求出满足显著度的临界点—>给出拒绝域—>验证假设。

机器学习笔记(二)_方差_16

Friedman检验与Nemenyi后续检验

上述的三种检验都只能在一组数据集上,F检验则可以在多组数据集进行多个学习器性能的比较,基本思想是在同一组数据集上,根据测试结果(例:测试错误率)对学习器的性能进行排序,赋予序值1,2,3…,相同则平分序值,如下图所示:

机器学习笔记(二)_人工智能_17

若学习器的性能相同,则它们的平均序值应该相同,且第i个算法的平均序值ri服从正态分布N((k+1)/2,(k+1)(k-1)/12),则有:

机器学习笔记(二)_泛化_18

机器学习笔记(二)_深度学习_19

偏差与方差

偏差-方差分解是解释学习器泛化性能的重要工具。在学习算法中,偏差指的是预测的期望值与真实值的偏差,方差则是每一次预测值与预测值得期望之间的差均方。实际上,偏差体现了学习器预测的准确度,而方差体现了学习器预测的稳定性。通过对泛化误差的进行分解,可以得到:

  • 期望泛化误差=方差+偏差
  • 偏差刻画学习器的拟合能力
  • 方差体现学习器的稳定性

方差和偏差具有矛盾性,这就是常说的偏差-方差窘境(bias-variance dilamma),随着训练程度的提升,期望预测值与真实值之间的差异越来越小,即偏差越来越小,但是另一方面,随着训练程度加大,学习算法对数据集的波动越来越敏感,方差值越来越大。换句话说:在欠拟合时,偏差主导泛化误差,而训练到一定程度后,偏差越来越小,方差主导了泛化误差。

所以并不是训练的次数越多越好,应该在合适的时候适可而止的。

机器学习笔记(二)_机器学习_20

以上就是一些有关误差分析的有关内容,从下一篇文章开始,我们将开始讨论有关线性回归的问题,希望对大家有一定的帮助

谢谢大家的关注与支持了。


标签:偏差,机器,错误率,曲线,笔记,学习,查全率,代价
From: https://blog.51cto.com/u_15844361/5791299

相关文章

  • 【2022.10.24】Vue基础学习(1)
    内容概要1.前端发展介绍2.Vue的快速使用3.差值语法4.指令系统之文本指令5.指令系统之事件指令6.指令系统之属性指令内容详细1前端发展介绍#HTML(5)、CSS(......
  • day17.运动(下)+轮播图 .笔记
    链式动画就是动画执行完接另一个动画,不断的进行链接封装进阶(通过传入回调函数完成链式运动)//0.缓冲运动的封装//element表示元素,targetObj表示目标对象,ca......
  • CISAW风险管理学习笔记(3)-风险管理标准体系
    个人学习总结,CISAW学习笔记之风险管理标准体系:......
  • gozero学习之路
    go-zero开始学习go-zero咯https://github.com/Mikaelemmmm/go-zero-looklook环境配置https://github.com/Mikaelemmmm/go-zero-looklook/blob/main/deploy/script/genc......
  • Vue学习-01
    Vue入门零:前端目前形式前端的发展史HTML(5)、css(3)、JavaScript(ESS、ES6):编写一个个的页面——给后端(PHP、Python、Go、Java)——后端嵌入模板语法——后端渲染完数据——返......
  • MySQL 读书笔记(一)
    1MySQL表1.1索引组织表在InnoDB存储引擎中,表都是根据主键顺序存放的,这种存储方式称为索引组织表。InnoDB存储引擎中,每张MySQL表都有一个唯一主键,如果创建表时......
  • vue 笔记12 vue-router路由2 导航守卫
              Vue被创建,挂载,更新时调用函数。      网页标题                    登录......
  • Python学习记录(六):关键字
    打印Python语言的关键字,我们代码中的变量不能与内置的关键字相同>>>importkeyword>>>print(keyword.kwlist)['False','None','True','__peg_parser__','and','a......
  • 2022-2023-1 20221318 《计算机基础和程序设计》第九周学习总结
    作业信息这个作业属于那个班级https://edu.cnblogs.com/campus/besti/2022-2023-1-CFAP作业要求https://www.cnblogs.com/rocedu/p/9577842.html#WEEK09作业目标学习......
  • WebRTC源码学习02---webrtc源码编译安装(Mac)
    参考文献https://webrtc.org.cn/mirror/ (主要参考文章)https://www.an.rustfisher.com/webrtc/intro/sync-build/(参考一下代理设置)https://blog.csdn.net/dangwei_90/ar......