2.模型评估与选择

2.1 泛化能力

模型在未见样本上表现好
评价模型性能时，我们更希望他泛化能力强

2.2 过拟合和欠拟合

泛化误差：在未来样本上的误差
经验误差（训练误差）：在训练集上的误差
过拟合Overfitting：把不该学的学进去了
机器学习关键：怎样缓解Overfitting

2.3 三大问题

2.3.1 评估方法

在未来表现如何

留出法 Holdout

划分已有数据集=训练集+测试集

保持数据分布一致性（分层采样）
多次重复划分（误差取平均）
测试集大小适中
划分测试集进行评估完后要整个合起来再用测试得到较优的算法来训练
缺点：每次随即划分，可能有东西漏了

交叉验证法CV

k-折交叉验证法

自助法

基于“自主采样”bootstrap sampling
有放回采样，可重复采样
每次随机取一些，复制一次后放回。最终没摸到的作为测试集，“包外估计”

2.3.2 性能度量（刻画标准）

2.3.3 比较检验（模型在统计意义上表现好）

标签：周志华,误差,西瓜,泛化,笔记,采样,测试,拟合,2.3
From： https://www.cnblogs.com/CTing/p/18032725

Programming Abstractions in C阅读笔记：p293-p302
《ProgrammingAbstractionsinC》学习第73天，p293-p302总结，总计10页。一、技术总结1.时间复杂度(1)quadratictime(二次时间)p293,AlgorithmslikeselectionsortthatexhibitO(N^2)performancearesaidtoruninquadratictime。2.线性查找(linearsearch)p293,B......
《系统科学方法概论》第3章读书笔记
既然是信息方法，那就避免不了通信方式在古代时通信就成为了不可须臾离开的东西。那时候要从事各种社会活动，所以要交流。而如今现代通信理论深农信息论也创立起来了。它的发展包括现代通信技术进步的基本内容和正在形成中的广义信息论。既然这样，那么什么是信息和信息量呢？信息这个词......
Note - border 听课笔记
border是什么？记住了，border是可以吃的。好吃好吃。为什么这么......
《系统科学方法概论》第2章读书笔记
第2章介绍了什么是系统工程？系统工程就是以组织建立或者是经营管理某一系统为目的的工程。它具有复杂程度高。有一个目标体系具有定量化特征，最优化特征程序化特征，用范围广等优点。同时系统工程发展史也是很长的。虽然他是20世纪的产物，但他的基本思想却早在古代的一些工程实践中就已......
Java学习笔记（1）
常用DOS指令helloworld勾选文件扩展名创建.txt文件去掉.class后缀，运行java的执行原理组成跨平台使用IDEA创建项目之后直接编写代码使用Scanner接收输入数组静态初始化形式要注意数组的访问代码演示：publicclassMain{publicstaticvoidmain(......
《系统科学方法概论》第1章读书笔记
系统方法涉及到古代的跟现代的系统观念，它是经过很长时间的一段学习和进化产生到现在的现代系统概念。它包括活力论观点和机械论观点和还原论观点以及机体系统论观点。而我们也对系统进行了定义。系统就是指一定部分组成的具有一定层次和结构，并与环境发生关系的整体。系统的属性包......
《程序是怎样跑起来的》第11章读书笔记
第11章先提出了问题应用程序是否与硬件有关。操作系统还是为应用程序提供了间接访问硬件的方法，那就是使用系统调用在windows系统中系统调用也被称为API，每个AI都是一个能够被应用程序调用的函数，这些函数的本体位于dll文件中那么计算机主体上用于连接显示器键盘等外部设备的接口。这......
《程序是怎样跑起来的》第12章读书笔记
来到了这本书的最后一章。如何让计算机学习，那么什么是机器学习机器学习指的是让计算机这种机器来学习。在机器学习中程序员只编写用于学习的程序。这个程序的内容是让计算机读取大量的数据，然后学习这些数据的特征并生成一个识别模型这里模型指的是识别机制。机器学习也有很多方法......
《程序是怎样跑起来的》第10章读书笔记
第10章的标题是通过汇编语言认识程序的真面目。汇编语言和本机代码是一一对应的，即使是用汇编语言编写的原来码最终也必须转换成本机代码才能运行，用来完成这种转换的程序称为汇编器这个转换的过程称为汇编用汇编语言编写的源代码和本机代码是一一对应的因此我们也可以将本机代码反......
《程序是怎样跑起来的》第9章读书笔记
既然前面已经了解了计算机的基础，那么我们就要转移到我们平常使用的软件上了，而软件它又与应用程序有关那么就又联系到操作系统与应用程序的关系。有人开发了操作系统的原型，这是一种只具备加载和运行程序功能的监控系统。只要先开启监控系统就可以根据需要将各种程序加载到内存中并......

机器学习（周志华西瓜书）笔记

2.模型评估与选择

2.1 泛化能力

2.2 过拟合和欠拟合

2.3 三大问题

2.3.1 评估方法

留出法 Holdout

交叉验证法CV

自助法

2.3.2 性能度量（刻画标准）

2.3.3 比较检验（模型在统计意义上表现好）

相关文章

赞助商

阅读排行

机器学习 （周志华西瓜书）笔记

2.模型评估与选择

2.1 泛化能力

2.2 过拟合和欠拟合

2.3 三大问题

2.3.1 评估方法

留出法 Holdout

交叉验证法CV

自助法

2.3.2 性能度量（刻画标准）

2.3.3 比较检验（模型在统计意义上表现好）

相关文章

赞助商

阅读排行

机器学习（周志华西瓜书）笔记