机器学习（三）

机器学习（三）

时间：2022-09-04 09:23:05浏览次数：53

过度拟合

第一个拟合没有很好的拟合训练集，到后面，随着房子面积的增大，它的价格却逐渐趋于平缓，把这个问题称为欠拟合或者称为这个算法具有高偏差

第二个拟合二次函数拟合数据集

第三个拟合是一种极端情况，如果我们拟合一个四阶多项式，我们有五个参数，我们可以拟合这样的一条曲线，他每一个样本点都可以通过，但是一条扭曲的曲线，一直在上下不停的波动，不认为是一个很好的模型，这样的叫做过度拟合或者说这样的算法具有高方差，过度拟合的问题只会在变量过多的时候出现，训练出的假设可以很好地拟合训练集，代价函数可能很接近或者就是0，因为过度拟合而导致无法泛化到新的样本中

过拟合发生时问题的解决

如果有过多的变量，只有非常少的训练数据，就会出现过度拟合的问题，有两个办法解决问题，

第一个方法是减少选取变量的数量，

　　人工检查变量清单，决定保留的变量；

　　2是模型选择算法，可以自动选择哪些特征变量保留，哪些舍弃

第二个方法是进行正则化

　　保留所有的特征变量，但是减少量级或者减少参数的大小。如果我们的参数值较小，意味着一个更简单的假设模型，在具有大量特征向量的例子中，我们不知道该缩小哪些向量，也不知道哪些向量的关联性较大，我们做的就是对代价函数进行修改，来缩小所有的代价函数，在式子的最后加一个额外的正则化项，来缩小每个参数的值，而且这个额外的正则化项是从1开始不给参数0增加惩罚项

λ被称为正则化参数，控制两个不同目标之间的取舍，如果正则化参数设置的过大，对θ的惩罚程度太大，最后只会剩下一个θ0不会趋近于0，相当于用一条直线去拟合，这就是欠拟合。

将梯度下降法和基于正规方程的算法推广到正则化线性回归中去

　　　　　　　　　　　　　　　　　　　　　　　　　　　之前在没有正则化的条件下去最小化最初的代价函数

对正则化的代价函数J（θ）进行梯度下降法的最小化（实际上是一个对增加了正则项的代价函数的一个偏导）

1-α*（λ/m）通常是一个比1略小的数，把θj变小了一点点，而第二项和之前没有加上正则项的梯度下降法是一样的

第二种方法时使用正规方程来解决

x的每一行都代表一个单独的训练样本，y包含了训练集里的所有标签

这个没有正则化项的θ的式子，算出来的θ可以使代价函数J最小化

θ=（X^TX）^(-1)X^Ty

使用正则化来得到加入正则项的最小值，如下图所示

样本总数小于特征的数量n，那么这个x的转置乘x的矩阵是不可逆的，但是只要这个λ>0,我们就可以确信这个X^TX+λ[ ]的矩阵是可逆的

改进两种算法，使其可以应用到正则化逻辑回归中切

与之前的正则化线性回归的梯度下降法是不一样的算法，因为这里的h（x）是不同的，假设模型是不一样的

这里是正则化逻辑回归的梯度下降法

标签：机器,函数,算法,学习,正则,拟合,代价,变量
From： https://www.cnblogs.com/xxsadd/p/16654252.html

学习笔记1
第1章引言一.知识点归纳1.Unix的历史Unix是一种通用操作系统。该系统诞生于20世纪70年代早期，由肯·汤普森和丹尼斯·里奇采用贝尔实验室的PDP-11微型计算机开发。1975......
vue项目结构学习
{path:'/core/integral-grade',component:Layout,/**父级路由组件*/redirect:"/core/intergral-grade/list",//默认跳转的路径name:"cor......
为机器学习项目设定和衡量目标
为机器学习项目设定和衡量目标这篇文章涵盖了我们生产中的机器学习课程的“目标和成功措施”讲座的一些内容。其他章节见表中的内容.由于高度重视机器学习，许多项目专......
双向长短期记忆模型如何工作（深度学习）
双向长短期记忆模型如何工作（深度学习）Photoby弗雷迪·雅各布on不飞溅使用改进的双向长短期记忆神经网络(arXiv)检测恶意请求作者：WenhaoLi,BinchengZhan......
2：变量的学习
C语言变量的学习2-1C语言核心心法面向过程语言从上到下依次执行2-2变量是玩会的不是学会的变量；一直不断变化的量叫做变量常量：一旦说明了，就不会改变了......
学习 Go，一段旅程：标准库包和并发 #5
学习Go，一段旅程：标准库包和并发#5大家好！很高兴再次见到你，我希望你做得很好。在本文中，我想分享我在学习Go编程语言方面的进展。本周，我了解了标准库包和并发。标准库包......
机器学习基本问答。
机器学习基本问答。您如何定义机器学习？答。ML是关于构建可以从数据中学习的系统。学习意味着在某些任务上做得更好，给定一些绩效衡量标准。**什么是有标签的训练集......
《具体数学》第五章二项式系数学习笔记（部分）
更好的阅读体验从《具体数学》第五章二项式系数中选了一些个人认为比较useful的内容，添加了部分解释和证明。组合数在\(n\)个元素中选择\(m\)个的方案数，记作\(\d......
SpringMVC学习笔记（四）——REST风格
1.什么是REST RESTful（REST风格）是一种当前比较流行的互联网软件架构模式，它充分并正确地利用HTTP协议的特性，为我们规定了一套统一的资源获取方式，以实现不同终端之间（客......
2022-2023-1 20221304 《计算机基础与程序设计》第一周学习总结
作业信息班级：https://edu.cnblogs.com/campus/besti/2022-2023-1-CFAP作业要求：https://www.cnblogs.com/rocedu/p/9577842.html#WEEK01作业目标：快速浏览教材作业正文：https......

相关文章

赞助商

阅读排行