首页 > 其他分享 >统计学习方法笔记

统计学习方法笔记

时间:2024-11-02 17:41:27浏览次数:1  
标签:函数 1.3 模型 损失 学习 算法 笔记 最小化 统计

统计学习方法

1.3 统计学习方法的三要素

1.3.1 模型

好,为什么要从1.3开始呢,因为看前面的课,我还没有用到这个软件。

方法=模型+策略+算法

模型有好多个,试试

策略:按照什么样的准则去选取模型

比如说看预测值和真实值有多大,或者损失函数最小等

算法 即怎样去实现去寻找这个模型

决策模型

比如房价预测,我输入x,他就会给出一个房价的预测值

条件概率模型

比如我给一张图片,他就会给出属于猫的概率为多少,属于狗的概率为多少

最后呢,我用argmax函数就可以得出属于哪一类了

1.3.2策略

损失函数和风险函数

首先引入损失函数与风险函数的概念。损失函数度量模型一次预测的好坏,风险函数度量平均意义下模型预测的好坏。

损失函数,有误差平方和,等等

平均损失函数

8ddd256d2928581fadd21c25e007095

好的,上面这个不用,因为我们知道分布,还要机器学习干什么。

我们用这个 经验损失

ef360c3a5c7d2bab8f3f8322237e432

当样本足够大时,这俩就差不多了。第二个就是 损失函数 加起来求平均。L 就是损失函数

在应用中,样本是有限的,所以我们要对平均误差进行矫正。例如正则化什么的,我现在还不会。

经验风险最小化和结构风险最小化

经验风险最小化

ce1da577769c86c5407275fc272f093

当样本数量少,或者易出现过拟合

我们采用结构风险最小化,加一项正则化项

f79b3ba6f59751ce4584fcbba3a35bd

image-20241102165236039

对于概率分布的损失函数有

image-20241102165339349

dfcf750b4634a3073a5bd5df084a2b1

对于这个可以再去别的地方学学

1.3.3算法

算法就是学习模型的具体计算方法。通过算法可以找到最合适的模型

1.4 模型评估与选择

1.4.1 训练与测试误差

训练误差

image-20241102172718002

测试误差

image-20241102172702878

可以理解为考试,在平常的小测试当中,一直做题,做了很多编后,得分很高,但是到了期末考试就,考的很差了,这就是为什么要用到测试误差。

1.4.2过拟合

过拟合:是指模型过于复杂,对训练集训练的太好,反而应用到测试集,效果不怎么理想

image-20241102173830491

标签:函数,1.3,模型,损失,学习,算法,笔记,最小化,统计
From: https://www.cnblogs.com/zy999/p/18522261

相关文章

  • 决策树——集成学习(1)
    对于决策树的构建主要分为两类方法,即深度优先(损失更小,与广度优先相比,在leaf数目相同时树根深,因此容易造成过拟合,但是构建过程更加灵活且容易在大规模数据集上使用)和广度优先(树的构建更加平衡,但是精度较差),决策树通过“分而治之”的思想将样本进行分类。在决策树构建的过程中最......
  • 《程序员的修炼之道——从小工到专家》阅读笔记1
    这里面针对程序员,反复提到一个形容词,就是“注重实效”。根据书中所讲,结合我的理解,我认为注重时效这个词主要体现在责任上,对自己负责,对自己的代码负责,对自己的代码中的错误负责。“最大的弱点就是害怕暴露弱点”,我非常认同这句话,要坦然面对自己的错误其实并不是一件容易的事情,不仅......
  • 机器学习入门基础----白板推导笔记输出
    为了能够建立知识学习后输出体系,开设这个系列,旨在通过记录博客输出学习到的机器学习内容,笔者所学为B站upshuhuai008白板推导系列,记录可能比不上原创,也可能有没理解不严谨的地方,请善意指正。感兴趣的可以去看UP白板-------------------------------------------------------------......
  • 使用机器学习预测FPGA的执行时间与功耗:一种创新的方法
    随着科技的飞速发展,现场可编程门阵列(FPGA)在高性能计算、数据中心、人工智能等领域的应用日益广泛。然而,FPGA设计的复杂性和功耗问题一直是制约其性能提升的关键因素。近年来,机器学习(ML)技术的兴起为FPGA的执行时间与功耗预测提供了新的解决方案。本文将探讨如何使用机器学习进行FPG......
  • 学习python的第十一天
    今天学习了正则有以下思维导图 对于以上内容,有以下笔记,以及关于元字符的图importfunctools#re.findallimportre#a="python12314534564java"#anqi=re.findall("123",a)#(匹配规则,数据)#print(anqi)#re.match是从一开始就开始匹配#print(re.match("python"......
  • 学期(2024-2025-1) 学号(20241420) 《计算机基础与程序设计》第六周学习总结
    学期(2024-2025-1)学号(20241420)《计算机基础与程序设计》第六周学习总结作业信息这个作业属于哪个课程<班级链接>(如[https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP))这个作业要求在哪里<作业要求链接>(https://www.cnblogs.com/rocedu/p/9577842.html#WEEK06......
  • 数据库中对性能优化的学习
    MySQL性能优化目录MySQL性能优化索引优化SQL语句优化参数优化定期备份表(冷热数据)索引优化选择合适的索引列选择具有高度唯一性的列作为索引列,如用户ID、邮箱等。选择经常被查询的列作为索引列,如订单号、用户ID等。合理使用复合索引在需要同时查询多个条件的情况下,......
  • 深度学习(tensorboard使用)
    在做深度学习的时候,尤其是在没有界面的服务器上训练时,可以利用tensorboard工具输出各种曲线或中间图像。下面代码将曲线和图像输出到run目录下临时文件中。fromtensorboardXimportSummaryWriterfromPILimportImageimportnumpyasnpimporttorchvisionimporttorch......
  • [理论学习] CNN学习笔记简陋版
    写在前面参考:https://www.cnblogs.com/boostwei/p/15195643.htmlhttps://www.youtube.com/watch?v=pj9-rr1wDhMCNN做了什么CNN的出现主要解决图像处理的两大难题:1.图像处理的数据量过大以致处理成本昂贵且效率低2.图象在数字化的过程中很难保证原有的特征CNN结构输入:......
  • 学霸带你游戏化挑战自我的学习策略
    高效学习的策略与方法在信息爆炸的时代,如何高效学习成为了许多人的迫切需求。通过分阶段学习,可以帮助学习者更加系统地掌握知识,从明确学习目标到制定学习计划,再到实施阶段性学习,强化记忆与理解,最后评估与反馈,整个过程构成了一个完整的学习闭环。借助于具体的游戏和实际的工具,......