首页 > 其他分享 >机器学习——必备前置知识(西瓜书1,2章)

机器学习——必备前置知识(西瓜书1,2章)

时间:2025-01-05 12:59:07浏览次数:3  
标签:误差 西瓜 RMSE text 必备 前置 TP MAE MSE

机器学习——必备前置知识


零、前言

机器学习通过构建数学模型,使计算机能够从数据中自动学习规律,并对未来未知数据进行预测或决策。

机器学习的核心在于“学习”,即如何让机器根据已有数据自我改进。为了确保学习效果的有效性,我们需要一系列评价指标来衡量模型性能。对于回归任务,常用平均绝对误差(MAE)、均方误差(MSE)及均方根误差(RMSE);对于分类任务,则关注准确率(Accuracy)、精度(Precision)、召回率(Recall)以及F1分数。此外,在信息检索、自然语言处理等领域,还有DCG、NDCG、BLEU等特定任务的评估标准。

合理划分训练集、验证集与测试集对保证模型的泛化能力至关重要。这不仅有助于避免过拟合现象,还能更客观地评估模型表现。随机重复实验和K折交叉验证等方法也被广泛应用,以提高结果的可靠性。统计有效性检验为我们在不确定性环境下做出科学判断提供了理论依据,包括偏差与方差的权衡、z检验、t检验等内容。


一、机器学习是什么?

机器学习:对学习的变化,进行构造或者修改,提高模型的泛化能力

二、评价指标

不同的任务有不同的评价指标

1)回归任务(MAE, MSE,RMSE)

概念:在回归任务中,模型的目标是预测连续值
指标:

1. 平均绝对误差(MAE)

  • 公式:
    MAE = 1 n ∑ i = 1 n ∣ y i − y ^ i ∣ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| MAE=n1​i=1∑n​∣yi​−y^​i​∣
  • 讲解:
    y ^ i 是真实值 \hat{y}_i\text{是真实值} y^​i​是真实值
      y i 是预测值 \ y_i\text{是预测值}  yi​是预测值
  • 特点:MAE 对异常值相对不敏感,因为使用的是绝对差值,不会因大误差而过度放大。

2. 均方误差(MSE)

公式:
MSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 MSE=n1​i=1∑n​(yi​−y^​i​)2

特点:MSE 对异常值非常敏感,因为使用的是平方差,较大的误差会被显著放大。因此,MSE 更加重视较大误差的影响

3. 均方根误差(RMSE)

公式:
RMSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} RMSE=n1​i=1∑n​(yi​−y^​i​)2
特点:RMSE 与 MSE 类似,但其单位与原始数据相同,更易于解释。它同样对异常值敏感,适合用于需要强调较大误差的情况

4.MAE与RMSE的区别(应用场景)

  • MAE:
    适用于对异常值不敏感、关注整体误差水平的场景。例如,在预测用户评分时,可能更关心整体评分的准确性,而不是个别极端评分。
  • RMSE:
    适用于对较大误差敏感、需要强调异常值影响的场景。例如,在预测股票价格或房屋价格时,较大的预测误差可能会带来更大的风险,因此使用 RMSE 更合适。

5.总结

在这里插入图片描述

2)二分类任务 (P,R,F)

模型的结果有4种可能
在这里插入图片描述
我的理解是:
先看预测标签是P还是N
再看真实标签是T还是F
比如FN
预测标签是错误的(N),前面也是错误的(F),所以真实的标签是正确的

1. 准确率(Accuracy)

定义:所有预测正确的样本数占总样本数的比例
公式:
Accuracy = TP + TN TP + FP + FN + TN \text{Accuracy} = \frac{\text{TP} + \text{TN}}{\text{TP} + \text{FP} + \text{FN} + \text{TN}} Accuracy=TP+FP+FN+TNTP+TN​

2. 精度(Precision)

Precision = TP TP + FP \text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}} Precision=TP+FPTP​

3.召回率(Recall)

  • 定义:实际为正类的样本中,被正确预测为正类的比例
  • 公式:
    Recall =  TP TP + FN \text{Recall} = \frac{\text{ TP}}{\text{TP} + \text{FN}} Recall

标签:误差,西瓜,RMSE,text,必备,前置,TP,MAE,MSE
From: https://blog.csdn.net/oisflo/article/details/144929762

相关文章

  • JavaScript 观察者模式:前端开发必备技能
    一、什么是观察者模式?        观察者模式(ObserverPattern),也称为发布-订阅模式(Publish/Subscribe),定义了一种一对多的依赖关系。当一个对象(被观察对象或主题Subject)的状态发生变化时,所有依赖于它的对象(观察者Observer)都会得到通知,并自动进行相应的更新。     ......
  • Java必备知识点
    18.子类方法与父类的方法同名,并且参数个数、类型和数据也相同,那么子类的方法覆盖了父类的方法(也就是子类的方法声明和父类的方法声明一致)19.super调用父类方法和属性20.注释的那段代码的意思:通过创建一个Husband类的对象赋值给wife对象中的husband常量(因为在Wife这个类中hu......
  • 【JS逆向】爬虫必备hook脚本
    特别声明:本公众号文章只作为学术研究,不用于其它不法用途;如有侵权请联系作者删除。Hook是一种钩子技术,在系统没有调用函数之前,钩子程序就先得到控制权,这时钩子函数既可以加工处理(改变)该函数的执行行为,也可以强制结束消息的传递。简单来说,修改原有的JS代码就是Hook。Hook技......
  • 顶级白帽黑客必备的十大黑客技术
    1.熟悉Linux系统和命令行操作:Linux是黑客的基石,几乎所有黑客工具和技术都是在Linux平台上运行的,熟悉Linux系统和命令行操作是必须的。2.掌握网络协议和TCP/IP模型:了解TCP/IP模型、网络协议和通信流程是黑客攻击的基础,必须要掌握。3.学会使用扫描工具:网络扫描是黑客攻击......
  • SD WebUI必备插件安装,菜鸟轻松成高手!
    一个刚学AI绘画的小菜鸟怎么快速成为StableDiffusionde的高手?答案就是SD插件,只要学会使用SD的各种插件,帮你写正向和负向提示词,修复人脸/身体/手指,高清放大图片,指定人物pose,图片微调等等都可以轻松搞定,善用插件是成为高手必经之路。目录1插件安装方法2基础插件介绍3......
  • 高绩效销售团队必备协作工具和管理办法
    团队的核心是人,生产力和绩效最终也是靠人来实现的。所以,想要提升团队的高效运作,关键就在于“搞定人”。在本文中,我们将从心理学原理、管理方法和团队协作工具三个角度,聊一聊如何打造一支高绩效的团队。1.开诚布公的沟通沟通的透明度是团队成功的重要因素之一。根据心理学中的“......
  • 11 个必备 Docker 工具
    ​1.LazyDocker命令行下的Docker管理利器LazyDocker是一个为命令行用户设计的友好型终端工具,用于管理Docker容器、镜像和存储卷。它适合那些习惯于命令行操作但又希望拥有直观界面的用户。通过LazyDocker,你可以一站式查看容器的状态、资源消耗、日志等详细信息,并能轻......
  • 驱动人生Pro专业版!电脑玩家必备!
    下载:https://pan.quark.cn/s/515e4d7aad9b驱动人生海外版(绿色单文件+默认Pro),玩家和普通电脑用户都必不可少的驱动下载管理工具!它最大的特点在于:无需折腾,甚至不必安装,双击即可使用,并且全面同步所有硬件厂商的最新驱动!截止目前,见过在驱动版本更新速度上最快的神器!软件打开,可......
  • 同硕计算机专业考研必备:统考+课程学习资料大放送!
    考研之路,道阻且长。对于计算机专业的学子来说,备考之路更是充满挑战。为了帮助广大考生高效备战,我在此精心整理了一套同硕计算机专业统考及课程学习资料,并免费分享给大家!一、资料亮点:1.同硕-计算机专业-统考历年真题,全部免费送。 2.同硕-计算机专业-课程学习和考试资料:作业和......
  • 《CTF 竞赛必备神器 ——ctftools-all-in-one 深度解析与推荐》
    前言但凡参与过CTF赛事的同仁想必都深有体会,CTF比赛过程中常常需要运用到各式各样的工具。有时为了解答一道题,就不得不临时去下载一款特定工具,这无疑是一件繁琐的事情。尤其是在参加线下赛时,情况更为棘手,因为大部分线下赛都禁止联网,这就使得我们无法借助强大的AI助手,只能......