首页 > 其他分享 >机器学习 - 如何理解函数集合中的准确性、召回率、F1分数呢?

机器学习 - 如何理解函数集合中的准确性、召回率、F1分数呢?

时间:2025-01-10 11:00:46浏览次数:3  
标签:F1 场景 预测 模型 准确性 正类 召回

在机器学习中,准确性(Accuracy)、召回率(Recall)、和F1分数是常用的模型性能评价指标,它们从不同的角度衡量模型的表现。要理解它们,首先需要了解它们的定义和适用场景:

1. 基本概念:分类问题中的混淆矩阵

混淆矩阵是分类问题中计算这些指标的基础,它展示了模型预测结果与实际标签之间的对比。以下是一个二分类问题的混淆矩阵:

预测为正类(Positive)预测为负类(Negative)
实际为正类真正类(TP)假负类(FN)
实际为负类假正类(FP)真负类(TN)
  • TP(True Positive):模型正确地预测为正的样本数。
  • FN(False Negative):模型错误地预测为负的正样本数。
  • FP(False Positive):模型错误地预测为正的负样本数。
  • TN(True Negative):模型正确地预测为负的样本数。

2. 准确性(Accuracy)

定义

准确性是所有正确预测(包括正类和负类)占总样本的比例。

优点
  • 简单直观,适合类分布平衡的情况。
缺点
  • 对于类别不平衡的问题不敏感。例如,在99%的样本都是负类的情况下,模型全预测为负类也能有99%的准确性,但实际上完全无效。
适用场景
  • 类别分布均衡,且正负类的重要性相当时。

3. 召回率(Recall)

定义

召回率是实际为正类的样本中,模型正确预测为正类的比例。

优点
  • 更关注正类的覆盖率,适合需要降低漏判率的场景。
缺点
  • 不考虑假正类(FP)的数量,可能导致过多错误预测为正类。
适用场景
  • 敏感任务:如疾病检测、垃圾邮件检测、金融风控等,对漏报成本较高时。
    • 例如:医疗诊断中,漏诊(FN)可能导致严重后果,因此优先提高召回率。

4. 精确率(Precision)

定义

精确率是模型预测为正类的样本中,真正为正类的比例。

优点
  • 更关注模型预测结果的可信度,适合降低误报率的场景。
缺点
  • 不考虑假负类(FN)的数量,可能导致低覆盖率。
适用场景
  • 严格任务:如信用卡欺诈检测、推荐系统等,对误报成本较高时。
    • 例如:风控中,过多的假正类(FP)可能导致业务资源浪费,因此需要高精确率。

5. F1分数

定义

F1分数是精确率和召回率的调和平均数,用于权衡二者:

优点
  • 综合考虑精确率和召回率,适合需要平衡两者的场景。
缺点
  • 如果任务对精确率或召回率有不同的侧重,F1分数可能不完全反映需求。
适用场景
  • 精确率和召回率同等重要时。
    • 例如:文本分类、舆情分析等,需要兼顾正类的覆盖率和预测准确性。

6. 示例说明

场景:垃圾邮件分类

假设共有100封邮件:

  • 其中20封是垃圾邮件,80封是正常邮件。
  • 模型预测结果如下:
    • TP = 15(15封垃圾邮件被正确预测为垃圾邮件)
    • FN = 5(5封垃圾邮件被预测为正常邮件)
    • FP = 10(10封正常邮件被预测为垃圾邮件)
    • TN = 70(70封正常邮件被正确预测为正常邮件)
计算:

7. 如何选择指标?

  • 优先准确性:适合类分布平衡且误分类成本相当的场景(如图像分类、语音识别)。
  • 优先召回率:适合正类漏判成本高的场景(如医疗诊断、风控审核)。
  • 优先精确率:适合负类误判成本高的场景(如广告推荐、信用欺诈检测)。
  • 优先F1分数:适合需要精确率和召回率平衡的场景。

准确性、召回率和F1分数是从不同角度衡量模型的性能。在选择使用哪个指标时,需要结合任务需求、错误代价和类别分布综合考量。对于实际问题,通常不仅关注单一指标,还需综合使用多个指标来全面评价模型表现。

附:对调和平均数和算数平均数的理解:

F1分数中的调和平均数是一种用来综合两个指标(通常是精确率 Precision 和召回率 Recall)的数学方法。相比算术平均数,调和平均数对两个值之间的平衡性要求更高,更加关注较小的值。

1. 调和平均数的定义

2、调和平均数 vs. 算术平均数

3. 为什么F1分数使用调和平均数?

4. 示例分析

假设一个分类模型的精确率和召回率如下:

  • 模型A:精确率 = 0.8,召回率 = 0.2
  • 模型B:精确率 = 0.5,召回率 = 0.5
计算F1分数:

  • 调和平均数在F1分数中的作用是综合两个指标的表现,同时更关注较小值,只有当精确率和召回率同时较高时,F1分数才会高。
  • 这使得F1分数成为一个能够平衡精确率和召回率的指标,适用于模型需要兼顾两者的场景,尤其是在分类问题中。

标签:F1,场景,预测,模型,准确性,正类,召回
From: https://blog.csdn.net/liruiqiang05/article/details/145051961

相关文章

  • 题解:CF1031F Familiar Operations
    传送门Solution之前有遇到类似的题,第一步先考虑转化操作和问题。对于每个数质因数分解成\(\prod{p_i^{\alpha_i}}\),我们所需要的只有\(\alpha_i\),因为只要求因子个数相同。记其为\(S_i=\{\alpha_1,\alpha_2,\dots,\alpha_k\}\),其中\(\alpha_1\geq\alpha_2\geq\dots......
  • 在 Windows 系统安装过程中,以下是常见的组合键及其功能,表格化整理如下:Ctrl + Shift +
    在Windows系统安装过程中,以下是常见的组合键及其功能,表格化整理如下:快捷键组合功能描述应用场景Ctrl+Shift+F3进入Windows审核模式(AuditMode)用于进入审核模式,可以在安装过程中进行系统自定义设置。F8启动高级启动选项(AdvancedBootOptions)进入安全模......
  • 提升时间准确性——如何正确修改网站显示的时间格式
    确保网站显示的时间格式准确无误是用户体验的重要组成部分。以下是具体的操作指南:评估需求确定需要调整的时间格式,如24小时制、12小时制、带秒数等。分析用户所在地区,选择适合的时区设置。登录后台管理系统使用管理员账号登录域名提供的后台管理界面。导航到“系统设......
  • 题解:CF1830A Copil Copac Draws Trees
    首先这道题肯定不能暴力枚举,我们要思考其他算法。我们可以给每一条边编一个号。然后从根开始遍历这棵树,当一条边的编号比他祖先到他祖先的祖先的那条边的编号还要小时,就说明顺序错了,要再等一轮。这个就简单了,直接dfs就行,注意答案要加\(1\)。#include<bits/stdc++.h>using......
  • CF1110D Jongmah
    经典题。\(\tt{Link}\)题意你手中有$$\(n\)$$张牌。每张牌上都写着一个介于\(1\)和\(m\)之间的整数。要赢得游戏,需要组成一定数量的三元组。每个三元组由三张牌组成,这样写在牌上的数字要么全部相同,要么连续。例如,\(7,7,7\)和\(12,13,14\)都是有效的三连牌,但\(2,......
  • 如何在梯度计算中处理bf16精度损失:混合精度训练中的误差分析
    如何在梯度计算中处理bf16精度损失:混合精度训练中的误差分析在现代深度学习训练中,为了加速计算并节省内存,越来越多的训练任务采用混合精度(MixedPrecision)技术,其中常见的做法是使用低精度格式(如bf16或fp16)进行前向传播和梯度计算,而使用高精度格式(如fp32)进行参数更新......
  • 对准确度(accuracy)、精确率(precision)、召回率(recall)、F1值文章的总结
    前言准确度、精确率、召回率、F1值作为评估指标,经常用到分类效果的评测上。比较好理解的二分类问题,准确度评估预测正确的比例,精确率评估预测正例的查准率,召回率评估真实正例的查全率。如何把这些评估指标用到多分类上呢,比如有三个类别A、B、C,准确度好理解,只要关系是否预测正确即......
  • 通过浏览器的开发者工具(F12)来加快网页中的视频播放速度
    使用JavaScript来修改视频元素的playbackRate属性。以下是具体步骤:打开你想要调整视频播放速度的网页。按下 F12 打开开发者工具。切换到“控制台”(Console)选项卡。输入以下JavaScript代码并按下回车键://获取页面中的第一个视频元素varvideo=document.querySelec......
  • ssm物流信息管理4bf18程序+源码+数据库+调试部署+开发环境
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、研究背景与意义随着信息技术的快速发展,物流信息管理在现代物流体系中扮演着至关重要的角色。高效的物流信息管理不仅能提升物流效率,还能优化资......
  • 【人工智能机器学习基础篇】——深入详解监督学习之模型评估:掌握评估指标(准确率、精确
    深入详解监督学习之模型评估在监督学习中,模型评估是衡量模型性能的关键步骤。有效的模型评估不仅能帮助我们理解模型在训练数据上的表现,更重要的是评估其在未见数据上的泛化能力。本文将深入探讨监督学习中的模型评估方法,重点介绍评估指标(准确率、精确率、召回率、F1分数等)和......