瞎聊机器学习——准确率、精确率、召回率、F1 score

时间：2023-02-21 17:10:31浏览次数：41

标签：F1 瞎聊分类 20 Recall 样本 score 召回

针对分类、回归、排序等问题的模型评估，不同的问题有不同的评估方法，今天重点来说一下关于分类问题的准确率（Accuracy）、精确率（precision）、召回率（Recall）、F1 score。

准确率（Accuracy）

准确率指的是分类正确的样本占总样本个数的比例

即：

$Accuracy=\frac{n_{correct}}{n_{total}}$

其中

$n_{correct}$

就是被分类正确的样本个数，

$n_{total}$

是总样本的个数。

精确率（precision）

精确率是指分类正确的正样本个数占分类器判定为正样本的个数的比例。

即：

$precisinotallow=\frac{n_{right+}}{n_{correct+}}$

其中

$n_{right+}$

表示分类正确的正样本的数量，

$n_{correct+}$

表示所有被分为正样本的数量。

召回率（Recall）

召回率是指分类正确的正样本占真实正样本的比例。

即：

$Recall=\frac{n_{right+}}{n_{really+}}$

其中

$n_{right+}$

表示分类正确的正样本的数量，

$n_{really+}$

表示真实正样本的数量。

F1 score

F1 score可以认为是精确率和召回率的调和平均值。

$F1 score =\frac{2*precision*recall}{precision+recall}$

举例说明一下这几个值的计算方法

假设某个班级有男生80人，女生20人，共100人，目的是找出所有的女生。

第一次：挑出50人，其中女生有15人（分类正确），有35个男生（分类错误）。

第二次：挑出50人，其中女生有20人（分类正确），有30个男生（分类错误）。

计算一下相应的值

第一次：

Accuracy = (15+(80-35))/100 = 60%

Precision = 15/50 = 30%

Recall = 15/20 = 75%

F1 = 2*0.3*0.75/0.3+0.75=42.9%

第二次：

Accuracy = (20+(80-30))/100 = 70%

Precision = 20/50 = 40%

Recall = 20/20 = 100%

F1 = 2*0.4*1/0.4+1 = 57.1%

根据两次结果我们可以对比出每种分类结果（不同分类器）之间的差距，在评估时我们可能会希望Precision越高越好，同样也希望Recall越高越好，但是我们考虑只抽取一个人且是女生的情况，此时的precision很高，但Recall却很低，我们并不能认为该分类方法是很好的，想要去衡量这个问题，我们可以绘制P-R曲线（横坐标为召回率，纵坐标为精确率）来对比不同分类器的表现好坏。

标签：F1,瞎聊,分类,20,Recall,样本,score,召回
From： https://blog.51cto.com/u_15969421/6076761

瞎聊机器学习——集成学习
什么是集成学习？对于一个机器学习问题，通常我们有两种策略，一种是研发人员尝试各种模型，选择其中表现最好的模型进行调参优化；另一种策略就是将多个分类器的结果统一成一个最终的......
ES自定义评分机制:function_score查询
转：https://blog.csdn.net/w1014074794/article/details/1205235501function_score介绍1.1简介主要用于让用户自定义查询相关性得分，实现精细化控制评分的目的。......
STM32F103入门练习：IAR开发环境设置及USART1中断方式收发字符
一，硬件准备：STM32F103ZET6微雪开发板RS232接口模块USB-RS232转接线接线：RS232接口模块芯片为MAX3232，模块连接开发板的USART1口，引脚接线：开发板<---->RS232转TTL模块......
HDOJ2148 Score
ScoreTimeLimit:1000/1000MS(Java/Others) MemoryLimit:32768/32768K(Java/Others)TotalSubmission(s):6966 AcceptedSubmission(s):4471Pro......
生成模型的评价指标：PSNR, SSIM, RMSE, MSE, NMI, IScore
20230220PSNRPSNR(PeakSignal-to-NoiseRatio)峰值信噪比PSNR越大，模型越好SSIMSSIM的大小介于-1～1，SSIM越大，模型越好结构相似性量测法比NRMSE更能表现图一、图三之......
CF1795C Tea Tasting
有一排桌子，每个桌子上有$a_i$杯茶，现有$m$个人，第$i$个人在一轮喝茶中要喝$b_i$杯茶，如果桌子上不满$b_i$杯茶，那他将该桌子上的茶全部喝光，初始第$i$......
CF1188DE
D.MakeEqual题意：给定$n$个正整数$a_1,a_2,...,a_n$，每次操作可以给一个$a_i$加上$2$的一个非负整数次幂，问最少多少次使得全同。题解：很妙啊！感觉非常没有......
CF1734E Rectangular Congruence 题解
可能更好的阅读体验题目传送门toluogu为什么只有VP才会遇到这种简单E。题目大意给定一个质数$n$和长度为$n$的序列$b$，要求构造一个$n\timesn$矩......
「CF1392H」ZS Shuffles Cards
题目点这里看题目。你有$n+m$张牌，其中有恰好$n$张为数字牌，分别标有$1,2,3,\dots,n$，剩下的恰好$m$张均为鬼牌。一开始，牌被随机打乱，同时你有一个集合\(......
CF17E Palisection
个人思路：两回文$i,j$相交，即$l_i\ler_j\landr_i\gel_j$我们从左到右，计算以每个点为中心的回文与之前的点为中心的回文的交点数，可以保证$r_i\gel_j$，相交......