分类模型的性能评估指标总结

时间：2023-04-28 23:44:22浏览次数：38

机器学习中所用模型的好坏需要通过一些量化的指标来评估。对于分类模型，是通过：1）精度（Accuracy）；2）准确率（Precision）；3）召回率（Recall）；4）F1分数；5）ROC（Receiver operating characteristic curve）曲线；6）AUC（Area Under Curve）曲线来实现的。

二分类模型

对于二分类问题，通常将两个类别称为正类和负类。正类中的样本为正例，负类中的样本为负例。假设我们有一组样本对应的y真实标签记为y_test = [1 1 0 1 1 1]，相应的y预测标签记为y_pre = [1 0 0 1 0 1]，预测结果可分为4种情况：

正例1被判定为正例1，其数目称为TP(True positive)
正例1被判定为负例0，其数目称为FN(False negative)
负例0被判定为正例1，其数目称为FP(False positive)
负例0被判定为负例0，其数目称为TN(True negative)

将预测结果写成混淆矩阵（confusion matrix）形式：

真实标签	预测标签
真实标签	正例（1）	负例（0）
正例（1）	TP	FN
负例（0）	FP	TN

样本量$N=TP+FP+FN+TN$

精度$Accuracy=\frac{TP+TN}{TP+FP+FN+TN}$，表示总样本中预测正确的样本数占比。

错误率$Error=1-Accuracy=\frac{FP+FN}{TP+FP+FN+TN}$

查准率$Precision=\frac{TP}{TP+FP}$，也称为准确率，表示预测值为正的样本中预测正确的样本数占比。

召回率$Recall=\frac{TP}{TP+FN}$，也称为查全率，表示真实值为正的样本中预测正确的样本数占比，即正样本的准确率。

注：查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低；而查全率高时，查全率往往偏低。

Precision-Recall 曲线是根据多个阈值计算得到的多组查准率（纵坐标）和查全率（横坐标）绘制而成，示意图如下：

从P-R图上可以直观地看到模型在样本总体上的查全率和查全率。当一个模型的P-R曲线被另一个模型的曲线完全包住，则可认为后者的性能优于前者（上图中A优于C）；如果两个模型的P-R曲线发生了交叉，则难以一般性地判断两者孰优孰劣，只能在具体得查准率或查全率条件下比较（上图中A和B）。当然，如果非要比较上图中A和B模型的相对好坏，可通过计算平衡点（Break-Event Point，即查准率=查全率的点）的值来比较，则可认为模型A优于B。

F1评分$F1$ $score=\frac{2*Precision*Recall}{Precision+Recall}$

ROC曲线是根据多个阈值计算得到的多组FPR(False positvie rate) （作为横坐标）和 TPR (True positvie rate)（作为纵坐标）绘制而成；其中，

$TPR=\frac{TP}{TP+FN}$，与召回率的公式一样
$FPR=\frac{FP}{FP+TN}$，表示真实值为负的样本中预测错误的样本数占比，等于1-特异度（Specificity）

可以看到，ROC曲线同时考虑了分类模型对正例和负例的分类能力，对样本类别是否均衡并不敏感，因此，常被用来评价模型的性能。其值越靠上说明模型越好。

AUC表示ROC曲线下面的面积，值范围为0~1。其值越高，模型性能越好；AUC=1.0时模型最好，AUC=0.5表示随机分类。

标签：总结,FP,模型,TP,查全率,负例,FN,评估
From： https://www.cnblogs.com/chaimy/p/17361822.html

总结20230428
代码时间（包括上课）：1h代码量（行）：30行博客数量（篇）：1篇相关事项：1、今天上午第一节课是计算机网络，开启了运输层的新篇章。2、今天上午第二节是概率论，讲的是概率论的方差、协方差、相关系数等知识。3、今天晚上打算在学一点Javaweb的知识。......
每日总结-23.4.28
<%@pagelanguage="java"contentType="text/html;charset=UTF-8"pageEncoding="UTF-8"%><!DOCTYPEhtmlPUBLIC"-//W3C//DTDHTML4.01Transitional//EN""http://www.w3.org/TR/html4/loose.dtd&qu......
4.28每日总结
<%@pagelanguage="java"contentType="text/html;charset=UTF-8"pageEncoding="UTF-8"%><!DOCTYPEhtmlPUBLIC"-//W3C//DTDHTML4.01Transitional//EN""http://www.w3.org/TR/html4/loose.dtd&qu......
4.28每日总结
/*submitassignmentDimQuery*提交作业信息模糊查询，输入序号，名称，截止时间，所属课程id，所属老师id，文字信息中的一项或多项，实现模糊查询，6项都不输入则为全部显示*输入参数：序号id(String)，学生学号student_id(String)，时间time(String)，所属发布作业idpu_ass_id(String......
每日总结2023-04-28
今天完成了ANdroid中的找回密码packagecom.example.math;/**找回界面*/importstaticandroid.widget.Toast.LENGTH_SHORT;importandroidx.appcompat.app.AppCompatActivity;importandroid.os.Bundle;importandroid.os.Handler;importandroid.view.View;import......
CSS知识点总结
CSS知识点总结文章内容可能较多且杂乱，可以查看页面右方的目录，以及使用Ctrl+F搜索页面内容进行内容定位。常用属性推荐搭配文档使用，可以复制属性名，到文档查看该属性对应的可选值。......
题目集4~6的总结性Blog2
目录1、前言2、设计与分析3、踩坑心得4、改进建议5、总结题目集4：1、菜单计价程序-32、有重复数据3、去掉重复数据4、单词系统与排序5、面向对象编程（封装性）6、GPS测绘中度分秒转换7、判断两个日期的先后、计算间隔天数、周数题目集5：1、正则......
每日总结 4.28
今天进行了一天的课程，进行了较少的代码编写。Stringtime=request.getParameter("time");d.buhuo(name,sum,mphone);d.gx(mer,time,mphone,name);response.setContentType("text/html;charset=utf-8");PrintWriter......
对Java课程PTA4-6题目集的反思与总结
前言：三次题目集一共涵盖了以下知识点：面向对象编程的封装性，List-Arrays方法的使用，强制类型转换的方法，字符串的处理，字符串截断方法split的使用，对象数组的建立以及使用，Java源码自带的多种日期类方法的使用，各种正则表达式及其运用，运用聚合的方法自行写日期类，综合运用现学的所......
Python Requets库学习总结
快速开始发送请求>>>importrequests>>>r=requests.get('https://api.github.com/events')#GET>>>r=requests.post('https://httpbin.org/post',data={'key':'value'})#POST>>>r=r......

分类模型的性能评估指标总结

二分类模型

相关文章

赞助商

阅读排行