首页 > 其他分享 >模型评价指标

模型评价指标

时间:2022-12-27 20:45:10浏览次数:33  
标签:正例 F1 预测 模型 指标 负例 ax 召回 评价

准确度、精确度、召回率、F1值作为评估指标,经常用到分类效果的评测上。

精确度:可以理解为预测出的东西有多少是用户感兴趣的;

召回率:可以理解为用户感兴趣的东西有多少被预测出来;

F1值:综合精确度和召回率两个指标。

 

TP(True Positives):真正例,预测为正例而且实际上也是正例;

FP(False Positives):假正例,预测为正例然而实际上却是负例;

FN(false Negatives):假负例,预测为负例然而实际上却是正例;

TN(True Negatives):真负例,预测为负例而且实际上也是负例。

 

准确率 Accuracy

准确度:正确分类的样本个数占总样本个数,用公式表示:

准确度好理解,是所有预测样本中预测准确的占比

 

精确度 Precision

精确度:以预测结果为判断依据,预测正确的正例数据占预测为正例数据的比例。预测为正例的结果分两种,要么实际是正例TP,要么实际是负例FP,则可用公式表示:

 

精确度还有一个名字,叫做“查准率”,我们关心的主要部分是正例,所以查准率就是相对正例的预测结果而言,正例预测的准确度。直白的意思就是模型预测为正例的样本中,其中真正的正例占预测为正例样本的比例,用此标准来评估预测正例的准确度。

 

召回率 Recall

召回率:以实际样本为判断依据,预测为正确的正例数据占实际为正例数据的比例。实际为正例的样本中,要么在预测中被预测正确TP,要么在预测中预测错误FN,用公式表示:

 

召回率的另一个名字,叫做“查全率”,评估所有实际正例是否被预测出来的覆盖率占比多少,我们实际黑球个数是3个,被准确预测出来的个数是2个,所有召回率r=2/3。

 

F1

F1值就是中和了精确率和召回率的指标:

  

当P和R同时为1时,F1=1。当有一个很大,另一个很小的时候,比如P=1,R~0,此时F1~0。分子2PR的2完全了为了使最终取值在0-1之间,进行区间放大,无实际意义。

 

混淆矩阵

混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型预测的类别判断两个标准进行汇总。其中矩阵的行表示真实值,矩阵的列表示预测值。

import seaborn as sns
from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt

sns.set()
f,ax = plt.subplots()
y_true = [0,0,1,2,1,2,0,2,2,0,1,1]
y_pred = [1,0,1,2,1,0,0,2,2,0,1,1]
C2 = confusion_matrix(y_true,y_pred,labels=[0,1,2])
#打印 C2
print(C2)
sns.heatmap(C2,annot=True,ax=ax) #画热力图

ax.set_titile('confusion matrix') #标题
ax.set_xlabel('predict') #x 轴
ax.set_ylabel('true') #y 轴

 

标签:正例,F1,预测,模型,指标,负例,ax,召回,评价
From: https://www.cnblogs.com/pass-ion/p/17008960.html

相关文章

  • 开源了!文心大模型ERNIE-Tiny轻量化技术,又准又快,效果全开
    1大模型落地之路维艰近年来,随着深度学习技术的迅速发展,大模型预训练范式通过一次次刷新各种评测基线,证明了其卓越的学习与迁移能力。在这个过程中,研究者们发现通过不断扩大......
  • PyTorch模型保存与加载
    保存与加载整个模型保存整个模型,包括网络结构和权重参数,保存后的文件用torch.load()加载后的类型是定义的网络结构类,如classCNN:torch.save(model,"model.pkl")加载整......
  • 常见的优先级选择模型 - 影响程度(痛点大于痒点)
    痛点需求一般情况大于痒点需求。只有因为难用而死掉的产品,没有因为难看而死掉的产品。痛点“痛点”是人们在完成某种行为、进行某种体验过程中的阻碍,是能够触发人强烈......
  • 网管型工业交换机的三大指标
    网管型工业交换机在应用过程中有很多优势,这其中都是因为网管型工业交换机的各个指标正常且达标,符合相关质量要求,那么,它其中的三个指标尤为重要,一起来看看吧!一、网管型工业交......
  • 常见的优先级选择模型 - 四象限法则(重要紧急)
    四象限法则将需求按照紧急和重要两个维度划分为四类:重要且紧急,这类的事情可能是:明天有个重要的报告要提交、要考试了才开始看书、要上台表演了台词还没记熟...重要不紧......
  • 声纹识别的评价指标(读书笔记)
    目录1.余弦相似度(cosinesimilarity)2.欧式距离(Euclideandistance)3.神经网络对于声纹识别技术,需要有统一的指标来衡量这些系统之间的优劣。声纹识别领域中通常使用等错......
  • 万字长文详解 YOLOv1-v5 系列模型
    一,YOLOv1Abstract1.Introduction2.UnifiedDetectron2.1.NetworkDesign2.2Training2.4.Inferences4.1ComparisontoOtherReal-TimeSystems5,代码实......
  • 学习下Redis内存模型
    作者:京东零售吴佳前言redis,对于一个java开发工程师来讲,其实算不得什么复杂新奇的技术,但可能也很少人去深入了解学习它的底层的一些东西。下面将通过对内存统计、内存划......
  • 常见的优先级选择模型 - 老板需求
    老板需求是产品经理无法避免的,而且一般优先级较高。这主要是从需求来源的维度去考虑,有同事、用户、老板.....为什么收老板需求优先级高呢?首先,老板的经验和思考高度一......
  • 数据仓库与多维模型设计
    这是一份早期传统行业时代的数据仓库与多维模型的设计内容,对于初学者还是有参考与学习价值。备注:该文档是在早期广州菲奈特(之前在数据仓库非常有名)一个培训ppt关于数据仓库......