首页 > 其他分享 >机器学习-混淆矩阵

机器学习-混淆矩阵

时间:2024-08-21 20:55:03浏览次数:14  
标签:混淆 机器 F1 模型 矩阵 TP 正类

文章目录

一、混淆矩阵

1.混淆矩阵简介

随着机器学习和人工智能的迅速发展,分类模型成为了解决各种问题的重要工具。然而,仅仅知道模型预测对了多少样本是不够的。我们需要一种更详细、更系统的方法来理解模型的分类能力,以及它在不同类别上的表现。
混淆矩阵是机器学习中一种评估分类模型性能的工具,特别是在监督学习中。它主要用于描述分类模型的预测结果与实际样本类别之间的关系。混淆矩阵通过矩阵的形式,展示了每个类别中预测正确的样本数和预测错误的样本数。

2.混淆矩阵图列

混淆矩阵的行代表样本的真实类别,列代表模型预测的类别。对于一个二分类问题(假设为类别0和类别1),混淆矩阵如下所示:

预测为0预测为1
真实0TN(真负类)FP(假正类)
真实1FN(假负类)TP(真正类)

其中:

  • 真正类(True Positives, TP):模型正确地将正类预测为正类的数量。
  • 假负类(False Negatives, FN):模型错误地将正类预测为负类的数量。
  • 假正类(False Positives, FP):模型错误地将负类预测为正类的数量。
  • 真负类(True Negatives, TN):模型正确地将负类预测为负类的数量。

对于多分类问题,混淆矩阵会扩展为更多的行和列,每行每列分别对应一个类别。

二、混淆矩阵指标

基于混淆矩阵,我们可以计算出多种评估指标,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值(F1 Score)等,这些指标可以更加全面地评估模型的性能,有助于我们根据具体需求调整和优化模型。

1. 准确率(Accuracy)

含义:准确率是指模型正确分类的样本数占总样本数的比例。它衡量了模型整体的分类能力,但在类别不平衡的数据集上可能具有误导性。

计算公式:
A c c u r a c y = ( T P + T N ) / ( F P + F N + T P + T N )​ Accuracy= (TP+TN) /(FP+FN+TP+TN) ​ Accuracy=(TP+TN)/(FP+FN+TP+TN)​

其中,TP表示真正例,TN表示真负例,FP表示假正例,FN表示假负例。

2. 精确率(Precision)

含义:精确率(也称为查准率)是指模型预测为正类的样本中,实际为正类的样本比例。它衡量了模型预测为正类的可靠性。

计算公式:
P r e c i s i o n = T P / ( F P + T P )​ Precision= TP/ (FP+TP) ​ Precision=TP/(FP+TP)​

精确率高意味着模型在预测为正类的结果中,大部分是正确的。

3. 召回率(Recall)

含义:召回率(也称为查全率)是指实际为正类的样本中,被模型正确预测为正类的样本比例。它衡量了模型对正类样本的识别能力。

计算公式:
R e c a l l = T P / ( F N + T P )​ Recall= TP/(FN+TP) ​ Recall=TP/(FN+TP)​

召回率高意味着模型能够捕捉到更多的正类实例。

4. F1分数(F1 Score)

含义:F1分数是精确率和召回率的调和平均数,用于综合评估模型的性能。它平衡了精确率和召回率的重要性,提供了一个单一的评估指标。

计算公式:
F 1 S c o r e = ( 2 × P r e c i s i o n × R e c a l l ) / ( P r e c i s i o n + R e c a l l ) ​ F1 Score= (2×Precision×Recall)/ (Precision+Recall) ​ F1Score=(2×Precision×Recall)/(Precision+Recall)​

F1分数的取值范围为0到1,值越接近1表示模型的预测性能越好。

三、总结

这四个指标在评估分类模型时各有侧重,准确率衡量了模型的整体分类能力,精确率衡量了模型预测为正类的可靠性,召回率衡量了模型对正类样本的识别能力,而F1分数则综合了精确率和召回率,提供了一个更为全面的评估视角。在实际应用中,可以根据具体需求和数据特性选择合适的评估指标。

标签:混淆,机器,F1,模型,矩阵,TP,正类
From: https://blog.csdn.net/2301_77698138/article/details/141333334

相关文章

  • 机器学习-过采样(全网最详解)
    相关介绍在逻辑回归中,处理不平衡数据集是一个重要的步骤,因为不平衡的数据集可能导致模型偏向于多数类,而忽略少数类。过采样(Over-sampling)是处理不平衡数据集的一种常用方法,它通过增加少数类样本的数量来平衡数据集。1.过采样的基本概念过采样是指对训练集中的少数类样本......
  • 2024年十大聊天机器人构建平台
    聊天机器人现在在客户服务和业务自动化中扮演着至关重要的角色,这项技术允许企业与客户快速实时地互动。用于创建聊天机器人的技术正在迅速发展,这对聊天机器人构建工具产生了直接影响。一些领先者中的先驱者在2024年正在推出具有革命性特点和界面的产品。本文介绍了顶级聊天机器......
  • MarkDown基础及表格、KaTeX公式、矩阵、流程图、UML图、甘特图语法
    概述最多可设置6级标题技巧列表有序列表MD语法:1.你好2.我也好呈现效果:你好我也好无序列表MD语法:-a-b*aa*bb+aaa+bbb效果:abaabbaaabbb结论,支持三种方式:-、*、+TODO列表MD语法:-[x]后端接口开发-[]与前端联调呈现效果:后端......
  • 面试+算法之动态规划(Java):斐波那契、背包问题、走棋盘、分苹果、连续子数组最大和、
    概述Dynamicprogramming,简称DP,动态规划,基础算法之一,维基百科的解释:是一种在数学、管理科学、计算机科学、经济学和生物信息学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时......
  • 73.矩阵置零
    1.题目描述给定一个 mxn 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。示例1:输入:matrix=[[1,1,1],[1,0,1],[1,1,1]]输出:[[1,0,1],[0,0,0],[1,0,1]]示例2:输入:matrix=[[0,1,2,0],[3,4,5,2],[1,3,1,5]]输出:[[0......
  • 机器学习线性回归算法——原理+python详细代码解析(sklearn)
    线性回归算法作为经典的机器学习算法之一,拥有极为广泛的应用范围,深受业界人士的青睐。该算法主要用于研究分析响应变量如何受到特征变量的线性影响。其通过构建回归方程,借助各特征变量对响应变量进行拟合,并且能够利用回归方程进行预测。鉴于线性回归算法较为基础、简单,所以比较......
  • 淘客返利机器人的智能化实现:架构与算法
    淘客返利机器人的智能化实现:架构与算法大家好,我是阿可,微赚淘客系统及省赚客APP创始人,是个冬天不穿秋裤,天冷也要风度的程序猿!在电商领域,淘客返利机器人作为一种高效的营销工具,其智能化实现对于提升用户体验和增加用户粘性具有重要意义。本文将深入探讨淘客返利机器人的架构......
  • 机器学习--序列到序列模型总结
    序列到序列(Seq2Seq)模型的发展历程中,随着技术的进步和研究的深入,出现了多种不同的架构。这些架构在编码器-解码器结构的基础上逐步演化,融合了多种改进策略和创新方法。以下是总结出的主要Seq2Seq模型架构:1.基础的RNNSeq2Seq模型编码器和解码器:最早的Seq2Seq模型使用简单的......
  • 机器学习框架推理流程简述(以一项部署在windows上的MNN框架大模型部署过程为例子)
    一、写在前面公司正好有这个需求,故我这边简单接受进行模型的部署和demo程序的编写,顺便学习了解整个大模型的部署全流程。这篇博客会简单提到大模型部署的全流程,侧重点在推理这里。并且这篇博客也是结合之前的MNN部署流程来编写的,最好连下来一起看。MNN框架在WIN10上的部署MNN框......
  • 找矩阵
    通过矩阵转置,归并行、列两种情况先行后列表示坐标点击查看代码#include<bits/stdc++.h>usingnamespacestd;charc[3005][3005];ints[3005][3005],u,v,n,m,l[3005],r[3005];boolf;intcalc(intx1,inty1,intx2,inty2){returns[x2][y2]-s[x1-1][y2]-s[x2......