首页 > 其他分享 >混淆矩阵初级指南

混淆矩阵初级指南

时间:2025-01-11 11:00:52浏览次数:3  
标签:混淆 矩阵 TP 分类器 初级 召回 我们

我们将探讨以下关键点:
• 什么是混淆矩阵?
• 与混淆矩阵相关的术语。
• 还将通过示例进一步探讨这些术语。
什么是混淆矩阵?
在这里插入图片描述

假设我们要为种植两种作物构建一个分类模型,即。

  1. 山药
  2. 土豆
    在这里插入图片描述

与土豆的价格相比,山药的售价更高。
因此,我们构建的分类器的任务是正确地对这两种作物进行分类,以便农作物可以通过以正确的市场价格出售作物来最大化他的利润。
因此,将 20 个样本发送给我们以检查分类器的性能,在这 20 个样本中,11 个样本是山药,9 个样本是土豆。
在这里插入图片描述

图 2 为我们提供构建的分类器的混淆矩阵,它基本上告诉我们,列是我们的实际类,行是分类器预测的预测类,它还告诉我们:
在 11 个山药样本中,5 个被正确归类为山药,6 个被错误归类为土豆。同样,在 9 个土豆本中,2 个被错误地归类为山药,7 个被错误归类为土豆。
这意味着在 20 个样本中,有 12 个被正确分类(图 2 中绿色框的总和),8 个被错误分类(图 2 中红色框的总和)。同样从图 2 中,我们了解到分类器在正确分类山药方面表现得非常糟糕,但在正确分类土豆方面做得不错。
因此,如果我们要用简单的词定义一个混淆矩阵,那么我们可以说:
“混淆矩阵帮助我们了解每个类的正确和错误分类的数量。”

与混淆矩阵相关的术语
每当我们遇到与混淆矩阵相关的讨论时,我们经常会听到诸如“召回”、“精度”和“F1-score”之类的词,这让我们思考它们的含义和用法。
别担心,我们将在本文中讨论所有内容,因此首先我们将从它们的定义和公式开始。

召回
在这里插入图片描述

所以召回率是 TP/(TP+FN) 的比率,其中 TP 是真阳性的数量,FN 是假阴性的数量。

换句话说,它让我们知道特定类的正确分类数占该类样本总数的比重。
让我们用 例子来理解它,以 “Yam” 作为我们感兴趣的作物:
因此,如果我们计算召回率,将图 2 中的值放入我们得到的公式中:
召回率 = 5/(5+6) = 5/11 = 0.454 = 45.4%,
其中 TP = 5 且 FN = 6
正如我们所看到的,召回率相当低,这表明我们的分类器大多数时候都没有正确地对 Yam 进行分类,并且经常将其误认为是土豆。

精度
在这里插入图片描述

因此,精度是 TP/(TP+FP) 的比率,其中 TP 是真阳性的数量,FP 是假阳性的数量。
换句话说,它让我们知道特定类的正确分类数与该类的预测总数之比。
让我们再次以例子来理解它,我们仍然认为 “Yam” 是我们感兴趣的作物:
因此,如果我们计算精度,将 图 2 中的值放入我们得到的公式中:
精度 = 5/(5+2) = 5/7 = 0.714 = 71.4%,
其中 TP = 5 且 FP = 2
因此,从上面的计算中,我们得出的见解是,分类器正确地预测了 Yam 样本 5 次是 “Yam”,但 2 次错误地预测了 Potato 样本是 “Yam”。换句话说,与 TP 相比,FP 的值明显较低,分类器的精度就越高。

注意:召回率和精度之间始终存在权衡。

F1- 分数
在这里插入图片描述
在这里插入图片描述

F1 分数是衡量模型在特定数据集上的整体性能的指标。F1 分数是组合模型精度和召回率的一种方式,它被定义为模型精度和召回率的调和平均值。
因此,如果我们根据上述计算的精度计算 F1 分数并召回,我们得到如下:
F1 分数 = (2 x (0.454 x 0.714)) / (0.454 + 0.714) = 0.648/1.168 = 0.554
这告诉我们,我们构建的分类器的性能在正确分类 Yam 作物方面表现得不是很好。

我们同样可以找到土豆的召回率、精度和 f1 分数,想知道怎么做!好吧,让我给你一个提示,即“将它们视为我们的正类或感兴趣的类”。为此,我们只需要交换实际类的列,也必须交换图 2 中预测类的行。然后,混淆矩阵将如图 3 所示。但是,在查看之前等待,为什么不自己尝试一下呢!稍后,您可以从图 3 中自行验证。

在这里插入图片描述

到了文章的结尾,我希望这篇文章能帮助你消除对混淆矩阵的困惑。

最后推荐:一个GPU矩阵乘法运算工具-GPUMatrix1.23【Windows版本】
https://download.csdn.net/download/axecute/90253223

在这里插入图片描述

标签:混淆,矩阵,TP,分类器,初级,召回,我们
From: https://blog.csdn.net/axecute/article/details/145072790

相关文章

  • 直观混淆矩阵指南
    混淆矩阵简介在不想进行光盘预测的情况下,我们通常希望评估模型的质量,而不仅仅是像模型准确性这样的简单指标。通常,我们为此目的求助于混淆矩阵图。然而,色标可能具有误导性,而且不直观。在这里,我们增强了正常的混淆矩阵,这样你就可以乍一看就传达你的结果。为了提高可读性,我们......
  • 【AI中的数学-线性代数】行列式:矩阵的心跳
    第三章线性代数第13节行列式:矩阵的心跳在线性代数中,行列式(Determinant)是衡量方阵性质的一个重要标量。它不仅在数学理论中占有举足轻重的地位,在人工智能的诸多应用中也扮演着关键角色。本节将详细探讨行列式的定义、性质、计算方法以及其在人工智能中的具体应用,帮助读者全......
  • 逆向案例艺恩OB混淆解密
    网址:艺恩-数据智能服务商_年度票房刷新页面发现只有一个接口然后打开发现一个返回的数据是需要解密的从启动器里看发现是一个明显的jquery的ajax所以只要从里面找到success 这个函数里面肯定返回解密的内容 切换年度发现断点断在shell这个上面e正好是加密的数据所以从we......
  • P10681 [COTS 2024] 奇偶矩阵 Tablica
    P10681[COTS2024]奇偶矩阵Tablica题意有一个\(n\timesm\)的\(01\)矩阵,问有多少种填\(01\)的方式,满足同一行、列恰好有\(1\)或\(2\)个\(1\)。\(n,m\le3000\)。思路首先一个显然的\(O(nm^2)\)做法:设\(f_{i,s0,s1}\)表示考虑到第\(i\)行,目前有\(s0\)......
  • 02-51单片机数码管与矩阵键盘
    一、数码管模块1.数码管介绍如图所示为一个数码管的结构图:说明:数码管上下各有五个引脚,其中上下中间的两个引脚是联通的,一般为数码管的公共端,分为共阴极或共阳极;其它八个引脚分别对应八个二极管,从a~g包括右下角的点,每个二极管与就近的引脚一一对应。2.单片机数......
  • C51--06---矩阵键盘
    一、矩阵键盘1.定义:4X416个按键组成,以矩阵的方式进行连接,叫做矩阵键盘;2.优势将按键排列成矩阵形式,两端都接在I/O口上,可以减少I/O口的占用;注:独立按键的模式,将一端集中接在GND上,另一端单独引出一个I/O口,这样当按键比较多时,就会占用很多I/O口;3.读取方式采用逐行、逐列的“扫......
  • 矩阵的秩
    矩阵与线性空间对于一个\(n\timesm\)的矩阵,我们把每一行看作一个\(m\)维向量,称这些向量为这个矩阵的行向量。同理,我们把每一列看作一个\(n\)维向量,称这些向量为这个矩阵的列向量。以行向量作为生成子集的线性空间的维度称为这个矩阵的行秩。类似地,我们有列秩的定义......
  • 软件系统安全逆向分析-混淆对抗
    1.概述在一般的软件中,我们逆向分析时候通常都不能直接看到软件的明文源代码,或多或少存在着混淆对抗的操作。下面,我会实践操作一个例子从无从下手到攻破目标。花指令对抗虚函数表RC42.实战-donntyousee题目载体为具有漏洞的小型软件,部分题目提供源代码,要求攻击者......
  • 混淆-SmartAssembly
    SmartAssembly7documentation:https://documentation.red-gate.com/saSmartAssembly7文档:https://documentation.red-gate.com/saSmartAssembly7.2版本下载链接:https://www.red-gate.com/products/dotnet-development/smartassembly/PS:建议使用7以后的版本,因为SmartAssem......
  • 亚矩阵云手机:跨境出海直播的全方位利器
    在跨境出海直播领域,亚矩阵云手机扮演着举足轻重的角色,为跨境业务中面临的诸多挑战提供了行之有效的解决方案。以下将对其作用与解决方案展开详细阐述。一、亚矩阵云手机在跨境出海直播中的关键作用(一)突破地域限制,畅享全球畅连亚矩阵云手机凭借精心布局的全球网络,与顶级网络供应......