首页 > 其他分享 >朴素贝叶斯分类的简单解释 [已关闭]

朴素贝叶斯分类的简单解释 [已关闭]

时间:2023-11-13 15:02:09浏览次数:26  
标签:训练 对象 贝叶斯 GREEN 朴素 关闭 先验概率 RED

内容来自 DOC https://q.houxu6.top/?s=朴素贝叶斯分类的简单解释 [已关闭]

我发现很难理解朴素贝叶斯的过程,我想知道是否有人能够用简单的逐步过程以英语解释它。我理解它通过发生的次数进行概率比较,但我不知道训练数据如何与实际数据集相关联。

请给我解释一下训练集扮演的角色。这里我给出一个非常简单的水果示例,比如香蕉:

训练集---
圆形-红色
圆形-橙色
长条形-黄色
圆形-红色

数据集----
圆形-红色
圆形-橙色
圆形-红色
圆形-橙色
长条形-黄色
圆形-红色
圆形-橙色
长条形-黄色
长条形-黄色
圆形-红色


你的问题分为两个部分,第一部分是你对朴素贝叶斯分类器的理解需要加深,第二部分是关于训练集的困惑。

一般来说,所有机器学习算法都需要通过训练来进行监督学习任务,例如分类、预测等,或者进行无监督学习任务,例如聚类。

在训练过程中,算法使用一个特定的输入数据集(训练集)进行教学,以便在之后我们可以对未知输入进行测试(它们从未见过),然后根据它们的学习进行分类或预测等(在有监督学习的情况下)。这是大多数机器学习技术如神经网络、支持向量机、贝叶斯等的基础。

因此,在一个普通的机器学习项目中,你需要将输入集分为开发集(训练集+开发测试集)和测试集(或评估集)。记住,你的基本目标是让你的系统能够学习和分类以前在开发集或测试集中从未见过的新输入。

测试集通常与训练集具有相同的格式。然而,非常重要的一点是测试集必须与训练语料库不同:如果我们简单地将训练集作为测试集重新使用,那么一个仅仅记住输入而无法学习如何推广到新例子的模型会得到误导性地高分。

一般来说,举个例子,我们可以将数据的70%用作训练集。同时要记住,要随机地将原始集合划分为训练集和测试集。

接下来让我解释一下你关于朴素贝叶斯的另一个问题。

为了说明朴素贝叶斯分类的概念,考虑下面的例子:

enter image description here

如上所示,对象可以被分类为GREENRED。我们的任务是根据当前现有的对象,将新案例进行分类,即确定它们属于哪个类别。

由于GREEN对象的数量是RED对象的两倍,合理地认为未观察到的新案例更有可能是GREEN而不是RED。在贝叶斯分析中,这种信念被称为先验概率。先验概率基于以往经验,本例中是GREENRED对象的百分比,并经常用于事情发生之前的预测。

因此,我们可以写成:

GREEN的先验概率GREEN对象的数量 / 总对象数量

RED的先验概率RED对象的数量 / 总对象数量

由于共有60个对象,其中有40GREEN20RED,我们对类成员资格的先验概率为:

GREEN的先验概率40 / 60

RED的先验概率20 / 60

在制定了先验概率之后,我们现在可以分类一个新的对象(下图中的WHITE圆圈)。由于对象被很好地聚集,合理地假设在X附近有更多的GREEN(或者RED)对象,因此新案例更有可能属于那种颜色。为了衡量这种可能性,我们在X周围画一个圆圈,其中包含一定数量(事先选择)的点,而不考虑它们的类别。然后我们计算圆圈中属于每个类别标签的点的数量。根据此计算出似然:

enter image description here

enter image description here

从上面的插图可以清楚地看出,给定GREEN的情况下,X的似然性小于给定RED的情况,因为圆圈中包含1GREEN对象和3RED对象。因此:

enter image description here
虽然先验概率表明X可能属于GREEN(因为GREEN的数量是RED的两倍),但似然概率表明不同,即X的类别是RED(因为在X附近的RED对象比GREEN对象更多)。在贝叶斯分析中,最终的分类是通过结合先验概率和似然概率来生成的,即使用所谓的贝叶斯定理(以Rev. Thomas Bayes 1702-1761命名)形成后验概率。

最后,由于其类别成员资格具有最大的后验概率,我们将X分类为RED

标签:训练,对象,贝叶斯,GREEN,朴素,关闭,先验概率,RED
From: https://www.cnblogs.com/xiaomandujia/p/17829074.html

相关文章

  • close()关闭文件方法
    我们知道,调用open()方法打开文件,是文件流对象和文件之间建立关联的过程。那么,调用close()方法关闭已打开的文件,就可以理解为是切断文件流对象和文件之间的关联。注意,close()方法的功能仅是切断文件流与文件之间的关联,该文件流并会被销毁,其后续还可用于关联其它的文件。close()......
  • sed和awk之间有什么区别?[已关闭]
    内容来自DOChttps://q.houxu6.top/?s=sed和awk之间有什么区别?[已关闭]awk和sed之间有什么区别?sed和awk工具适用于哪些类型的应用场景?sed是一种流编辑器。它按行处理字符流。它有一个简单的编程语言,包括类似goto的循环和简单的条件语句(除了模式匹配和地址匹配)。它实际上......
  • C++实现一键关闭桌面
    方法一:C++关闭桌面,explorer.exe#include<Windows.h>#include<TlHelp32.h>#include"resource.h"#pragmawarning(disable:4996)voidtaskkill(constchar*name){ HANDLEinfo_handle=CreateToolhelp32Snapshot(TH32CS_SNAPPROCESS,0);//拍摄系统中所有进......
  • panabit关闭硬件bypass
    panabit关闭硬件bypass使bypass可以当作网口正常使用机型panabit企业版,中间2个接口是硬件bypass的版本。步骤:1,接上显示器进入bios  2,CHipset3,South br bridge configuration4,After PowerOFF 5,Bypass1,bypass2关闭6,F10保存重启看效果如图 ......
  • 80端口被占用,如何关闭占用80端口的服务?
    要关闭占用80端口的服务,你可以按照以下步骤进行操作:1.确定哪个进程占用了80端口:运行以下命令来查找占用了80端口的进程的信息(在大多数Linux系统上可用):sudolsof-i:80这将显示占用80端口的进程的详细信息,包括进程ID(PID)和进程名称。2.结束占用80端口的进程:使用......
  • 网页端口80端口被占用,如何关闭占用80端口的服务?
    如果你的网页服务器监听了80端口并被占用,你可以按照以下步骤来关闭占用80端口的服务:1.确定占用80端口的进程:首先,需要找到占用80端口的进程。你可以在Windows上使用命令提示符或PowerShell,或在Linux上使用终端运行以下命令:在Windows上:netstat-ano|findstr:80在Linux上:......
  • Linux关闭防火墙命令
    1:查看防火状态systemctlstatusfirewalldservice iptables status2:暂时关闭防火墙systemctlstopfirewalldservice iptables stop3:永久关闭防火墙systemctldisablefirewalldchkconfigiptablesoff4:重启防火墙systemctlenablefirewalldserviceiptablesrestart ......
  • IDEA 关闭SpringBoot启动Logo/图标
     一、环境1、SpringBoot2.6.4 MavenPOM格式<parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.6.4</version><relativePath/></par......
  • 记录一次报错,程序启动,MySql自动关闭
    关于初级程序员,对于安装mysql,以及配置可能会报几次错有时候虽然进行第二次安装成功,但是第一次的残留文件还在,可能引起报错在这里记录一次我的报错程序启动导致Mysql自动断开,需要手动打开1、打开任务管理器,打开详细信息,发现界面有两个mysqld.exe如果你是使用单程序连接,或者你......
  • Windows Server 2012/2016关闭自动更新(cmd命令方法)
    WindowsServer2012/2016关闭自动更新(cmd命令方法)使用场景:  WindowsServer中,默认开启自动更新,但服务器系统在正常运行时,常会受到更新干扰,更新系统后偶尔发现有些功能会出现异常,所以需要禁止自动更新,改为手动更新。步骤1:进入cmd,之后输入sconfig回车 S步骤2:输入5选......