首页 > 编程语言 >3.4 朴素贝叶斯算法

3.4 朴素贝叶斯算法

时间:2023-06-10 19:22:16浏览次数:35  
标签:概率 算法 贝叶斯 3.4 train test import sklearn

1 什么是朴素贝叶斯算法

image
image

2 概率基础

2.1 概率(Probability)定义

概率定义为一件事情发生的可能性
扔出一个硬币,结果头像朝上
某天是晴天
P(X) : 取值在[0, 1]

2.2 女神是否喜欢计算案例

在讲这两个概率之前我们通过一个例子,来计算一些结果:
image
问题:一直小明是产品经理,体重超重,问她会不会别女神喜欢(二分类问题)
1、女神喜欢的概率?
p(4/7)
2、职业是程序员并且体型匀称的概率?
p(程序员,匀称)=1/7
3、在女神喜欢的条件下,职业是程序员的概率?
p(程序员|喜欢)=1/2
4、在女神喜欢的条件下,职业是产品,体重是超重的概率?
p(程序员,超重|喜欢)=1/4

2.3 条件概率与联合概率

联合概率:包含多个条件,且所有条件同时成立的概率
记作:P(A,B)
特性:P(A, B) = P(A)P(B)
条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率
记作:P(A|B)
特性:P(A1,A2|B) = P(A1|B)P(A2|B)

3.贝叶斯公式

特征与特征之间相互独立也就是p(AB)=p(A)*p(B)
image
image
公式分为三个部分:

P(C):每个文档类别的概率(某文档类别数/总文档数量)
P(W│C):给定类别下特征(被预测文档中出现的词)的概率
计算方法:P(F1│C)=Ni/N (训练文档中去计算)
Ni为该F1词在C类别所有文档中出现的次数
N为所属类别C下的文档所有词出现的次数和
P(F1,F2,…) 预测文档中每个词的概率
如果计算两个类别概率比较:

image

3.2 文章分类计算

假设我们从训练数据集得到如下信息
image

科技:P(科技|影院,支付宝,云计算) = 

标签:概率,算法,贝叶斯,3.4,train,test,import,sklearn
From: https://www.cnblogs.com/lipu123/p/17471648.html

相关文章

  • 处理机典型调度算法
    日志返回日志列表处理机典型调度算法 编辑于 2023-2-1008:56 阅读(0)赞评论转载分享复制地址编辑上一篇 | 下一篇:元,角,分,厘,... 开通黄钻处理机典型调度算法 处理机典型调度算法 1.先来先服务算法作业调度、进程调度先来的......
  • 操作系统常用算法
    操作系统常用算法发布于2018-08-1713:16:23阅读 1.2K0 作业调度算法介绍:又称为高级调度或长程调度,调度对象是作业。根据作业控制块(JCB)中的信息,审查系统能否满足用户作业的资源需求,以及按照一定的算法,从外存的后备队列中选取某些作业调入内存,并为他们创建进程、分配......
  • 常用调度算法 总结
    常用调度算法总结 常用调度算法总结 1常见的批处理作业调度算法 1.1先来先服务调度算法(FCFS): 就是按照各个作业进入系统的自然次序来调度作业。这种调度算法的优点是实现简单,公平。其缺点是没有考虑到系统中各种资源的综合使用情况,往往使短作业的用户不满......
  • (进程管理)05.进程的调度算法
    (进程管理)05.进程的调度算法 进程调度,就是绪状态的进程获得CPU的使用权,进程由就绪状态转变成运行状态。进程调度可以分为:抢占式系统会根据进程的优先级高低来进行调度,进程之间可以插队非抢占式系统按照先来先服务的方式来调度,进程间不能插队进程调度算法有很多,......
  • 算法刷题记录:P1328 [NOIP2014 提高组] 生活大爆炸版石头剪刀布
    题目链接https://www.luogu.com.cn/problem/P1328题目分析是一道和环有关的问题,直接模拟即可AC代码//Problem:P1328[NOIP2014提高组]生活大爆炸版石头剪刀布//Contest:Luogu//URL:https://www.luogu.com.cn/problem/P1328//MemoryLimit:125MB//TimeLimit......
  • DES加密算法及Python实现
    一、DES加密算法原理DES加密算法是一种对称密钥的块加密算法,1976年成为美国联邦标准。其加密流程如下:密钥的生成:将64位密钥按照置换选择1表进行置换,得到56位的密钥,并分成左右两部分各28位。然后使用16个不同的演算法对密钥进行处理,生成16个48位子密钥。明文分组:将明文分成64位的块,......
  • Python+sklearn使用DBSCAN聚类算法案例一则
    DBSCAN聚类算法概述:DBSCAN属于密度聚类算法,把类定义为密度相连对象的最大集合,通过在样本空间中不断搜索最大集合完成聚类。DBSCAN能够在带有噪点的样本空间中发现任意形状的聚类并排除噪点。DBSCAN算法不需要预先指定聚类数量,但对用户设定的参数非常敏感。当空间聚类的密度不均匀、......
  • Python+sklearn使用支持向量机算法实现数字图片分类
    关于支持向量机的理论知识,大家可以查阅机器学习之类的书籍或网上资源,本文主要介绍如何使用Python扩展库sklearn中的支持向量机实现数字图片分类。1、首先编写代码生成一定数量的含有数字的图片上面代码运行会生成80000张含有数字0到9的图片,并加入随机干扰,交换相邻两个像素的颜色。......
  • 算法刷题记录:P4924 [1007]魔法少女小Scarlet
    题目链接https://www.luogu.com.cn/problem/P4924题目分析题意为将以[x,y]为中心某个矩阵,逆时针/顺时针旋转。所以其本质就是矩阵的旋转,所以找出通项公式即可。通项公式:顺时针:x后=x+y-y原,y后=y-x+x原逆时针:x后=x-y+y原,y后=x+y-x原AC代码//Problem:P4924[1007]魔法少......
  • Python+sklearn使用逻辑回归算法预测期末考试能否及格
    封面图片:《Python程序设计实验指导书》,董付国编著,清华大学出版社=================虽然名字中带有“回归”二字,但实际上逻辑回归是一个用于分类的线性模型,通常也称作最大熵分类或对数线性分类器。在该模型中,描述单个可能输出结果的概率通过一个逻辑函数进行建模。逻辑回归的因变量......