sklearn应用朴素贝叶斯算法

时间：2024-07-28 18:25:53浏览次数：17

假设一个学校有 45% 的男生和 55% 的女生，学校规定不能穿奇装异服，男生的裤子只能穿长筒裤，而女生可以穿裙子或者长筒裤，已知该学校穿长筒裤的女生和穿裙子的女生数量相等，所有男生都必须穿长筒裤，请问如果你从远处看到一个穿裤子的学生，那么这个学生是女生的概率是多少？

看完上述问题，你是不是已经很快的计算出了结果呢？还是丈二和尚，摸不到头脑呢？下面我们一起来分析一下，我们根据贝叶斯公式，列出要用到的事件概率：

学校女生的概率：P(女生)= 0.55
女生中穿裤子的概率：P(裤子|女)= 0.5
学校中穿裤子的概率：P(裤子)= 0.45 + 0.275= 0.725

知道了上述概率，下面使用贝叶斯公式求解 P(女生|裤子) 的概率：

P(女|裤子) = P(裤子|女生) * P(女生) / P(裤子) = 0.5 * 0.55 / 0.725 = 0.379

利用上述公式就计算除了后验概率 P(女生|裤子) 的概率，这里的 P(女生) 和 P(裤子)叫做先验概率，而 P(裤子|女生) 就是我们经常提起的条件概率“似然度”。

sklearn实现朴素贝叶斯

在 sklearn 库中，基于贝叶斯定理的算法集中在 sklearn.naive_bayes 包中，根据对“似然度 P(xi|y)”计算方法的不同，我们将朴素贝叶斯大致分为三种：多项式朴素贝叶斯（MultinomialNB）、伯努利分布朴素贝叶斯（BernoulliNB)、高斯分布朴素贝叶斯（GaussianNB）。另外一点要牢记，朴素贝叶斯算法的实现是基于假设而来，在朴素贝叶斯看来，特征之间是相互独立的，互不影响的。

高斯朴素贝叶斯适用于特征呈正态分布的，多项式贝叶斯适用于特征是多项式分布的，伯努利贝叶斯适用于二项分布。

1) 算法使用流程

使用朴素贝叶斯算法，具体分为三步：

统计样本数，即统计先验概率 P(y) 和似然度 P(x|y)。
根据待测样本所包含的特征，对不同类分别进行后验概率计算。
比较 y1，y2，...yn 的后验概率，哪个的概率值最大就将其作为预测输出。

2) 朴素贝叶斯算法应用

下面通过鸢尾花数据集对朴素贝叶斯分类算法进行简单讲解。如下所示：

#鸢尾花数据集
from sklearn.datasets import load_iris
#导入朴素贝叶斯模型，这里选用高斯分类器
from sklearn.naive_bayes import GaussianNB
#载入数据集
X,y=load_iris(return_X_y=True)
bayes_modle=GaussianNB()
#训练数据
bayes_modle.fit(X,y)
#使用模型进行分类预测
result=bayes_modle.predict(X)
print(result)
#对模型评分
model_score=bayes_modle.score(X,y)
print(model_score)

输出结果：

预测分类：
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1
1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 1 2 2 2 2
2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2]
模型评分：
0.96

标签：概率,女生,bayes,贝叶斯,算法,朴素,裤子,sklearn
From： https://blog.csdn.net/weixin_66519663/article/details/140679596

决策树分类算法（if-else原理）
决策树算法在“决策”领域有着广泛的应用，比如个人决策、公司管理决策等。其实更准确的来讲，决策树算法算是一类算法，这类算法逻辑模型以“树形结构”呈现，因此它比较容易理解，并不是很复杂，我们可以清楚的掌握分类过程中的每一个细节。if-else原理想要认识“决策树算法”我们不妨......
算法-排序算法
一、算法和算法分析什么是算法：对特定问题的求解步骤的一种描述，它是指令的有限序列，其中每一条指令表示一个或多个操作。算法的五个重要特性：有穷性确定性可行性输入输出算法设计的要求：正确性可读性健壮性高效率与低存储算法效率的度量：算法的执行时间需要依......
CSP-S提高组数据结构算法模板大合集
CSP-S算法总结2.2.1基础知识与编程环境无2.2.2C++程序设计2set/nultisetmap/multimapdeque/priority_queueSTL2.2.3数据结构P1886 滑动窗口/【模板】单调队列#include<iostream>usingnamespacestd;intn,k,a[1000005];intq[1000005],h,t;......
C++和R穿刺针吸活检肿瘤算法模型模拟和进化动力学量化差异模型
......
从零开始学数据结构系列之第四章《克鲁斯卡尔算法应用场景-公交站问题》
文章目录往期回顾某城市新增7个站点(A,B,C,D,E,F,G)，现在需要修路把7个站点连通各个站点的距离用边线表示(权)，比如A–B距离12公里问：如何修路保证各个站点都能连通，并且总的修建公路总里程最短?以上图为例，来对克鲁斯卡尔进行演示(假设用数组R保存......
ssy暑假集训暴力算法学习笔记
7.28集训第六天今天t大学的学长peop1e来给我们讲课啦！人好帅呀嘿嘿嘿....内容如下模拟退火：定义模拟退火可以分成两个部分，一个是"模拟"，一个是"退火"，先介绍什么叫退火，贴一张百度百科的图吧：\(\\\)那这"退火"的定义有啥用吗？模拟退火就是用来模拟整个退火的过程(其实没啥相似......
算法笔记|Day10栈与队列II
算法笔记|Day10栈与队列II☆☆☆☆☆leetcode150.逆波兰表达式求值题目分析代码☆☆☆☆☆leetcode239.滑动窗口最大值题目分析代码☆☆☆☆☆leetcode347.前K个高频元素（待补充）题目分析代码☆☆☆☆☆leetcode150.逆波兰表达式求值题目链接：leetcode150.......
算法笔记|Day9栈与队列
算法笔记|Day9栈与队列☆☆☆☆☆leetcode232.用栈实现队列题目分析代码☆☆☆☆☆leetcode225.用队列实现栈题目分析代码☆☆☆☆☆leetcode20.有效的括号题目分析代码☆☆☆☆☆leetcode1047.删除字符串中的所有相邻重复项题目分析代码☆☆☆☆☆leetcod......
java的几种算法结构
顺序结构1.java的最基本的结构就是顺序结构除非特别指明,否则就按照顺序一句一句执行2.顺序结构是最简单的算法结构3.语句与语句之间.框与框之间是按从上到下的顺序进行的,他是由若干个依次执行的处理步骤组成的,它是任何算法的离不开的一种基本算法结构选择结构if单选择结构......
代码随想录算法训练营第25天 | 回溯问题完结
2024年7月27日题46.全排列继续回溯。classSolution{List<List<Integer>>res;List<Integer>path;int[]used;int[]nums;publicList<List<Integer>>permute(int[]nums){//用一个used存//0表示还没有用，1表示用了......

sklearn应用朴素贝叶斯算法

sklearn实现朴素贝叶斯

1) 算法使用流程

2) 朴素贝叶斯算法应用

相关文章

赞助商

阅读排行