首页 > 其他分享 >1.6 - 朴素贝叶斯及概率图模型

1.6 - 朴素贝叶斯及概率图模型

时间:2024-04-03 17:02:36浏览次数:25  
标签:1.6 概率 模型 贝叶斯 马尔可夫 类别 朴素

1. 模型理念

  利用 条件概率&全概率公式,由果推因,从已知的某个现象特征求得目标属性的方法。

所谓朴素:概率求解的过程中,假设数据特征之间是互相独立的,联合概率可以直接概率密度相乘。

2. 模型构建及特性

2.1 模型推理以及训练参数

  由 条件概率公式 可以得知,在已知数据的各项特征前提下,求解当前数据的所属类别,只需要求解:数据集中  各个类别的概率P(yi) & 各个特征值的类别条件概率P(xi=a|y=yi) 即可得到当前数据所属各个类别概率的大小。而这也是朴素贝叶斯模型在 fit 过程中需要计算的内容。由此,【朴素贝叶斯模型是天然的多分类模型。

  1)高斯朴素贝叶斯:当数据的某个特征值连续且符合高斯分布时,该项特征的类别条件概率可直接用对应的高斯概率公式计算。

  2)伯努利朴素贝叶斯:当 ....

  3)多项式朴素贝叶斯:数据的某个特征服从多项分布,可将类别数据占比看作概率。

2.2 平滑项

  朴素贝叶斯模型在 fit 的过程,会统计数据集中的 所有类别和每个特征的所有特征值,【为了防止特征的某个特征值只在部分类别中存在导致对应的特征值类别条件概率为0的情况】,会对所有先验概率的求解过程引入平滑项λ,当 λ=1 时,称 拉普拉斯平滑。 

3. 概率图模型

  对于一些分类任务,如:标注句子单次的词性,词性判断需要联合上下文判断,数据之间不是互相孤立的。对于 存在着相关关系的非独立的特征,可用 概率图模型来解决,常见的概率图模型:贝叶斯网络,马尔科夫链。

3.1 贝叶斯网络

  贝叶斯网络中,节点表示随机变量,→ 表示因果关系,多个随机变量的联合概率:.....

贝叶斯网络是一个 有向无环图,如:学生网络等。

3.2 马尔科夫链

  马尔可夫性质:随机过程在某一时刻的状态 St 只和它前一时刻的状态有关,而和更前面的所有时刻的状态没有关系。虽然自然界很多现象并不符合马尔可夫性质,但是我们可以假设符合这个性质,这就为很多时序问题如:语音识别,视频处理、NLP等很多无解的问题提供了一种解法。

  马尔可夫过程:符合马尔可夫性质的随机过程。

3.3 隐马尔可夫

  假设随机过程中的状态无法被直接观测到,但是每个状态都有一个只和状态相关的输出,我们可以通过输出来间接得到此时的状态,称为:隐马尔可夫。

如:赌场老千换骰子模型。对应的骰子的状态不可直接观测,但是可以通过统计对应的点数出现概率得到对应的状态。

 

标签:1.6,概率,模型,贝叶斯,马尔可夫,类别,朴素
From: https://www.cnblogs.com/zhangzhenw/p/18112839

相关文章

  • 32万7950=假设一个120kw的直流充电桩,请问根据常规使用率和电价,一年之内它能赚取多少收
    为了估算一个120kW直流充电桩一年的收入,我们需要做一些假设。以下是一些可能的假设值:充电费率:假设每千瓦时(kWh)电能的价格为0.5元至1.5元不等,具体取决于地区和电力供应商。常规使用率:假设充电桩每天工作10小时,即一年工作天数为365天。运营时间:假设充电桩全年无休,每天24......
  • #私藏项目实操分享# Java实现基于朴素贝叶斯的情感词分析
    另外,在贝叶斯公式的基础上进行变形,可以得到下面的公式:$$P(B_i|A)=\frac{P(B_i)P(A|B i)}{\sum {j=1}^nP(B_j)P(A|B_j)}$$其中 B1,B2,…,Bj 是一个完备事件组,上面的公式可以表示在事件A已经发生的条件下,寻找导致A发生的各种“原因”的 Bi 的概率。朴素贝叶斯......
  • R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可
    全文链接:https://tecdat.cn/?p=35518原文出处:拓端数据部落公众号在统计建模过程中,经常会遇到空间自相关性的问题。空间自相关性是指相近位置的观测值往往比远离位置的观测值更相似。在尝试估计参数或进行预测时,空间自相关性可能会导致结果产生偏差。INLA(IntegratedNestedLapla......
  • 1.6.1 变换
    我们要想改变物体的位置,现有解决办法是,每一帧改变物体的顶点并且重配置缓冲区从而使物体移动,但是这样太繁琐,更好的解决方式是使用矩阵(Matrix)来更好的变换(Transform)一个物体。一、向量向量是有方向的量,向量有一个方向(Direction)和大小(Magnitude,也叫强度或长度)。......
  • 【机器学习】贝叶斯上篇(详解)
    深入理解贝叶斯学习:核心原理及应用全解析在机器学习的领域内,贝叶斯学习作为一种强大的框架,使我们能够在不确定性条件下进行预测和决策。贝叶斯学习源于托马斯·贝叶斯的工作,提供了一种概率论的学习方法,与传统的频率统计学提供了不同的视角。本文将深入探讨贝叶斯学习的核心原......
  • 100天精通风控建模(原理+Python实现)——第23天:风控建模中的贝叶斯优化是什么?怎么实现
    在当今风险多变的环境下,风控建模已经成为金融机构、企业等组织的核心工作之一。在各大银行和公司都实际运用于业务,用于营销和风险控制等。本文以视频的形式阐述风控建模中的召回率是什么,怎么实现。并提供风控建模原理和Python实现文章清单。  之前已经阐述了100天精通风......
  • 【机器学习-08】参数调优宝典:网格搜索与贝叶斯搜索等攻略
    超参数是估计器的参数中不能通过学习得到的参数。在scikit-learn中,他们作为参数传递给估计器不同类的构造函数。典型的例子有支持向量分类器的参数C,kernel和gamma,Lasso的参数alpha等。​在超参数集中搜索以获得最佳crossvalidation交叉验证分数的方法是可实现并且推荐的......
  • DBO优化朴素贝叶斯分类预测(matlab代码)
    DBO-朴素贝叶斯分类预测matlab代码蜣螂优化算法(DungBeetleOptimizer,DBO)是一种新型的群智能优化算法,在2022年底提出,主要是受蜣螂的的滚球、跳舞、觅食、偷窃和繁殖行为的启发。数据为Excel分类数据集数据。数据集划分为训练集、验证集、测试集,比例为8:1:1模块化结构:代......
  • 1.6.2 ACM-ICPC技巧 分段打表
    1.6.2ACM-ICPC技巧分段打表在编程竞赛,特别是ACM-ICPC这样的顶级赛事中,参赛者往往需要掌握各种算法和技巧来解决复杂的问题。分段打表技巧是解决一些特定问题的有效方法之一,它可以在一定程度上减少算法的运行时间,提高解题效率。本节将详细介绍分段打表技巧的概念、应用场景......
  • 多项式朴素贝叶斯分类器
    在这篇文章中,我们介绍多项式朴素贝叶斯分类器是如何工作的,然后使用scikit-learn作为实际工作的示例来介绍如何使用。与假设高斯分布的高斯朴素贝叶斯分类器相反,多项式朴素贝叶斯分类器依赖于多项分布。通过学习/估计每个类的多项概率来“拟合”多项式分类器-使用平滑技巧来处理......