首页 > 其他分享 >人工智能之机器学习基础——贝叶斯(Bayesian Methods)

人工智能之机器学习基础——贝叶斯(Bayesian Methods)

时间:2024-11-20 18:41:52浏览次数:1  
标签:概率 后验 Methods 贝叶斯 分类器 类别 晴天 Bayesian

贝叶斯分类器

贝叶斯分类器是一类基于贝叶斯定理的统计学习方法,广泛应用于分类问题。其核心思想是通过计算后验概率 P(y∣x),将输入样本 x 分类到具有最大后验概率的类别。

1. 贝叶斯定理

贝叶斯定理是概率论中的基本法则,用于描述条件概率的关系:

 

其中:

  • P(y∣x):在已知 x的情况下,y 属于某类的概率(后验概率);
  • P(x∣y):在已知 y 属于某类的情况下,x 出现的概率(似然函数);
  • P(y):y 属于某类的概率(先验概率);
  • P(x):x 出现的概率(证据)。

2. 贝叶斯分类器的思想

目标

对于一个输入样本 x,分类器通过计算每个类别的后验概率 P(y∣x),选择后验概率最大的类别:

通过贝叶斯定理展开:

 由于 P(x) 对所有类别相同,只需比较 P(x∣y)的大小。

贝叶斯分类器的假设

  • 朴素贝叶斯分类器假设特征条件独立:

 

3. 贝叶斯分类器的步骤

  1. 计算先验概率 P(y)

    • 统计每个类别在数据集中的频率。
  2. 计算条件概率 P(xi∣y)

    • 对于每个类别 y,计算每个特征 xi 在类别 y下的条件概率。
  3. 计算后验概率 P(y∣x)

    • 将 P(x∣y) 结合,计算后验概率。
  4. 分类决策

    • 选择最大后验概率的类别。

 

4. 示例

4.1 问题描述

假设我们有以下训练数据,目标是根据天气和风速预测是否适合运动。

天气风速是否适合运动
晴天
晴天
多云
雨天
雨天
多云

目标是预测样本 x=(晴天,弱)是否适合运动。

4.2 步骤

(1) 计算先验概率 P(y)
  • 类别“是”的样本数:4;
  • 类别“否”的样本数:2;
  • 总样本数:6。

    P(是)=4/6​=0.667,P(否)=2/6​=0.333

(2) 计算条件概率 P(x∣y)

P(晴天∣是):

  • 在类别“是”中,天气为“晴天”的样本有 1 个;
  • 在类别“是”中总共有 4 个样本;

    P(晴天∣是)=1/4=0.25

  • P(晴天∣否):

    • 在类别“否”中,天气为“晴天”的样本有 1 个;
    • 在类别“否”中总共有 2 个样本;
      P(晴天∣否)=1/2=0.5
  • P(弱∣是):

    • 在类别“是”中,风速为“弱”的样本有 3 个;
    • 在类别“是”中总共有 4 个样本;
      P(弱∣是)=3/4=0.75
  • P(弱∣否):

    • 在类别“否”中,风速为“弱”的样本有 0 个;
      P(弱∣否)=0/2=0
 
(3) 计算后验概率 P(y∣x)

对于类别“是”:

P(是∣晴天,弱)∝P(晴天∣是)⋅P(弱∣是)⋅P(是)
P(是∣晴天,弱)∝0.25⋅0.75⋅0.667=0.125

对于类别“否”:

P(否∣晴天,弱)∝P(晴天∣否)⋅P(弱∣否)⋅P(否)
P(否∣晴天,弱)∝0.5⋅0⋅0.333=0
(4) 分类决策
P(是∣晴天,弱)=0.125>P(否∣晴天,弱)=0

因此,样本 x=(晴天,弱)的预测结果是“是”。

The symbol "∝" represents proportionality in mathematics. When you see a∝b, it means that a is proportional to bbb, or a=k⋅ba = k \cdot ba=k⋅b, where kkk is a constant of proportionality.

For example:

  • If F∝x, then F=kx for some constant kkk.
  • Proportionality often indicates that as one variable changes, the other changes in a consistent way (e.g., doubling b will double a if a∝ba ).

5. 优缺点

优点

  1. 简单高效:计算简单,适合大规模数据。
  2. 易于解释:基于概率,结果直观。
  3. 适合离散数据:对于类别型特征表现良好。

缺点

  1. 条件独立性假设:假设特征条件独立,在实际问题中可能不成立。
  2. 零概率问题:如果某个条件概率为零,会导致整体概率为零(可通过平滑解决)。
  3. 对连续特征不够友好:需要额外处理(如用高斯分布拟合)。

6. 常见应用

  • 文本分类(如垃圾邮件过滤)。
  • 医学诊断。
  • 客户分类和信用风险评估。

贝叶斯分类器以其简洁高效的特点,成为机器学习中的重要基础方法之一,特别是在特征独立性假设近似成立的场景中表现突出。

标签:概率,后验,Methods,贝叶斯,分类器,类别,晴天,Bayesian
From: https://www.cnblogs.com/zhoushusheng/p/18558993

相关文章

  • 【机器学习】朴素贝叶斯算法
    目录什么是朴素贝叶斯算法?算法引入 贝叶斯定理朴素贝叶斯分类器工作原理优缺点应用场景实现示例基本步骤:在机器学习的世界里,朴素贝叶斯算法以其简单性和高效性而著称。尽管它的名字听起来有点复杂,但实际上它是一种基于概率论的简单分类算法。今天,我们就来深入了解......
  • R语言贝叶斯分析:INLA 、MCMC混合模型、生存分析肿瘤临床试验、间歇泉喷发时间数据应用
    全文链接:https://tecdat.cn/?p=38273原文出处:拓端数据部落公众号多模态数据在统计学中并不罕见,常出现在观测数据来自两个或多个潜在群体或总体的情况。混合模型常用于分析这类数据,它利用不同的组件来对数据中的不同群体或总体进行建模。本质上,混合模型是几个代表不同潜在总体的......
  • 贝叶斯网络——基于概率的图模型(详解)
            贝叶斯网络(BayesianNetwork,简称BN)是一种基于概率图模型的表示方法,用于表示变量之间的依赖关系,并通过条件概率推断变量间的关系。它通过有向无环图(DAG)来描述变量之间的依赖关系,其中每个节点表示一个随机变量,边表示变量之间的条件依赖关系。 基本概念有向无......
  • 11.13机器学习_贝叶斯和决策树
    八朴素贝叶斯分类1贝叶斯分类理论假设现在我们有一个数据集,它由两类数据组成,数据分布如下图所示:我们现在用p1(x,y)表示数据点(x,y)属于类别1(图中红色圆点表示的类别)的概率,用p2(x,y)表示数据点(x,y)属于类别2(图中蓝色三角形表示的类别)的概率,那么对于一个新数据点(x......
  • Statistical Computing and Empirical Methods
    SummativeAssessmentStatisticalComputingandEmpiricalMethods,TeachingBlock1,2024ntroductionisdocumentcontainsthespecificationforthesummativeassessmentfortheunitStatisticalComputingndEmpiricalMethods,TB12024.Pleasereadcareful......
  • 基于MCMC的贝叶斯营销组合模型评估方法论: 系统化诊断、校准及选择的理论框架
    贝叶斯营销组合建模(BayesianMarketingMixModeling,MMM)作为一种先进的营销效果评估方法,其核心在于通过贝叶斯框架对营销投资的影响进行量化分析。在实践中为确保模型的可靠性和有效性,需要系统地进行模型诊断、分析和比较。本文将重点探讨这些关键环节,包括:通过后验预测检验评估......
  • Bayes-CNN-BiGRU-Att贝叶斯算法-卷机网络-双向门控循环单元-注意力机制多特分类预测 M
    %*****************************************************************************************************************************************************************************************************************%%清空环境变量warningoff%关闭报警......
  • BO-CNN-LSTM回归预测 | MATLAB实现BO-CNN-LSTM贝叶斯优化卷积神经网络-长短期记忆网络
    BO-CNN-LSTM回归预测|MATLAB实现BO-CNN-LSTM贝叶斯优化卷积神经网络-长短期记忆网络多输入单输出回归预测目录BO-CNN-LSTM回归预测|MATLAB实现BO-CNN-LSTM贝叶斯优化卷积神经网络-长短期记忆网络多输入单输出回归预测效果一览基本介绍模型搭建程序设计参考资料......
  • 贝叶斯统计中常见先验分布选择方法总结
    在贝叶斯统计中,选择合适的先验分布是一个关键步骤。本文将详细介绍三种主要的先验分布选择方法:经验贝叶斯方法信息先验无信息/弱信息先验经验贝叶斯方法经验贝叶斯方法是一种最大似然估计(MLE)方法,通过最大化先验分布下数据的边际似然来估计先验分布的参数。设X表示数据......
  • computed 计算属性 vs methods 方法区别
    computed计算属性:更侧重于业务作用:封装了一段对于数据的处理,求得一个结果,语法:①写在computed配置项中②作为属性,直接使用→this.计算属性{{计算属性}}methods方法:更侧重于业务作用:给实例提供一个方法,调用以处理业务逻辑语法:①写在methods配置项......