首页 > 其他分享 >贝叶斯学习及共轭先验

贝叶斯学习及共轭先验

时间:2023-05-31 23:38:13浏览次数:39  
标签:似然 概率 贝叶斯 Beta 先验 先验概率 共轭


今天的主要任务是来理解共轭先验以及贝叶斯学习。最近在研究主题模型,里面用到了一些,另外在机器学习中,贝叶斯学习是重要的一个方向,所以有必要学习和掌握。



Contents


   1. 贝叶斯学习

   2. Beta分布及共轭先验

 

 

1. 贝叶斯学习

 

   首先,我从最简单的硬币投掷开始。现在给你一个硬币,假设有

贝叶斯学习及共轭先验_二项分布

的概率为正面朝上,那么有

贝叶斯学习及共轭先验_先验概率_02

的概率是背   面朝上,那么如果在5次投掷过程中,有3次是正面朝上,那么这个

贝叶斯学习及共轭先验_二项分布

最可能是多少呢?


   凭着直观感觉,我们可能会认为是3/5,当然这是根据统计规律得到的结论。那么实际上这是一个二项分布,即

   重复n次的伯努利实验。由上述所述,很容易知道其概率表示如下


        

贝叶斯学习及共轭先验_后验概率_04


   我们需要这个概率尽量大,那么最终解得

贝叶斯学习及共轭先验_二项分布

的值为3/5。函数图像如下


       

贝叶斯学习及共轭先验_二项分布_06


   但是,我们想象一下,如果在5次投掷过程中,5次都正面朝上,那岂不是得到

贝叶斯学习及共轭先验_二项分布

的估计值是1? 很明显这种情   况得到的估计值不合理。为了避免这种“黑天鹅事件”的发生,需要将

贝叶斯学习及共轭先验_二项分布

值降低一些才能看似更符合常理,那么

   我们只需要乘上另一个小于1的概率值就可以达到了。到了这里贝叶斯公式横空出世!如下


           

贝叶斯学习及共轭先验_二项分布_09


    其中

贝叶斯学习及共轭先验_后验概率_10

叫做先验概率

贝叶斯学习及共轭先验_二项分布_11

叫做似然概率先验概率是对似然概率的一种补充,如上述的掷硬币。而    后验概率

贝叶斯学习及共轭先验_后验概率_12

正比于似然概率和先验概率的乘积。



2. Beta分布及共轭先验


   还是以掷硬币为例,我们已经知道了后验概率正比于似然概率和先验概率的乘积。那么在掷硬币实验中,硬币的

   朝向服从伯努利分布,在一系列投掷过程中,假设有

贝叶斯学习及共轭先验_二项分布_13

次正面朝上,有

贝叶斯学习及共轭先验_先验概率_14

次背面朝上,那么似然概率为


         

贝叶斯学习及共轭先验_后验概率_15


    现在已经得到了似然概率的形式了,那么如何确定先验概率呢?从理论上来说,任何一个在区间[0, 1]上的分

    布函数都符合条件,但是为了更方便地简化计算,最理想的情况就是让先验分布和似然分布有相同的形式,即


         

贝叶斯学习及共轭先验_后验概率_16


    如果先验分布是这样的形式,那么计算先验概率和似然概率的乘积就很方便了,只需要将指数相加即可。幸运

    的是,有一个很常见的分布恰好满足这个条件,它就是Beta分布。如下


         

贝叶斯学习及共轭先验_先验概率_17


    其中

贝叶斯学习及共轭先验_先验概率_18

Gamma函数现在根据先验概率、似然概率和贝叶斯公式来推导后验概率。推导过程如下


         

贝叶斯学习及共轭先验_后验概率_19

          

    在上述中,先验概率叫做似然概率的共轭先验。所谓共轭就是指这两个概率分布具有相同的形式。


    最后推荐一些好文章!


    一. Beta分布与二项分布的公式原理推导

Beta分布与其共轭先验的介绍

    三. 多项式分布及Beta分布的期望计算



标签:似然,概率,贝叶斯,Beta,先验,先验概率,共轭
From: https://blog.51cto.com/u_16146153/6391029

相关文章

  • 系数矩阵为Hessian矩阵时的使用Pearlmutter trick的共轭梯度解法
    共轭梯度法已经在前文中给出介绍:python版本的“共轭梯度法”算法代码  =======================================  使用共轭梯度法时,如果系数矩阵为Hessian矩阵,那么我们可以使用Pearlmuttertrick技术来减少计算过程中的内存消耗,加速计算。 使用Pearlmuttertrick的......
  • python版本的“共轭梯度法”算法代码
    在看代码的过程中遇到了共轭梯度法这个概念,对这个算法的数学解释看过几遍,推导看过了,感觉懂了,然后过上一些日子就又忘记了,然后又看了一遍推导,然后过了一些日子也就又忘记了,最后想想这个算法的数学解释就不要再取深究了,毕竟平时也不太会用到,偶尔用到了只要保证代码会写也就OK了。 ......
  • 使用LSTM做电影评论负面检测——使用朴素贝叶斯才51%,但是使用LSTM可以达到99%准确度
     基本思路:每个评论取前200个单词。然后生成词汇表,利用词汇index标注评论(对每条评论的前200个单词编号而已),然后使用LSTM做正负评论检测。embedding层本质上是word2vec!!!在进行数据降维,但是不是所有的LSTM都需要这个,比如在图像检测mnist时候,就没有这层!importtensorflowastffromt......
  • 第五课 朴素贝叶斯算法
       朴素贝叶斯算法是机器学习中目前一个还在使用的算法,其依托于贝叶斯公式的概率计算,可用于NLP等分类任务。朴素贝叶斯算法的朴素,是因为其有2个较强或较主观的前提假设:样本间的特征(属性)是相互独立的样本特征(属性)取值服从高斯(正态)分布   由于自然界的数据分......
  • 贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
    原文链接:http://tecdat.cn/?p=22702最近我们被客户要求撰写关于贝叶斯分位数回归的研究报告,包括一些图形和统计输出。贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯摘要还包括总结结果、......
  • MATLAB实验四:共轭梯度法程序设计
    一、实验目的掌握共轭梯度法的基本思想及其迭代步骤;学会运用MATLAB编程实现常用优化算法;能够正确处理实验数据和分析实验结果及调试程序。二、实验内容 (1)求解无约束优化问题:minf(x)=100(x1^2-x2)^2+(x1-1)^2,x∈R;(2)终止准则取||f(x^k)||<=10^-5,搜索方法采用非精确搜索Armijo;......
  • 机器学习(八):贝叶斯网络——福尔摩斯推理、草地喷水器推断
    实验4贝叶斯网络一、预备知识二、实验目的掌握贝叶斯网络算法的原理及设计;掌握利用贝叶斯网络算法解决推理分析。三、实验内容福尔摩斯先生在办公室接到了他邻居华生的电话P(W=T)。华生告诉他:他的家里可能进了窃贼P(B=T),因为他家的警铃响了P(A=T)被告......
  • R语言中的Stan概率编程MCMC采样的贝叶斯模型|附代码数据
    原文链接:http://tecdat.cn/?p=11161最近我们被客户要求撰写关于贝叶斯模型的研究报告,包括一些图形和统计输出。概率编程使我们能够实现统计模型,而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用R语言中RStan贝叶斯层次模型分析示例stan简介Stan是用于贝叶斯推理......
  • 视频课程|R语言bnlearn包:贝叶斯网络的构造及参数学习的原理和实例
    全文链接:http://tecdat.cn/?p=32462原文出处:拓端数据部落公众号分析师:ChangZhang贝叶斯网络(BN)是一种基于有向无环图的概率模型,它描述了一组变量及其相互之间的条件依赖性。贝叶斯网络在信息不完备的情况下通过可以观察随机变量推断不可观察的随机变量,对于解决复杂的不确定性和......
  • r语言使用rjags R2jags建立贝叶斯模型|附代码数据
    全文下载链接:http://tecdat.cn/?p=2857最近我们被客户要求撰写关于贝叶斯的研究报告,包括一些图形和统计输出。本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响,并且对比rjagsR2jags和内置贝叶斯预测函数的结果读取数据se......