首页 > 其他分享 >经典统计 与 贝叶斯统计介绍

经典统计 与 贝叶斯统计介绍

时间:2024-08-29 15:57:44浏览次数:14  
标签:似然 概率 后验 贝叶斯 经典 先验概率 阳性 统计

1. 经典统计

经典统计使用频率学派的方法,依赖于样本数据的频率分布进行推断。在经典统计中,参数被认为是固定但未知的,而推断过程主要是基于样本数据的统计性质进行。常见的经典统计方法包括置信区间、假设检验等。

思想:

从样本中 直接观察频率,然后通过该频率来估计总体的参数。

2. 贝叶斯统计

贝叶斯统计使用贝叶斯学派的方法,将参数看作是一个随机变量,并使用先验分布后验分布来进行推断。在贝叶斯统计中,参数的不确定性通过一个先验分布来表示,并通过样本数据更新为一个后验分布。常见的贝叶斯统计方法包括贝叶斯估计、贝叶斯因子等。

思想:

在先验的基础上,结合 “新数据”,给出未知参数。

优点:

在数据少的情况下可以进行推测,数据越多,推测越准确。对所获得的信息可以进行瞬时反应,自动升级的学习功能。

 1. 先验概率

        由 历史知因

先验概率是指在未考虑任何具体观测数据或新信息之前,对某个事件或假设发生的概率的估计。它是基于先前的经验、历史数据、专家判断或者其他背景知识来确定的概率。先验概率反映了我们对事件发生可能性的初始信念或不确定性。

例如:

测试在一次抛硬币实验时的正反面的概率:

在实验开始之前,我们无法给出其结果的概率分布,但是根据历史经验,我们假定正面向上的概率为 0.5, 这个就是先验概率

 2. 后验概率

 后验概率是在观察到某些数据或信息之后,对该事件或假设发生概率的修正后的估计。它是通过将先验概率与新的证据或数据相结合,利用贝叶斯定理计算得出的更新概率。后验概率更加反映实际情况,因为它考虑了新的证据影响。

例如:

对一个个体进行了测试并得到了阳性结果,那么根据这个测试结果以及已知该测试的灵敏度和特异性,可以计算出该个体实际患有该疾病的概率,这就是后验概率。

二者之间的区别与联系:

  • 先验概率是基于先前的经验、历史数据、专家判断或者其他背景知识来确定的概率。后验概率是在观察到某些数据或信息之后,对该事件或假设发生概率的修正后的估计。先验概率的计算较为简单,不涉及贝叶斯公式的使用。后验则需要使用贝叶斯。
  • 后验概率的计算依赖于先验概率,并且两者共同构成了贝叶斯统计推断的基础。通过贝叶斯公式,我们可以根据新的信息或数据对先验概率进行修正,得到更加准确的后验概率。

3. 似然概率

似然概率(likelihood probability)是指,在给定观测数据的条件下,所要推断的参数的取值出现的可能性。似然概率可以用来评估不同参数取值的可能性大小,并通过最大化似然概率来估计最有可能的参数取值。

似然概率与概率的区别在于,概率是在已知参数的情况下计算事件发生的概率,而似然概率则是在已知事件发生的情况下计算参数取值的可能性。

举个例子来说,假设有一枚硬币,我们想要估计它正面朝上的概率p。进行了10次独立的抛硬币的实验,结果有6次正面朝上。这里,似然概率是在已知有6次正面朝上的情况下,求p的取值可能性的函数。我们可以通过似然函数计算不同p取值下的似然概率,并找到使似然概率最大化的p值,从而估计硬币正面朝上的概率。

需要注意的是,似然概率本身并不是表示一个概率,因为它不一定满足概率的性质,例如总和为1。似然概率更多地用于参数估计和模型比较等统计推断中。

公式

公式:

                                                P(H|E) = \frac{P(E|H)*P(H)}{P(E)}

P(H)是先验概率,P(H|E)是后验概率,P(E|H)/P(E)被称为调整因子,先验概率乘以调整因子就得到后验概率。

H表示Hypothesis(假设),E表示Evidence(证据),贝叶斯定理的意义就在于,给定一个先验概率P(H),在出现了证据E的情况下,计算后验概率P(H|E)。

如果P(H)=0,则P(H|E)=0;如果P(H)=1,则P(E|H)=P(E),P(H|E)=1。

也就是说,如果先验概率为0%或100%,那么,无论出现任何证据E,都无法改变后验概率P(H|E)。这对我们看待世界的认知有重大指导意义,因为贝叶斯概率的本质是信念,通过一次次事件,我们可能加强某种信念,也可能减弱某种信念,但如果信念保持100%或0%,则可以做到对外界输入完全“免疫”。

 

公式推导

由                            P(A\cap B) = P(A|B) * P(B) = P(B|A) *P(A)

将左边的 P(A∩B) 去掉,则可得贝叶斯定理。

                                P(H|E) = \frac{P(E|H)*P(H)}{P(E)}

贝叶斯定理的另外一种表示

用P(H)表示H发生的概率,用H表示H不发生,P(H)表示H不发生的概率。显然P(\bar{H})=1-P(H)。

下图红色部分表示H,红色部分以外则表示H:

P(H)

事件E用绿色表示:

P(E)

可见,P(E)可以分为两部分,一部分是E和H的交集,另一部分是E和H的交集:

                                        P(E) = P(E∩H) + P(E∩\bar{H})

根据上文的公式P(A∩B)=P(A|B)xP(B),代入可得:

                                        P(E) = P(E∩\bar{H}) + P(E∩H)= P(E∣\bar{H})×P(\bar{H}) + P(E∣H)×P(H)

把P(E)替换掉,我们得到贝叶斯定理的另一种写法:

                                        P(H|E) = \frac{P(E|H)*P(H)}{P(E|H)*P(H) + P(E|\bar{H}) * P(\bar{H})}

用这个公式来计算,我们就不必计算P(E)了。

已知有一种疾病,发病率是0.1%。针对这种疾病的测试非常准确:

  • 如果有病,则准确率是99%(即有1%未检出阳性);
  • 如果没有病,则误报率是2%(即有2%误报为阳性)。

现在,如果一个人测试显示阳性,请问他患病的概率是多少?

  • P(E|H)表示患病时检测阳性的概率=99%;
  • P(H)表示患病的概率=0.1%;
  • P(E|H)表示没有患病但检测阳性的概率=2%;
  • P(H)表示没有患病的概率=1-P(H)=99.9%。

代入公式,计算:

                        P(H∣E)=99%×0.1%+2%×99.9%99%×0.1%​=0.04721=4.721%

假设这个人又做了一次检测,结果仍然是阳性,那么他患病的概率是多少?

我们仍然使用贝叶斯定理计算,只不过现在先验概率P(H)不再是0.1%,而是4.721%,P(E|H)和P(E|H)仍保持不变,计算新的P(H|E):

P(H∣E)=99%×4.721%+2%×(1−4.721%)99%×4.721%​=0.71=71%

结果为71%,两次检测为阳性的结果使得先验概率从0.1%提升到4.721%再提升到71%,继续第三次检测如果为阳性则概率将提升至99.18%

可见,贝叶斯定理的核心思想就是不断根据新的证据,将先验概率调整为后验概率,使之更接近客观事实。

四世界法

这是小岛宽之的具现化  贝叶斯定理的方法。

  •  将总体样本视为一个方块
  •  人群中的患癌的概率为  1 %
  •  体检时 误诊率为   10%
  •  则 如果确诊为 阳性,则患病的概率为多少?

计算的样式实际上是 患病阳性在整个红色中所占的概率:

(0.01 * 0.9)/  (0.01 * 0.9   +  0.1 *0.99)  = 8.33%

参考

一文搞懂贝叶斯定理(原理篇) - Blogs - 廖雪峰的官方网站

最直观易懂的贝叶斯公式解读?看完别再说学不会啦......_轻松理解医学统计69_哔哩哔哩_bilibili

标签:似然,概率,后验,贝叶斯,经典,先验概率,阳性,统计
From: https://blog.csdn.net/SILVERCROWNAGE/article/details/141634316

相关文章

  • Android经典实战之存储方案对比:SharedPreferences vs MMKV vs DataStore
    本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点在Android开发中,键值对存储(Key-ValueStorage)是一种经常用到的轻量级数据存储方案。它主要用于保存一些简单的配置数据或状态信息,例如用户设置、缓存数据等。常......
  • 国家统计局发布2023年各行业平均工资!IT持续霸榜!
    前言都说这届打工人背的包是压缩包,戴的表是Excel表穿的T是PPT,走的道是:好的收到原以为自己是天命人没想到我只是个吗喽主打一个:面朝工位,薪贫气和近日,国家统计局公布了2023年城镇单位就业人员年平均工资各行业薪资如何?你的薪资达标了吗?下面,跟小编一起来看看吧!IT行......
  • 基于PHP+Vue的卷烟营销统计分析系统
    ......
  • pytorch统计模型计算强度
    计算强度=运算数/访存数运算数有很多库可以算,例如thop的profilefromthopimportprofilemodel=torchvision.models.resnet18(weights=None)flops,params=profile(model,inputs=(torch.randn(1,3,224,224),))print("flops:{:.2f}Gflops".format(flops/1000/10......
  • 华为java岗经典面试题解析
    题目为在一个整形的数组中,在数组中只有一值个是不重复的,其他的值都是有两个重复的值,找出不重复的那个值。{11,11,12,13,13,16,16}解析为当用Java来解决这个问题时,可以使用异或运算来找出只出现一次的元素。以下是一个示例Java程序,演示了如何在一个整型数组中找出只出现一次的元......
  • LeetCode 面试经典 150 题回顾
    目录一、数组/字符串1.合并两个有序数组 (简单)2.移除元素 (简单)3.删除有序数组中的重复项 (简单)4.删除有序数组中的重复项II(中等)5.多数元素(简单)6.轮转数组 (中等)7.买卖股票的最佳时机(简单)8.买卖股票的最佳时机II (中等)9.跳跃游戏(中等)10.跳跃游戏II(中等)11.H指......
  • 【Unity】经典四叉树的实现以及和无空间划分加速下的效率对比分析
    背景假如场景中存在大量的对象,需要快速找到某个范围内的所有对象,如果通过传统的方式,就需要对所有的物体遍历,依次判断是否在范围中,这样非常耗时。所以通过空间划分的方法将其加速,本文中采用四叉树的方式,从实现思想和代码层面对效率进行分析。思想在空间划分算法中首先需要对所有......
  • 张锡纯 经典名方
    http://www.wanyingcha.cn/article-detail/NZynDKMB 张锡纯(1860年-1933年),字寿甫,籍山东诸城,河北省盐山县人,中西医汇通学派的代表人物之一,近现代中国中医学界的医学泰斗。1916年在沈阳创办我国第一间中医医院——立达中医院。1928年定居天津,1930年创办国医函授学校,培养了不少中医......
  • Android经典实战之常见的移动端加密算法和用kotlin进行AES-256加密和解密
    本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点在移动端开发中,数据加密是确保数据传输和存储安全的重要手段。常见的加密算法包括对称加密算法(如AES)、非对称加密算法(如RSA)、散列算法(如SHA-256),以及消息认证码(如......
  • Android经典实战之使用compose时一般用一个activity还是多个
    本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点在使用JetpackCompose开发Android应用时,选择使用一个Activity还是多个Activity主要取决于应用的架构和复杂性。以下是一些权衡和指导建议,可以帮助你做出决......