首页 > 其他分享 >概率分布深度解析:PMF、PDF和CDF的技术指南

概率分布深度解析:PMF、PDF和CDF的技术指南

时间:2024-09-24 16:22:49浏览次数:9  
标签:CDF 概率 均匀分布 PMF PDF 随机变量


本文将深入探讨概率分布,详细阐述概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)这些核心概念,并通过实际示例进行说明。

在深入探讨PMF、PDF和CDF之前,有必要先简要介绍两种常用的概率分布:正态分布和均匀分布。

正态分布: 也称为高斯分布或钟形曲线,正态分布以其均值为中心对称。它广泛应用于描述自然界中的许多现象。诸如人口身高、标准化考试成绩、测量误差等多种实际数据集都呈现正态分布特征。

均匀分布: 在均匀分布中,给定范围内的每个结果具有相等的概率。这是最基本的概率分布形式,常用于描述每个结果等可能出现的情况,如公平骰子的投掷结果或0到1之间随机数的选取。

概率分布深度解析:PMF、PDF和CDF的技术指南_pdf

图1左侧展示了正态分布,呈现典型的钟形曲线,以平均值(此处为0)为中心。可以观察到,大多数数值集中在中心区域。右侧图表表示均匀分布,在0到1之间呈现均匀分布,表明每个值具有相等的出现概率。

在数据科学和统计学研究中,理解概率分布方式是核心任务。概率分布函数在这方面发挥着关键作用。本文将详细讨论概率密度函数(PDF)、**概率质量函数(PMF)累积分布函数(CDF)**的概念。我们还将探讨如何从PMF或PDF推导CDF,并为每种情况提供具体示例。

概率质量函数(PMF)

概率质量函数(PMF)专用于描述离散随机变量。它定义了离散随机变量取特定值的概率。PMF为表示不同离散结果的概率提供了一种方法。

例如,在硬币翻转实验中,可能的结果只有正面和反面两种。公平硬币翻转的PMF可以表示为:

P(正面) = 0.5P(反面) = 0.5

另一个典型示例是投掷六面骰子。PMF表明每个结果(1,2,3,4,5,6)的概率均为0.167(约等于1/6)。

概率密度函数(PDF)

概率密度函数(PDF)用于描述连续随机变量。与为离散值分配概率的PMF不同,PDF描述了随机变量落在特定范围内的可能性。在连续分布中,任一具体点的概率为零,但我们可以通过对PDF在某个区间上进行积分来计算变量落在该区间内的概率。

正态分布(也称为高斯分布)是最常用的连续概率分布之一。其PDF可以表示为:

概率分布深度解析:PMF、PDF和CDF的技术指南_概率论_02

PDF给出了连续随机变量不同值的相对可能性。

下图直观地展示了PDF和PMF。左图显示了PDF的钟形曲线,曲线下的面积代表连续变量的概率。曲线的峰值位于均值处,其展开程度由标准差决定。右图展示了PMF(以六面骰子投掷为例),表示离散结果,每个可能的结果具有相等的概率。PMF为每个可能的结果分配了具体的概率值。

概率分布深度解析:PMF、PDF和CDF的技术指南_人工智能_03

图3:概率密度函数(左)和概率质量函数(右)的图形表示。

累积分布函数(CDF)

累积分布函数(CDF)是一个函数,它定义了随机变量 X 小于或等于特定值 x 的概率。在数学上CDF 定义为:

F(x) = P(X ≤ x)

CDF 可以理解为概率的"累积和"。它从 0 开始,随着随机变量值的增加而增加,最终达到 1(表示总概率)。

为了更好地理解这些概念,我们将通过两个实例来说明,这些实例与前面解释 PDF 和 PMF 时使用的例子相对应:

示例1:离散随机变量的 CDF(骰子投掷)

考虑投掷一个标准六面骰子的情况。可能的结果是 {1,2,3,4,5,6},每个结果的概率均为 0.167(约等于 1/6)。

我们可以通过累加每个结果的概率来构建 CDF:

当 x = 1 时:P(X ≤ 1) 是结果小于或等于 1 的概率。F(1) = P(X = 1) = 0.167

当 x = 2 时:P(X ≤ 2) 是结果小于或等于 2 的概率。F(2) = P(X ≤ 2) = P(X = 1) + P(X = 2) = 0.167 + 0.167 = 0.333

依此类推,当 x = 6 时,CDF 包括了所有可能的结果(因为骰子不可能产生大于 6 的结果),因此总概率为 1。F(6) = P(X ≤ 6) = P(X = 1) + P(X = 2) + … + P(X = 6) = 1

由此可见CDF 是逐步增加的,累积了每个结果的概率。如果我们绘制这个函数,会得到一个阶梯状的图形,这是离散变量 CDF 的典型特征。

示例2:连续随机变量的 CDF(均匀分布)

现在让我们考虑一个连续变量的情况。假设 X 遵循 0 到 1 之间的均匀分布。均匀分布的 PDF 在区间 [0,1] 内为常数 1,在其他区间为 0。

我们可以通过对 PDF 进行积分来计算 CDF。

对于 x = 0.2,CDF 就是从 0 到 0.2 的 PDF 下的面积。我们对 PDF 在区间 [0, 0.2] 上积分,得到结果 0.2。

对于 x = 1,我们对 PDF 在区间 [0, 1] 上积分,CDF 的值为 1。

由于这是均匀分布,CDF 从 0 线性增加到 1。如果我们绘制这个函数,如下图所示会得到一条从点 (0, 0) 到点 (1, 1) 的直线,反映了 0 和 1 之间所有值具有相等概率的特性。

概率分布深度解析:PMF、PDF和CDF的技术指南_pdf_04

图4:左图显示了离散随机变量(骰子投掷)的 CDF,展示了骰子投掷结果概率的阶梯式累积。右图是连续随机变量(均匀分布)的 CDF,显示了从 0 到 1 的连续均匀分布概率的平滑线性增加。

结论

累积分布函数(CDF)是理解离散和连续设置中概率分布的强大工具。它使我们能够直观地看到任何给定点之前的累积概率,特别适用于计算区间概率。这些概念在数据分析、统计推断和机器学习算法中有广泛的应用。对于那些正在学习数据科学和统计学的读者,深入理解这些基本概念将为更高级的主题奠定坚实的基础。

作者:Uzmasherali


标签:CDF,概率,均匀分布,PMF,PDF,随机变量
From: https://blog.51cto.com/deephub/12100843

相关文章

  • 自学大模型LLM,看这本书就够了!帮你快速入门大模型!(含PDF)
    一、Transformer模型介绍Transformer模型是一种基于自注意力机制的深度神经网络模型,在自然语言处理(NLP)领域取得了显著的成果,并在机器翻译、文本摘要、问答系统等多个任务中表现出色。1.基本原理Transformer模型主要由自注意力机制和前馈神经网络两部分组成。(1)自注意力机制:功能:自注......
  • 2024年中国生成式AI行业最佳应用实践|附100页PDF文件下载
    前言8月28日,由弗若斯特沙利文(Frost&Sullivan,简称“沙利文”)主办的第十八届中国增长、科创与领导力峰会暨第三届新投资大会上,沙利文携手头豹研究院共同发布了《2024年中国生成式AI行业最佳应用实践》报告,并揭晓了多项实践方案大奖。其中,商汤科技与海通证券凭借双方联合打造的金融......
  • 《大模型应用开发极简入门》学习成为善用 AI 的人!看完懂得90%的大模型!{含pdf版电子书}
    ......
  • 【专题】2024AI智慧生活白皮书:AI智能科技重塑居家体验报告合集PDF分享(附原数据表)
    原文链接:https://tecdat.cn/?p=37748AI已然成为家电家居市场的创新核心动力,可在个性化识别、预测维护等多方面提升产品价值。家享生活行业智能化展现多元场景,清洁智能崛起超厨房智能居第二,全屋智能潜力巨大。“套装/集成智能”等品类增长快,智能新客多由老客升级,消费有时序性,......
  • 任务三:pdf转换器应用
    本次添加水印我使用的lightPDF网页进行水印的添加工作https://lightpdf.com/1.首先要先注册账号2.可以使用浏览器对网页进行翻译3.在“pdf工具栏”中找到第三列“编辑pdf”的位置,选择“水印pdf”4.把需要添加水印的文件添加到网页中5.对水印的大小,透明度,颜色,内容进行调整6.......
  • 9.23 海报+PDF水印运用
    任务2:海报以宣传校植物研学社为主题,吸引天华小学学生积极报名加入校植物研学社,与学校聘请特邀的植物学专家、生物老师、同学共度一场植物奇遇记,在植物的世界中展开探索与冒险。在每周一次的研学社活动中,教师会提供各种各样的植物标本与实物,学生可以在专家、教师的帮助、引导下了......
  • 用C#写个PDF批量合并工具简化日常工作
    一.前言由于项目需要编写大量的材料,以及各种签字表格、文书等,最后以PDF作为材料交付的文档格式,过程文档时有变化或补充,故此处理PDF文档已经成为日常工作的一部分。网上有各种PDF处理工具,总是感觉用得不跟手。最后回顾自己的需求总结为以下几项:1.可以便捷、快速的对多份PDF进行......
  • 【专题】2024新能源企业“出海”系列之驶向中东、东南亚报告合集PDF分享(附原数据表)
    在“双碳”目标引领下,中国新能源产业近年迅猛发展,新能源企业凭借技术革新、政策支持与市场驱动实现快速增长,在产业链完备、技术领先、生产效能及成本控制等方面优势显著。面对国内外环境不确定性增强的常态化态势,中国新能源企业积极开拓海外市场,开启“出海”征程。中东地区凭借独特......
  • 免费开源的 PDF 工具箱,功能丰富,操作简单,获赞 42k+!
    ​PDF是工作中常见的文件格式,经常需要对其进行合并、分割、旋转、加水印等操作。而目前市面上大部分PDF软件,免费版只能用来看PDF,修改PDF的功能都是付费的。今天就和大家分享一个本地化处理PDF的神器:Stirling-PDF,它功能强大,几乎可以满足任何操作,而且是本地运行,不用担心数......
  • Spring Boot集成OpenPDF实现PDF导出功能
    如果你想要在SpringBoot项目中使用OpenPDF来生成PDF文件,而不是iText,你可以通过将HTML转换成PDF的方式来实现。OpenPDF是一个开源的JavaPDF库,它基于iText5.x版本,但是它主要提供了HTML到PDF的转换能力。下面是如何在SpringBoot项目中设置并使用OpenPDF来生成PDF文件的一个简单......