首页 > 编程语言 >Python小白进阶篇之概率论2

Python小白进阶篇之概率论2

时间:2024-10-11 23:21:49浏览次数:3  
标签:概率密度函数 函数 Python 取值 连续型 进阶篇 分布 概率论 随机变量

文章目录

前言

今天开启第二天概率论的学习,从昨天随机变量的分布结尾,今天从连续性随机变量及其概率密度函数开始巩固。


一、连续性随机变量分布

连续型随机变量是取值可以是某个区间内任意实数的随机变量。与离散型随机变量不同,连续型随机变量的取值是连续的,不可数的。连续型随机变量的概率分布通常由概率密度函数(Probability Density Function, PDF)描述。

例子
统计了99年的降水量,其中

降水量在670-770的有1年(频率:0.01),

降水量在770-870的有8年(频率:0.081),

降水量在870-970的有9年,

降水量在970-1070的有19年,

降水量在1070-1170的有20年,

降水量在1170-1270的有18年,

降水量在1270-1370的有10年,

降水量在1370-1470的有7年,

降水量在1470-1570的有4年,

降水量在1570-1670的有3年。

频率密度直方图:(纵坐标为频率/组距)
在这里插入图片描述

连续型随机变量的特点:

  1. 连续性:随机变量的取值是连续的,可以在一个或多个区间内取任意值。
  2. 不可数性:取值是不可数的,即有无限多个可能的取值。
  3. 概率分布:每个取值区间都有一个特定的概率,且整个取值范围的概率密度函数积分等于1。
  4. 连续型的随机变量取值在任意一点的概率都是0。在函数曲线上某个点的概率其实是取的该点附近值的大小。
  5. 连续情况下,端点无所谓。P{a≤x≤b}=P{a<x<b}
    熟练掌握连续性随机变量分布的图像和特点为关键

概率密度函数

概率密度函数从图中我们可知就是作为那条曲线
对于一维实随机变量X,如果存在非负可积函数f(x),使得对于任意实数x
在这里插入图片描述
可得:
在这里插入图片描述
则称f(x)为随机变量X的概率密度函数。

密度函数f(x)具有下列性质

非负性:对于所有的x,有
在这里插入图片描述
同时也说明只要fx位于y轴的上半段就是符合自身性质,则表示概率密度函数可以位于第一象限和第二象限。
归一性:概率密度函数在整个取值范围的积分等于1,即
在这里插入图片描述
举个例子:
在这里插入图片描述
根据概率密度函数:
在这里插入图片描述可知,在[0,2]区间以外的函数值都为0,所以
在这里插入图片描述
计算定积分

在这里插入图片描述
由于
在这里插入图片描述
所以:2k+2=1
k=-0.5

二、分布函数

1.基本概念

分布函数是描述随机变量取值分布情况的函数,无论是离散型随机变量还是连续型随机变量,都可以通过分布函数来描述其概率特性。分布函数通常指的是累积分布函数(Cumulative Distribution Function, CDF),用 F(x) 表示。

2.累积分布函数(CDF)

对于随机变量 X,其累积分布函数 F(x) 定义为随机变量 X 取值小于或等于 x 的概率:
在这里插入图片描述

3.CDF的性质

  1. 非减性:随着 x 的增加,F(x) 是非减的,即 F(x1)≤F(x2)对于所有的 x1≤x2 成立。

  2. 范围:F(x)的值域在 0 到 1 之间,即 0≤F(x)≤1。

  3. 边界条件:

在这里插入图片描述
4.右连续:F(x) 在任意点 x 都是右连续的。对于离散型随机变量,F(x) 在任意点 x 是右连续,对于连续型随机变量,F(x) 在任意点 x 是连续的。
我的理解是对于任意一点x0,取任意x从右侧趋向于x0时,累积分布函数(CDF)F(x)的极限值F(x0+)等于F(x0),那么我们就说这个累积分布函数在x0点是右连续的。类似于在求极限中对于连续的定义,只是此处在x0的右侧进行延伸。

4.不同类型随机变量的累积分布函数

1.离散型随机变量
2.连续型随机变量
对于实质是:分布函数其实就是求曲线在某个区间内的面积。
此处需要注意的是随机变量中X比分布函数中的f(x)要更小,举例中主要注意X比x更小,还有就是通过概率分布表中的概率要相加完整。

5.常见的分布

有0-1分布、几何分布、二项分布、泊松分布、均匀分布、指数分布和正态分布,这几个分布里面常用和注意的我觉得是二项分布和正态分布,接下来的解析从这两个分布出发。

5.1二项式分布

二项分布的概率质量函数(PMF):
如果随机变量 X 表示 n 次伯努利试验中成功的次数,那么 X 服从参数为 n 和 p 的二项分布,记作 X∼B(n,p)。二项分布的概率质量函数为:
在这里插入图片描述
k作为成功的数,k=0,1,2,…,n
在这里插入图片描述

为组合数,表示从n次试验中选择k次成功的不同方式的数目。
在这里插入图片描述

  • p 是单次试验成功的概率。

  • 1−p 是单次试验失败的概率。

其实就是事件概率中的伯努利公式。

5.2 正态分布

正态分布(Normal Distribution),也称为高斯分布(Gaussian Distribution),是连续概率分布的一种。它是统计学中最重要的概率

分布之一,因为许多自然和社会现象的分布都近似于正态分布。正态分布在自然科学和社会科学的许多领域都有应用,包括生物学、物理

学、经济学和社会科学,记作:

在这里插入图片描述
概率密度函数:
在这里插入图片描述
其中x为随机变量、μ 是均值、σ是标准差、σ^2是方差。
跟后面的期望相结合更易理解。

离散型随机变量函数的分布

离散型随机变量函数的分布通常指的是如何从已知的离散型随机变量出发,通过某种函数关系得到新的随机变量,并确定这个新随机变量的概率分布。
课上有用的方法:
直接法:
对于每一个可能的 y 值,我们可以通过以下步骤计算 Y 取值为 y 的概率:

  1. 确定 x 的值:找出所有使得 g(x)=y 成立的 x 的值。
  2. 计算概率:对于每个满足条件的 x,将 X 取该值的概率相加。

连续型随机变量函数的分布

连续型随机变量函数的分布是指通过一个连续型随机变量 XX 的函数 Y=g(X)得到的新的随机变量 Y 的分布

期望与方差

1.数学期望

数学期望是概率论中的一个重要概念,它描述了一个随机变量的平均值或中心值。数学期望也被称为期望值或均值。它是对随机变量可能取值的加权平均,其中权重是每个可能取值的概率。

离散型随机变量的期望

在这里插入图片描述
如何理解离散型随机变量通过例子其实更加形象
1.有三个人的体重分别为150、165、180,求体重的期望值。
在这里插入图片描述
其实就是求平均体重。
2.学校举行歌唱比赛,假设给一个参赛选手打分,专业评委打分90,老师打分100,学生打分80,专业评委分数权重为0.9,老师权重为0.09,学生权重为0.01,求给该选手的打分期望值。
设随机变量X,其取值分别为打分值:90、100、80,对应的概率为打分权重:0.9、0.09、0.01
所以,X的期望值为:
在这里插入图片描述
通过以上两个例子较为形象具体举出离散型随机变量的期望计算。

连续型随机变量的期望

对于连续随机变量 X ,其概率密度函数为 f(x) ,则 X 的数学期望定义为:
在这里插入图片描述
注意:可以将x理解为随机变量X的取值,f(x)理解为对应的概率。在严格意义上不是正确的,帮助我们理解。

1.2方差

方差分为离散性随机变量连续性随机变量
通过两个例子去理解
离散型随机变量在这里插入图片描述
求方差DX。

先求EX(期望值):
在这里插入图片描述
求平方的期望
在这里插入图片描述
离散型是取值乘以对应概率求和,平方的期望减去期望的平方
在这里插入图片描述
连续性随机变量*:
对于连续型随机变量 XX,其方差可以表示为:
假设密度函数:
在这里插入图片描述
求方差DX。

解:
求EX:
在这里插入图片描述
最后还是通过平方的期望减掉期望的平方。

1.3协方差

概念:协方差是衡量两个随机变量之间线性关系强度的统计量。如果两个变量的协方差为正,它们之间存在正相关关系;如果协方差为负,它们之间存在负相关关系;如果协方差为零,它们之间没有线性关系。
定义:对于两个随机变量 X 和 Y,它们的协方差定义为:
在这里插入图片描述
其中 EX 和 EY 分别是 X 和 Y 的期望值。

协方差的计算公式可以表示为:
在这里插入图片描述

1.4正态分布

在这里插入图片描述
期望与方差:
在这里插入图片描述
这是概率中作为我们常为使用的公式和重点,熟悉每个概念指的是什么。

标签:概率密度函数,函数,Python,取值,连续型,进阶篇,分布,概率论,随机变量
From: https://blog.csdn.net/guanyuyouxiu_/article/details/142844733

相关文章

  • python学习第二天(2024.10.11)
    python下载官网https://www.python.org/点击Downloads选择安装版本,选择操作系统选择操作系统位数,选择下载文件格式(ZIP、exe)下载安装(安装路径不能有中文和空格)验证是否安装成功win+r,输入cmd,直接输入python,显示正确安装版本及安装成功环境变量配置......
  • 蓝桥杯真题 穿越时空之门(第十五届蓝桥杯省赛PythonB组A题) c++题解
    问题如下(附链接):穿越时空之门题解代码如下:#include<iostream>usingnamespacestd;intx1(inti){inta=0;while(i){a+=i%2;i/=2;}returna;}intx2(inti){intb=0;while(i){b+=i%4;i/=4;}returnb;}intmain()......
  • 用包目录结构Python脚本,简陋而强大
    模块清晰易于管理,模块代码以*.py脚本呈现,方便维护和扩展。(笔记模板由python脚本于2024年10月09日18:21:52创建,本篇笔记适合喜欢Python和编程的coder翻阅)【学习的细节是欢悦的历程】Python官网:https://www.python.org/Free:大咖免费“圣经”教程《python完......
  • Python中优秀的“包”
    包目录结构易于构建和管理,代码缩进层级变浅,方便维护和功能拓展。(笔记模板由python脚本于2024年10月09日18:21:52创建,本篇笔记适合喜欢Python和编程的coder翻阅)【学习的细节是欢悦的历程】Python官网:https://www.python.org/Free:大咖免费“圣经”教程《pyth......
  • centos7.6源码方式安装python3.6.8
    1安装依赖包centos7.6是没有自带python3的[root@opgs201~]#cat/etc/redhat-releaseCentOSLinuxrelease7.6.1810(Core)[root@opgs201~]#python3bash:python3:commandnotfound...Similarcommandis:'python'先挂载iso文件,配置本地yum源##挂载虚拟机的光盘......
  • Python下5分钟k线数据转15、30、60分钟线数据的探索
     在做股票相关的项目,需要把通达信的5分钟k线数据转为15、30、60分钟线来做后续处理,参考了一些资料,发现pandas的resample可以实现。#通过5分钟线生成15、30、60分钟线defchangeLc5Cycle(stockid,cycle):cycle_list=['15min','30min','60min']ifcyclenotin......
  • 用python语言判断输入的年份是闰年还是平年
    判断闰年的口诀是:四年一润,百年不润,四百年再润。这句话是公历年份的闰年规律。这一规律说明,普通年份是4的倍数即为闰年,但整百年份必须是400的倍数才是闰年。也就是说第一个条件必须满足能被4整除且不能被100整除,第二个条件是能被400整除,满足其中的一个条件,既是闰年。那我们......
  • python基于django 在线学习与推荐系统的设计与实现
    目录技术栈具体实现截图编码规范开发技术介绍系统的稳定性和可维护性核心代码部分展示详细视频演示python大数据库爬虫题目推荐源码获取方式技术栈系统界面应简洁易懂,用户使用时一目了然,操作不应包含过多步骤或包含难以理解的操作,每个请求操作应给出成功或失败的具......
  • 计算机毕业设计 基于Django的学生选课系统的设计与实现 Python+Django+Vue 前后端分离
    ......
  • python+flask计算机毕业设计长护险管理系统的设计与实现(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着人口老龄化的加剧,长期护理保险(简称“长护险”)逐渐成为社会保障体系中的重要组成部分。长护险旨在为失能、失智等需要长期护理服务的老......