首页 > 其他分享 >大数定律与中心极限定理

大数定律与中心极限定理

时间:2024-05-17 18:19:11浏览次数:28  
标签:mathbb geq frac 大数 epsilon 定理 极限 随机变量

Markov & Chebyshev Inequality

示性函数

\[\mathbb{I}(A) = \begin{cases} 1, & A \text{ happen } \\ 0, & A \text{ not happen} \end{cases} \]

对于事件\(A\),如果对于样本点\(\omega\)有示性函数

\[I_A(\omega) = \begin{cases} 1, & \omega \in A \\ 0, & \omega \notin A \end{cases} \]

那么可以证明

\[\mathbb{E}[I_A] = 1 \times P(A) = \sum_\omega I_A(\omega) \times P(\omega) = P(A) \]

Markov Inequality

如果\(X\)是一个非负随机变量,那么对于任意的\(a > 0\),有

\[P(X \geq a) \leq \frac{\mathbb{E}[X]}{a} \]

这个不等式粗略刻画了随机变量取值大于等于\(a\)的概率上界。

proof

我们定义示性函数,固定正数\(a\),那么有

\[\mathbb{I}(X \geq a) = \begin{cases} 1, & X \geq a \\ 0, & X < a \end{cases} \]

那么我们可以得到:

\[\mathbb{I}(X \geq a) \leq \frac{X}{a} \]

因此我们可以得到一个不等式

\[P(X \geq a) = \sum_x P(x) \mathbb{I}(X \geq a) \leq \sum_x P(x) \frac{X}{a} = \frac{\mathbb{E}[X]}{a} \]

proof end

Chebyshev Inequality

如果\(X\)是一个随机变量,那么对于任意的\(\epsilon > 0\),有

\[P(|X - \mathbb{E}[X]| \geq \epsilon) \leq \frac{\text{var}(X)}{\epsilon^2} \]

这个不等式粗略刻画了随机变量取值与期望值的偏离程度。使用了随机变量的期望与方差的信息。

proof

我们定义示性函数

\[\mathbb{I}((X - \mathbb{E}[X])^2 \geq \epsilon^2) = \begin{cases} 1, & (X - \mathbb{E}[X])^2 \geq \epsilon^2 \\ 0, & (X - \mathbb{E}[X])^2 < \epsilon^2 \end{cases} \]

我们可知

\[\mathbb{I}((X - \mathbb{E}[X])^2 \geq \epsilon^2) \leq \frac{(X - \mathbb{E}[X])^2}{\epsilon^2} \]

因此我们可以得到一个不等式

\[P(| X - \mathbb{E}[X] | \geq \epsilon) = P((X - \mathbb{E}[X])^2 \geq \epsilon^2) = \\ \sum_x P(x) \mathbb{I}((X - \mathbb{E}[X])^2 \geq \epsilon^2) \leq \sum_x P(x) \frac{(X - \mathbb{E}[X])^2}{\epsilon^2} = \frac{\text{var}(X)}{\epsilon^2} \]

proof end

切比雪夫不等式并不要求随机变量非负

依概率收敛

数列的收敛

若对于任意的\(\epsilon > 0\),存在\(N\),当\(n > N\)时,有\(|a_n - a| < \epsilon\),则称数列\(a_n\)收敛于\(a\),记为\(\lim_{n \to \infin} a_n = a\)

随机变量序列的收敛

若对于任意的\(\epsilon > 0\),有\(\lim_{n \to \infin} P(| Y_n - a | \geq \epsilon) = 0\),则称随机变量序列\(Y_n\)依概率收敛于\(a\),记为\(Y_n \xrightarrow{P} a\)

如果我们将其中的\(\lim\)展开,有

对于任意的\(\epsilon > 0\),有对于任意的\(\delta > 0\),存在\(N\),当\(n > N\)时,有\(P(|Y_n - a| \geq \epsilon) < \delta\),则称随机变量序列\(Y_n\)依概率收敛于\(a\),记为\(Y_n \xrightarrow{P} a\)

Laws of Large Numbers

Weak Law of Large Numbers

弱大数定律是指,在大样本的情况下,样本的经验均值会以很大概率接近随机变量的期望。

我们考虑随机变量序列\(X_1, X_2, \cdots, X_n\).我们定义随机变量序列的经验均值为\(M_n = \frac{1}{N} \sum_{i=1}^n X_i\),注意到\(M_n\)也是一个随机变量。

如果对于任意的\(\epsilon > 0\), 有

\[\lim_{n \to \infty} P(|M_n - \mathbb{E}[M_n ]| \geq \epsilon) = 0 \]

则称随机变量序列\(X_1, X_2, \cdots, X_n\)满足弱大数定律。也称\(M_n\)依概率收敛于\(\mathbb{E}[M_n]\)

现在我们开始一一分析各个大数定律

限制方差的大数定律--马尔可夫大数定律

任取\(\epsilon > 0\),有

\[P(|M_n - \mathbb{E}[M_n ]| \geq \epsilon) \leq \frac{\text{var}(M_n)}{\epsilon^2} \]

其中\(\text{var}(M_n) = \frac{\text{var}(\sum_{i=1}^n X_i)}{n^2}\),因此

\[P(|M_n - \mathbb{E}[M_n ]| \geq \epsilon) \leq \frac{\text{var}(\sum_{i=1}^n X_i)}{n^2 \epsilon^2} \]

如果\(\lim_{n \to \infin} \frac{\text{var}(\sum_{i=1}^n X_i)}{n^2} = 0\), 那么\(M_n\)满足弱大数定律。

限制随机变量不相关+方差有界的大数定律--切比雪夫大数定律

如果在 Markov 大数定律中,我们假设\(X_i\)两两不相关,那么\(\text{var}(\sum_{i=1}^n X_i) = \sum_{i=1}^n \text{var}(X_i)\)

同时如果所有的\(X_i\)的方差都有上界\(\sigma^2\),那么

\[P(|M_n - \mathbb{E}[M_n ]| \geq \epsilon) \leq \frac{\text{var}(\sum_{i=1}^n X_i)}{n^2 \epsilon^2} = \frac{\sum_{i=1}^n \text{var}(X_i)}{n^2 \epsilon^2} \leq \frac{n \sigma^2}{n^2 \epsilon^2} = \frac{\sigma^2}{n \epsilon^2} \]

因此得到结论:如果\(X_i\)两两不相关,且有共同上界\(\sigma^2\),那么\(M_n\)满足弱大数定律。

限制独立同分布+方差有限的大数定律

如果\(X_i\)是独立同分布的随机变量,且有限方差\(\sigma^2\),那么

\[P(|M_n - \mathbb{E}[M_n ]| \geq \epsilon) \leq \frac{\text{var}(\sum_{i=1}^n X_i)}{n^2 \epsilon^2} = \frac{n \sigma^2}{n^2 \epsilon^2} = \frac{\sigma^2}{n \epsilon^2} \]

满足弱大数定律,并且此时\(\mathbb{E}[M_n] = \mathbb{E}[X]\)

限制独立同分布+二项分布--伯努利大数定律

如果\(X_i\)是独立同分布的伯努利随机变量,那么\(M_n\)满足弱大数定律。

同时可以进行扩展,我们将一个事件\(A\)嵌入一个实行函数中,转换为一个伯努利随机变量,那么我们可以得到

\[\mathbb{E}[\frac{1}{n} \sum_{i=1}^n I_{A,i}] = \frac{1}{n} \sum_{i=1}^n \mathbb{E}[I_{A,i}] = \frac{1}{n} \sum_{i=1}^n P(A) = P(A) \]

又因为\(I_{A,i}\)独立同分布且有限方差,因此\(M_n\)满足弱大数定律,可得\(A\)的频率收敛于概率

方差无界的大数定律--辛钦大数定律

如果\(X_i\)是独立同分布且期望有界的随机变量,但是方差无界,那么\(M_n\)满足弱大数定律。

Strong Law of Large Numbers

强大数定律是指,样本的经验均值会以概率 1 收敛于随机变量的期望。

若有独立同分布的随机变量序列\(X_1, X_2, \cdots, X_n\),那么

\[P(\lim_{n \to \infty} M_n = \mathbb{E}[X]) = 1 \]

可以理解为,在一个无限序列 X_1, X_2, \cdots, X_n 的样本空间中,存在一个子集满足\(M_n = \mathbb{E}[X]\),这个子集的概率为 1。

Central Limit Theorem

大数定律研究了随机变量序列的经验均值与期望之间的联系,而中心极限定理研究了随机变量序列经验均值的分布。

Lindeberg-Levy/独立同分布 Central Limit Theorem

如果\(X_i\)是独立同分布的随机变量,且有限期望\(\mu\)和方差\(\sigma^2\),那么

\[\lim_{n \to \infty} P(\frac{\sum_{i=1}^n X_i - n\mu}{\sqrt{n}\sigma} \leq x) = \Phi(x) \]

即\(M_n\)依分布收敛于正态分布。

独立不同分布下的中心极限定理

pass

参考

大数定律与中心极限定理
概率导论

标签:mathbb,geq,frac,大数,epsilon,定理,极限,随机变量
From: https://www.cnblogs.com/Blackteaxx/p/18198383

相关文章

  • 直播预约丨《袋鼠云大数据实操指南》No.2:实时开发,如何成为数据智能化的有效驱动力
    近年来,新质生产力、数据要素及数据资产入表等新兴概念犹如一股强劲的浪潮,持续冲击并革新着企业数字化转型的观念视野,昭示着一个以数据为核心驱动力的新时代正稳步启幕。面对这些引领经济转型的新兴概念,为了更好地服务于客户并提供切实可行的实践指导,自3月20日起,袋鼠云将推出全新......
  • 十四五”智慧城市:视频大数据汇聚系统2.0建设方案与特点分析
    一、背景需求分析随着科技的不断发展,智慧城市的建设已经成为城市发展的重要方向。视频汇聚系统作为智慧城市建设的重要组成部分,已经得到了广泛的应用和推广。视频汇聚系统是智慧城市中非常重要的组成部分,它利用摄像头和传感器技术来收集城市中的实时视频和数据信息,为城市管理者和......
  • 费马小定理 逆元 期望dp
    p8774include<bits/stdc++.h>usingnamespacestd;defineintlonglongdefinef(i,a,b)for(inti=(a);i<=(b);i++)definecl(i,n)i.clear(),i.resize(n);defineendl'\n'typedeflonglongll;typedefunsignedlonglongull;type......
  • 皮克定理及其证明
    太美丽的梦。如果说有一个公式让我日日夜夜都想着证明之,那么也就只有皮克定理了。参考:百度百科考虑数学归纳法。记号记皮克定理为\(S_P=P_n+\dfrac{P_m}{2}-1.\)其中\(P_n\)表示所求多边形的内部的格点数,\(P_m\)表示所求多边形的边上的格点数。\(S_P\)表示多边形的......
  • hdu1297大数递归
    【题解】假设有一种合法的放置方案,有n-1个位置,那么我们在末尾多放一个M,必定是一个合法的方案。(放F则不一定)有n-2个位置的合法放置方案,我们在末尾多放FF,必定是一个合法的方案。(其实放MM也是必定合法的,但是会和上一种情况重复,不能考虑进去。FM和MF则不能保证合法)import......
  • 大数据-客户价值分析
    (1)导入所需要使用的包importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportrefromsklearn.clusterimportKMeansfromdatetimeimportdatetime(2)读取文件datafile="/data/bigfiles/data2.csv"data=pd.read_csv(datafile)(......
  • #dp,Dilworth定理#洛谷 4934 礼物
    题目传送门分析首先,可以放在一起当且仅当\(\max\{a_i,a_j\}\&\min\{a_i,a_j\}\neq\min\{a_i,a_j\}\)根据Dilworth定理可知最小链划分中链的数目等于最长反链的长度所以设\(dp[i]\)表示以\(i\)为结尾的反链的最大长度,则\(dp[i]=\max_{j|i}\{dp[j]\}+[a_k==i]\)......
  • §3. 收敛定理的证明
    不做要求。有能力的同学掌握贝塞尔不等式、黎曼-勒贝格定理和收敛定理的证明。  贝塞尔(Bessel,FriedrichWilhelm,1784~1846)德国天文学家,数学家,天体测量学的奠基人之一。1784年7月22日生于明登,1846年3月17日卒于柯尼斯堡。15岁辍学到不来梅一家出口公司当学徒,在学习航海术......
  • 大数据面试SQL每日一题系列:最高峰同时在线主播人数。字节,快手等大厂高频面试题
    大数据面试SQL每日一题系列:最高峰同时在线主播人数。字节,快手等大厂高频面试题之后会不定期更新每日一题sql系列。SQL面试题每日一题系列内容均来自于网络以及实际使用情况收集,如有雷同,纯属巧合。1.题目问题1:如下为某直播平台各主播的开播及关播时间数据明细,现在需要计算该平......
  • 4.30极限测试代码
    以下代码为部分代码:index.jsp<!DOCTYPEhtml><%@pagelanguage="java"contentType="text/html;charset=UTF-8"pageEncoding="UTF-8"%><%@pageimport="java.sql.Connection"%><%@pageimport="java.s......