首页 > 其他分享 >[概率论与数理统计]笔记:4.4 抽样分布

[概率论与数理统计]笔记:4.4 抽样分布

时间:2023-01-29 19:15:05浏览次数:48  
标签:4.4 抽样 frac sqrt overline mu 数理统计 sigma sim

4.4 抽样分布

正态总体的抽样分布

关注点:总体是正态分布,抽样,样本所构造的统计量的分布的相关研究。

单正态总体的抽样分布

定理

正态总体\(X\sim N(\mu,\sigma^2)\),\((X_1,X_2,\cdots,X_n)\)是样本,样本均值为\(\overline{X}\),样本方差为\(S^2\).

其中

\[\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_i, \]

\[S^2 = \frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2 \]

  1. \(\overline{X}\sim N(\mu,\frac{\sigma^2}{n})\)

证明

\[E\overline{X}=E(\frac{1}{n}\sum\limits_{i=1}^nX_i) = \frac{1}{n}\sum\limits_{i=1}^nEX_i=\frac{1}{n}n\mu = \mu \]

\[D\overline{X}=D(\frac{1}{n}\sum\limits_{i=1}^nX_i)=\frac{1}{n^2}\sum\limits_{i=1}^nDX_i=\frac{1}{n^2}n\sigma^2=\frac{\sigma^2}{n} \]

由于\(\overline{X}=\frac{1}{n}(X_1+X_2+\cdots+X_n)\),且\((X_1+X_2+\cdots+X_n)\)服从正态分布,所以\(\overline{X}\)也服从正态分布。

再结合\(E\overline{X}\)和\(D\overline{X}\)的值,所以\(\overline{X}\)服从参数为\((\mu,\frac{\sigma^2}{n})\)的正态分布。

理解

样本均值的方差比总体的方差小,并且样本容量(\(n\))越大,方差越小。

假设有100个随机数,

  • 当样本容量\(n=2\)时,可能刚好抽出两个很大的数,于是样本均值很大;也可能刚好抽出两个很小的数,于是样本均值很小,所以样本容量小会导致样本均值的方差大。
  • 当样本容量\(n=98\)时,每次抽样可能都是那么些数字,每次抽样可能就和上次抽样相差一两个数字,于是样本均值都差不多,也就是说样本均值的方差比较小。

推论

\[U=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) \]

因为\(\overline{X}\)服从正态分布,所以标准化之后就服从标准正态分布

  1. \(\frac{n-1}{\sigma^2}S^2=\frac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\overline{X})\sim \chi^2(n-1)\)

  2. \(\overline{X}\)和\(S\)相互独立。


另外一些定理
  1. \(\frac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2\sim\chi^2(n)\)
  • \(\frac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\overline{X})\sim \chi^2(n-1)\)
  • \(\frac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2\sim\chi^2(n)\)

这样两个定理的区别在于上面用的\(\overline{X}\)是样本均值,下面的\(\mu\)是总体期望

上面的卡方分布的自由度是\(n-1\),下面的自由度是\(n\)。

简单理解记忆:上面的定理有\(\overline{X}=\frac{1}{n}(X_1+\cdots+X_n)\),比下面的定理多出一个约束(方程)。

联系线性方程组的知识点,多一个方程就少一个自由未知量,因此自由度就比下面的少1.

  1. \(\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)\)

证明

前置知识:

  • 标准正态分布和卡方分布构成\(t\)分布:

    \[X\sim N(0,1),Y\sim \chi^2(n) \]

    \[\frac{X}{\sqrt{Y/n}}\sim t(n) \]

结合上文的推论与定理:

\[\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) \]

\[\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) \]

因此

\[\frac{ \frac{\overline{X}-\mu}{\sigma/\sqrt{n}} }{ \sqrt{ \frac{(n-1)S^2}{\sigma^2}/n-1 } } \sim t(n-1) \]

又因为

\[\frac{ \frac{\overline{X}-\mu}{\sigma/\sqrt{n}} }{ \sqrt{ \frac{(n-1)S^2}{\sigma^2}/n-1 } }= \frac{\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}}{\frac{S}{\sigma}} =\frac{\overline{X}-\mu}{S/\sqrt{n}} \]

所以

\[\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1) \]


双正态总体的抽样分布

  • 两个总体:\(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\),

  • 分别抽样:\((X_1,\cdots,X_{n_1})\)和\((Y_1,\cdots,Y_{n_2})\),(两个样本的容量不一样,分别是\(n_1\)和\(n_2\))

  • 样本均值:\(\overline{X},\overline{Y}\),

  • 样本方差:\(S_1^2,S_2^2\)。

定理

\[U=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) \]

证明

根据上面单正态总体关于样本均值的定理,有

  • \(\overline{X}\sim N(\mu_1,\frac{\sigma_1^2}{n_1})\)
  • \(\overline{Y}\sim N(\mu_2,\frac{\sigma_2^2}{n_2})\)

再根据正态分布的线性可加性,有

\[\overline{X}-\overline{Y}\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}-\frac{\sigma_2^2}{n_2}) \]

标准化,就得到了上面的定理。

\[F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F(n_1-1,n_2-2) \]

证明

前置知识点:

\(F\)分布

\(X\sim \chi^2(n_1),Y\sim \chi^2(n_2)\)

则\(\frac{X/n_1}{Y/n_2}\sim F(n_1,n_2)\)

根据上面单正态总体关于样本方差的定理,有

  • \(\frac{(n_1-1)S_1^2}{\sigma_1^2}\sim \chi^2(n_1-1)\)
  • \(\frac{(n_2-1)S_2^2}{\sigma_2^2}\sim \chi^2(n_2-1)\)

于是

\[\frac{ \frac{(n_1-1)S_1^2}{\sigma_1^2}/(n_1-1) }{ \frac{(n_2-1)S_2^2}{\sigma_2^2}/(n_2-1) } \sim F(n_1-1,n_2-1) \]

因此

\[\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F(n_1-1,n_2-2) \]

使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社

标签:4.4,抽样,frac,sqrt,overline,mu,数理统计,sigma,sim
From: https://www.cnblogs.com/feixianxing/p/sampling-distribution.html

相关文章

  • [概率论与数理统计]笔记:4.3 常用的统计分布
    4.3常用的统计分布上侧分位数分位数是一个分界点。上侧分位数与分布函数\(F\)以及水平\(\alpha\)有关,常记为\(F_\alpha\).含义:在\(y=F(x)\)的图像中,使得直线\(x=F_\a......
  • 随机算法之水塘抽样算法
    本文首发:随机算法之水塘抽样算法读完本文,你不仅学会了算法套路,还可以顺便解决如下题目:382.链表随机节点(中等)398.随机数索引(中等)-----------我最近在力扣上做到两道......
  • [概率论与数理统计]笔记:4.2 统计量
    4.2统计量统计量的定义样本的任一不含总体分布未知参数的函数为该样本的统计量。常用的统计量样本均值即样本的算术平均值:\[\overline{X}=\frac{1}{n}(X_1,X_2,\cd......
  • [概率论与数理统计]笔记:4.1 总体与样本
    第四章数理统计的基础知识4.1总体与样本总体与总体分布概念总体:在某种共性基础上由许多个别事物结合起来的整体。个体:指构成统计总体的个别事物的总称。总体的容......
  • 08 假设检验 | 概率论与数理统计
    1.假设检验1.假设检验问题假设零假设(原假设)\(H_0:\mu=\mu_0\)备择假设(备选假设)\(H_1:\mu\ne\mu_0\)实际推断原理:由于要检验的假设涉及总体均值\(\mu\),因......
  • [概率论与数理统计]笔记:3.5 大数定律与中心极限定理
    3.5大数定律与中心极限定理切比雪夫不等式定义\(EX\)和\(DX\)存在,对于任意的\(\epsilon>0\),有\[P\{|X-EX|\ge\epsilon\}\le\frac{DX}{\epsilon^2}\]证明这里证明\(......
  • [概率论与数理统计]笔记:3.3 随机向量的函数的分布与数学期望
    3.3随机向量的函数的分布与数学期望离散型随机向量的函数的分布定义离散型随机向量\((X,Y)\)的分布为\[P\{X=x_i,Y=y_j\}=p_{ij},\quadi,j=1,2,\cdots,\]随机向......
  • ESP-IDF4.4 VScode安装问题
    一般安装ESP-IDF的环境是不会出错的,一路点击下去即可【ESP-IDFv4.4.3-OfflineInstaller下载地址】。主要是VScode安装ESP-IDF插件的时候会有以下两个问题WARNING:Y......
  • hbase2.4.4重新搭建
    之前的版本有点老,代码已经不适合了。这里使用比较新的环境进行搭建。一:版本1.版本 hadoop使用版本:Hadoop采用3.2.3zookeeper使用版本:载zookeeper3.......
  • ubuntu加入k8s1.24.4集群worker节点
    更新阿里云yumcat<<EOF|sudotee/etc/apt/sources.listdebhttp://mirrors.aliyun.com/ubuntu/focalmainrestricteduniversemultiverse#debhttps://mirrors.aliyu......