由于学校的概率论与数理统计课有些一言难尽,开始在这里自学书上后面的数理统计部分的知识。
1. 基本概念
数理统计学中,我们通常将研究的对象叫做总体,而组成总体的基本单元称为个体,我们认为一个随机变量为一个总体,总体的 \(n\) 个测量结果 \((x_1, x_2, \cdots, x_n)\) 为一个随机向量 \((X_1, X_2, \cdots, X_n)\) 的观察值。其中随机向量的每个分量都是随机且独立的。
设 \((X_1, X_2, \cdots, X_n)\) 是一个 \(n\) 维随机向量,且 \(X_i\,(i = 1, 2, \cdots, n)\) 与 \(X\) 同分布且相互独立,则称这个随机向量为 \(X\) 的一个简单随机样本,简称样本,称 \(n\) 为样本空间。
显然由于独立性,若 \(X\) 的密度函数为 \(f(x)\),则 \((X_1, X_2, \cdots, X_n)\) 的联合密度函数为:
\[g(x_1, x_2, \cdots, x_n) = \prod_{i = 1}^n f(x_i) \]同理,若 \(X\) 的分布函数为 \(F(x)\),则 \((X_1, X_2, \cdots, X_n)\) 的联合分布函数为:
\[G(x_1, x_2, \cdots, x_n) = \prod_{i = 1}^n F(x_i) \]通常我们希望通过一组数据得出一些信息,所以我们定义统计量,即设 \((X_1, X_2, \cdots, X_n)\) 是总体 \(X\) 的一个样本,函数 \(T(X_1, X_2, \cdots, X_n)\) 是未知量 \(x_1, x_2, \cdots, x_n\) 一个不含未知量的参数的函数,则称 \(T(X_1, X_2, \cdots, X_n)\) 是一个统计量。如果将样本值代入函数,那么就称这个函数值为统计量的观察值。
常用统计量有:
- 样本均值:
- 样本方差:
同样,也有标准差:\(s = \sqrt{\dfrac{1}{n - 1} \sum_{i = 1}^n \limits (X_i - \bar{X})}\)。
- 样本矩:
样本 \(k\) 阶原点矩为:
\[A_k = \dfrac{1}{n} \sum_{i = 1}^n X_i^k \]样本 \(k\) 阶中心矩为:
\[B_k = \dfrac{1}{n} \sum_{i = 1}^n (X_i - \bar{X})^k \]可以看到:
\[A_1 = \bar{X}, B_2 = \dfrac{n - 1}{n} S^2 \]注意到样本方差的定义与离散随机变量方差的定义之中,两个定义的分母不同,这是因为这样定义可以使得 \(E(S^2) = D(X)\),我们将在估计量的无偏性这个知识点处证明这一点。
而且由于辛钦大数定律,我们可以证明,如果 \(X\) 的 \(k\) 阶原点矩存在,\(E(X^k) = \mu_k\),则样本原点矩依概率收敛于 \(\mu_k\)。
设 \(X\) 是一个随机变量,\(\alpha\) 为满足 \(0 < \alpha < 1\) 的实数,若数 \(x_{1 - \alpha}\) 满足
\[P\{X \le x_{1 - \alpha}\} = 1 - \alpha \]则称 \(x_{1 - \alpha}\) 为 \(X\) 的上 \(\alpha\) 分位数,简称分位数,或分位点,或临界值。
如果数 \(x_{\alpha}\) 满足
\[P\{X \le x_{\alpha} \} = \alpha \]则称 \(x_{\alpha}\) 为 \(X\) 的下 \(\alpha\) 分位数。
对于标准正态分布变量 \(X \sim N(0, 1)\),上 \(\alpha\) 分位数记作 \(u_{1 - \alpha}\),显然有:
\[\Phi(u_{1 - \alpha}) = 1 - \alpha \\ u_{\alpha} = -u_{1 - \alpha} \] 标签:bar,dfrac,sum,样本,cdots,笔记,数理统计,alpha From: https://www.cnblogs.com/Nickel-Angel/p/17237952.html