第2章 数理统计的基本概念
在概率论中,所研究的随机变量,它的分布都是假设已知的。
在数理统计中,所研究的随机变量,它的分布是未知的。
2.1 简单随机样本
数理统计的核心问题:由样本推断总体
为了了解总体X的分布规律或某些特征,往往通过从总体中抽取一部分个体,根据从这些个体获得的数据来对总体的分布做出推断,
2.1.1总体与个体
总体:研究对象的全体
样本:总体中抽取的一部分个体。
样本容量:样本中所含个体的数量。
抽样:从总体中抽取若干个体的过程。其目的是为了获取样本以推断总体的性质。
2.1.2简单随机样本
样本的二重性:样本要能很好的反映总体的特征,因此需要具有如下性质。
- 同分布性:要求样本\(X_{1},X_{2},X_{3},...,X_{n}\)同分布且与总体\(X\)具有相同的分布。
- 独立性:要求样本\(X_{1},X_{2},X_{3},...,X_{n}\)相互独立
设\(X_{1},X_{2},X_{3},...,X_{n}\)是来自总体\(X\)的容量为n的样本.由于\(X_{1},X_{2},X_{3},...,X_{n}\)都是从总体\(X\)中随机抽取的,它的取值就在总体\(X\)的可能取值范围内随机取得,自然\(X_{1},X_{2},X_{3},...,X_{n}\)也是随机变量
定义1. 设\(X\)是具有分布函数\(F\)的随机变量,若\(X_{1},X_{2},X_{3},...,X_{n}\)是具有同一分布函数\(F\)的、相互独立的随机变量,则称\(X_{1},X_{2},X_{3},...,X_{n}\)为从分布函数\(F\)(或总体\(F\)、或总体\(X\))得到的容量为\(n\)的简单随机样本,简称样本,它们的观察值\(x_{1},x_{2},x_{3},...,x_{n}\),称为样本观察值。
样本可以看成一个随机向量,写成\((X_{1},X_{2},X_{3},...,X_{n})\),此时样本值相应地写成\((x_{1},x_{2},x_{3},...,x_{n})\).
若\((x_{1},x_{2},x_{3},...,x_{n})\)与\((y_{1},y_{2},y_{3},...,y_{n})\)都是对应于样本\((X_{1},X_{2},X_{3},...,X_{n})\)的样本值,一般来说它们是不相同的。
关于样本的分布有如下结论:
设总体\(X\)的分布函数\(F(x)\),则样本\(X_{1},X_{2},X_{3},...,X_{n}\)的联合分布函数为
若总体\(X\)是离散型随机变量,其分布律为\(P\{{X=x_{i}}\}=p(x_{i})(i=1,2,...)\),则样本\(X_{1},X_{2},X_{3},...,X_{n}\)的联合分布律为:
\[ P\{{X_{1}=x_{1},X_{2}=x_{2},..,X_{n}=x_{n}}\}=\prod_{i=1}^{n}p(x_{i}) \]若总体\(X\)是连续型随机变量,其概率密度函数为\(f(x)\),则样本\(X_{1},X_{2},X_{3},...,X_{n}\)的联合概率密度函数为:
\[ f(x_{1},x_{2},..,x_{n})=\prod_{i=1}^{n}f(x_{i}) \]2.1.3常用统计量
定义2:设\(X_{1},X_{2},X_{3},...,X_{n}\)是来自总体\(X\)的一个样本,若样本函数\(g(X_{1},X_{2},X_{3},...,X_{n})\)中不含有任何未知参数,则称\(g(X_{1},X_{2},X_{3},...,X_{n})\)为统计量.
例如:若
标签:总体,...,样本,数理统计,分布,随机变量 From: https://www.cnblogs.com/alexanders/p/17747403.html因为\(X_{1},X_{2},X_{3},...,X_{n}\)都是随机变量,而统计量 \(g(X_{1},X_{2},X_{3},...,X_{n})\)是随机变量的函数,因此统计量也是一个随机变量.设\((x_{1},x_{2},..,x_{n})\)是相应于样本\(X_{1},X_{2},..,X_{n}\)的样本值,则称\(g(x_{1},x_{2},x_{3},...,x_{n})\)是\(g(X_{1},X_{2},X_{3},...,X_{n})\)的观察值。