统计的系统客观性:
统计数据及其活动不是片面的,而是系统客观反映客观现象。
周期的做“总体统计” + 随机/按需/周期做“抽样统计”;
统计的动态进化性:
统计数据及其活动不是静止的,持续的更新(量变)与进化(质变)。
先验信息的收集挖掘和加工, 数量化, 形成"先验分布"并持续进化。
p.294<<概率论与数理统计教程>>
统计学两大学派: Freq学派(频率学派即经典学派) 和 Bayes学派;
“如何利用各种先验信息合理的确定先验分布”是两派如今争论的焦点(在很多场合是困难的)。
“未知量是否可看做随机变量”是两派早先长期争论的焦点, 如今经典学派已不反对这一观点:
因为任一未知量都有“不确定性”,而概率与概率分布 是表达“不确定性程度”的最好语言,
因此将“未知量”看做“随机变量”是合理的。
著名美国经典统计学家Lehmann E.L.在其<<点估计理论>>一书写到:
“把统计问题中的参数看做随机变量的实现,要比看做未知参数更合理一些。”
**统计推断: **
Freq: 根据{样本}信息推断总体的分布或特征数
使用到两种信息{总体信息, 样本信息}
Bayes:根据{先验,样本}信息推断总体的分布或特征数
使用到三种信息{先验信息, 总体信息, 样本信息}
统计推断要用到的先验、总体、样本三种信息:
- 总体信息: 总体分布或总体所属分布族提供信息.
很重要: 更新周期长, 覆盖全, 耗资巨大; - 样本信息: 抽取样本所得观测值提供的信息.
代表性: 抽最新鲜的(更新快), 部分性, 易获取;
通过抽样本对总体分布或特征做较精准统计推断; - 先验信息: 抽样(试验)之前有关统计问题的信息.
常来源于经验和积累的历史资料.
Bayes学派:
Bayes统计学: 基于先验信息、总体信息、抽样信息进行统计推断的统计学, 与“经典统计学”的差别在于用了“先验信息”。
Bayes统计 在重视使用总体信息和样本信息的同时,还注意先验信息的收集、挖掘和加工,使它数量化,形成“先验分布”,参加并动态更新到统计推断。
**Bayes学派 的基本观点是: **
- 任一未知量 ω 都可看做“随机变量”;可用一个概率分布去描述,这个分布称为“先验分布”.
- 获得样本后, “总体分布”、“样本”和“先验分布”通过“Bayes Equation”结合起来得到一个关于未知量 ω 的新分布即“后验分布”。
- 任何关于 ω 的统计推断都应基于其“后验分布”。