多元数据和多元统计分析
<<实用多元统计分析>> 清华大学出版社,5校 正文1.indd 1 2023/9/12 17:14:25
Chapt 1 学习目标
- 理解多元数据及多元统计分析与一元统计分析的区别。
- 掌握数据的计量尺度与数据类型。
- 了解多元统计分析的应用分类。
1.1 多元数据认知
1.1.1 多元数据 的概念
对任何一个现实问题要转化为一个统计问题,首要的工作是要对其特征进行刻画;
- 一般采用随机变量,多个特征采用多个随机变量,如\(large (X_1, X_2,\ \cdots\ , X_p)\) 。
- 随机变量一般是抽象的
- 当随机变量描述的是有具体的意义的指标(特征)时,常用的经济指标有其概念、单位、核算方法等, 如宏观经济指标 GDP、社会商品零售总额、固定资产投资额、消费、个人可支配收入等。此类统计问题:
- 如果仅考虑单一特征(一个变量),则是一元统计问题,
- 若要同时考虑多个特征,且要体现多个经济变量(指标)之间的相关性,
例如,个人消费与其可支配收入正相关等,则不但要分析每一个变量,还要分析它们之间的关联程度;
这就需要对一元统计分析方法进行拓展,
即同时对诸多变量large (X_1, X_2,\ \cdots\ , X_p)$ 进行分析,这就是多元统计分析分析问题的构思。
- 当随机变量描述的是有具体的意义的指标(特征)时,常用的经济指标有其概念、单位、核算方法等, 如宏观经济指标 GDP、社会商品零售总额、固定资产投资额、消费、个人可支配收入等。此类统计问题:
为了对多变量进行统计分析(描述性的或推断性的),我们需要:
- 通过大量的重复观察结果(数据)捕捉多变量及其之间的规律。
- 对有 p 个变量的多元统计问题,我们可以采用矩阵方法对其观察数据进行展示,如矩阵 X 。
xx x11 12 1p xx x21 22 2pX = xx x1 2 n n np
其中, xij 是第 i 个个体的第 j 个变量的观测值; n 是观测的次数(或称为观测的个体数,样本容量); p 是变量的个数。如果有几个不同的个体归属于 s 个不同的群体,则可设 s2是取值为 1,2,…的分类变量以区分这些群体。