Chapt 1 学习目标
- 理解多元数据及多元统计分析与一元统计分析的区别。
- 掌握数据的计量尺度与数据类型。
- 了解多元统计分析的应用分类。
1.1 多元数据认知
1.1.1 多元数据 的概念
对任何一个现实问题要转化为一个统计问题,首要的工作是要对其特征进行刻画;
- 一般采用随机变量,多个特征采用多个随机变量,如\(large (X_1, X_2,\ \cdots\ , X_p)\) 。
- 随机变量一般是抽象的
- 当随机变量描述的是有具体的意义的指标(特征)时,常用的经济指标有其概念、单位、核算方法等, 如宏观经济指标 GDP、社会商品零售总额、固定资产投资额、消费、个人可支配收入等。此类统计问题:
- 如果仅考虑单一特征(一个变量),则是一元统计问题,
- 若要同时考虑多个特征,且要体现多个经济变量(指标)之间的相关性,
例如,个人消费与其可支配收入正相关等,则不但要分析每一个变量,还要分析它们之间的关联程度;
这就需要对一元统计分析方法进行拓展,
即同时对诸多变量large (X_1, X_2,\ \cdots\ , X_p)$ 进行分析,这就是多元统计分析分析问题的构思。
- 当随机变量描述的是有具体的意义的指标(特征)时,常用的经济指标有其概念、单位、核算方法等, 如宏观经济指标 GDP、社会商品零售总额、固定资产投资额、消费、个人可支配收入等。此类统计问题:
为了对多变量进行统计分析(描述性的或推断性的),我们需要:
-
通过大量的重复观察结果(数据)捕捉多变量及其之间的规律。
-
对有 p 个变量的多元统计问题, 可采用矩阵方法对其观察数据进行表示, 如\(\large 矩阵 X\):
\(\large \begin{array}{rl} \\ \begin{bmatrix} \\ & x_{11} & x_{12} & \cdots & x_{1p} \\ & x_{21} & x_{22} & \cdots & x_{2p} \\ & \vdots & \vdots & & \vdots \\ & x_{n1} & x_{n2} & \cdots & x_{np} \\ \end{bmatrix} \\ \end{array}\)
\(\large \begin{array}{rl} \\ \ \ & where, & \\ & \bm{ x_{ij}}: \bm{Oberservation}\ of\ \bm{i-th\ Individual} \ and\ \bm{j-th\ Variable}\\ & \bm{ n }: \bm{Sample \ Size} \\ & \bm{ p }: \bm{Variable \ Size} \\ \end{array}\) -
分类变量:
如果,.有几个不同的个体属于 s 个不同的群体,
则, 设 s 是取值为$1, 2, \cdots, $的分类变量, 以区分这些群体。