多元统计分析
目录
定义
研究多个随机变量之间相互依赖关系以及内在统计规律性的理论和统计方法的总称。
研究对象:多维随机变量
研究内容:
- 降维问题「主成分分析、因子分析、对应分析」
使相互依赖的变量变成互不相关的
高维投影到低维,简化问题 - 归类问题「聚类分析、判别分析」
按照相似程度进行归类 - 变量间的相互关系
分析一个或几个变量的变化是否依赖于另一些变量的变化?若是则建立变量间的定量关系式,并用于预测或控制。
预测或控制:回归分析
两组变量间的相互关系:典型相关分析
一组变量依赖另一组变量的变化关系:偏最小二乘回归分析 - 多元数据的统计推断
参数估计、假设检验、多元正态分布的均值向量和协差阵的估计和假设检验 - 多元统计分析的理论基础
多维随机变量、多维正态随机向量,研究其分布和性质
多元统计数据的图表示法
轮廓图、雷达图、调和曲线图、散点图等
高维数据先降维再用图表示
多元统计分析的简单指标
- 数据的采集:
可靠性、完备性、相关性 - 数据的清洗:
格式标准化、异常数据清除、错误纠正、缺失值处理、时间校准等 - 数据的分析:选择合适的建模方法