首页 > 其他分享 >基本概念(二):方差、协方差、相关系数 原点矩和中心矩

基本概念(二):方差、协方差、相关系数 原点矩和中心矩

时间:2024-04-13 14:44:26浏览次数:39  
标签:le 中心矩 2E 相关系数 协方差 XY EX rho

方差

期望反应的时均值概念,方差反应的则是数据的波动概念,为了防止±波动在求和过程中抵消以及防止求abs导致的不可导问题,我们使用平方来统计波动数据。随机变量的方差定义为:

\[D(X)= E[(X-E(X))^2] \]

对上式展开:

\[D(X) = E\lbrace X^2 -2XE(X) + E(X)^2 \rbrace = \\ E(X^2) - 2E(X)E(X) + E(X)^2 = \\ E(X^2) - E(X)^2 \]

方差的性质
  1. \(D(X+C) = D(X)\)

证:

\[D(X+C) = E[(X+C)^2] - E(X+C)^2 = \\ E\lbrace X^2 +2CX + C^2\rbrace - E(X)^2 - C^2 - 2CE(X)= \\ E(X^2) - E(X)^2 = D(X) \]

  1. \(D(CX) = C^2D(X)\)

证:

\[D(CX) = E[(CX)^2] - [CE(X)]^2 = E(C^2X^2) - C^2E(X)^2 \\ C^2E(X^2) - C^2E(X)^2 = C^2[E(X^2) - E(X)^2] = C^2D(X) \]

  1. \(D(X±Y)=D(X)+D(Y)\) 仅XY独立时成立

\[D(X±Y) = E\lbrace X^2 + Y^2 ± 2XY \rbrace - [E(X±Y)]^2 \\ =E(X^2) +E(Y^2) ± 2E(XY) -\lbrace E(X)^2 + E(Y)^2 ±2E(X)E(Y)\rbrace = \\ E(X^2) - E(X)^2 + E(Y^2)-E(Y)^2 + 2[E(XY)-E(X)E(Y)] \]

当\(XY\)独立时,\(E(XY)=E(X)E(Y)\)
则:

\[D(X±Y) = D(X) + D(Y) \]

协方差

协方差的定义为\(Cov(X,Y) = E[(X-EX)(Y-EY)]\)
适当化简上式:

\[Cov(X,Y) = E\lbrace XY + EXEY -XEY-YEX\rbrace = E(XY)-EXEY \]

可以发现其和\(D(X+Y)\)的关系式:

\[D(X+Y)= D(X)+D(Y) + 2[E(XY)- EXEY] = D(X)+D(Y)+2Cov(X,Y) \]

协方差实际使用时,容易受到量纲的影响,比如分析身高相关的协方差时,使用m和cm作为单位,协方差数值上相差1万倍

协方差实际上描述的是变量相关性,当XY独立时,\(E(XY) = EXEY; Cov(X,Y) = 0\),但不能通过协方差为0判定XY独立,即独立一定不相关,不相关不一定独立

相关系数

定义相关系数为

\[\rho = \frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}}, \quad \quad-1 \le\rho\le 1 \]

柯西施瓦兹不等式

\[[E(XY)]^2 \le [EX]^2[EY]^2 \]

证明:
设\(g(t) = E[(tX-Y)^2]\) 易知:\(g(t) \ge 0\)

\[E\lbrace t^2X^2 -2tXY + Y^2\rbrace \ge 0 \\ t^2E(X^2) +EY^2 - 2tE(XY) \ge0 \\ \rightarrow \Delta=4(EXY)^2 - 4EX^2EY^2 \le 0 \\ \rightarrow [E(XY)]^2 \le EX^2EY^2 \]

令\(X_1 = X-EX, Y_1 = Y-EY\)

\[\rho^2= \frac{[E(X_1Y_1)]^2}{EX_1^2EY_1^2} \quad\quad 由柯西施瓦兹不等式 \\ \rho^2 \le 1, 故 -1 \le \rho \le 1 \]

\(\rho\)描述的是随机变量之间的线性关系, 纯线性关系可以表示为:\(Y=aX+ b\); 当\(\rho = -1\)时,变量之间是负的线性关系,当\(\rho = 1\) 时,变量之间是线性关系,当\(\rho = 0\)时,表示两者无线性关系(不是独立)

言外之意,(-1,0)时有负相关,(0,1)时是正相关,越靠近0,相关性越弱

原点矩和中心矩

k阶原点矩定义\(E(X^k)\),因此期望也叫做一阶原点矩

中心矩定义为\(E[(X-u)^k]\), 因此\(D(X)=E[(X-EX)^2]\)是以EX为中心的二阶中心矩,上面的EX是以原点(0)为中心的一阶矩
实际应用中,很少超过四阶矩
后续的随机过程中,还涉及到矩的应用

标签:le,中心矩,2E,相关系数,协方差,XY,EX,rho
From: https://www.cnblogs.com/fyyy94/p/18132846

相关文章

  • 计算降水和ENSO指数的相关系数或者回归系数,并做显著性检验
    '''Description:计算降水和ENSO指数的相关系数或者回归系数,并做显著性检验-----------------------------------------Time:2024/02/1910:42:04Author:ForxdVersion:1.0'''#%%importxarrayasxrimportnumpyasnpi......
  • 12种相关系数汇总!
    所谓相关关系是指2个或2个以上变量取值之间在某种意义下所存在的规律,其目的在于探索数据集所存在隐藏的关系网,在19世纪80年代,Galton通过研究人类身高遗传问题首次提出了相关的概念,文中指出相关关系可以定义为:一个变量变化时,另一个变量或多或少的相应的变量。这种相关关系的统计量......
  • 基于协方差矩阵自适应演化策略(CMA-ES)的高效特征选择
    特征选择是指从原始特征集中选择一部分特征,以提高模型性能、减少计算开销或改善模型的解释性。特征选择的目标是找到对目标变量预测最具信息量的特征,同时减少不必要的特征。这有助于防止过拟合、提高模型的泛化能力,并且可以减少训练和推理的计算成本。如果特征N的数量很小,那么穷......
  • 数学建模之相关系数模型及其代码
    发现新天地,欢迎访问小铬的主页(www.xiaocr.fun)引言本讲我们将介绍两种最为常用的相关系数:皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行计算和分析(建模论文中最容易用错......
  • 论文研读_通过具有可扩展的小子种群的协方差矩阵适应性进化策略解决大规模多目标优化
    论文研读_通过具有可扩展的小子种群的协方差矩阵适应性进化策略解决大规模多目标优化问题创新点随着目标或决策变量的数量增加,收敛性和多样性之间的冲突变得更为严重,因此在它们之间取得平衡变得越来越困难。此时S3-CMA-ES,它使用一系列子种群来近似LSMOPs的PFs,并强调不同子种......
  • 在Python中创建相关系数矩阵的6种方法
    相关系数矩阵(Correlationmatrix)是数据分析的基本工具。它们让我们了解不同的变量是如何相互关联的。在Python中,有很多个方法可以计算相关系数矩阵,今天我们来对这些方法进行一个总结PandasPandas的DataFrame对象可以使用corr方法直接创建相关矩阵。由于数据科学领域的大多数人都......
  • 协方差
    协方差协方差的计算公式协方差的计算公式为:COV(X,Y)=E(XY)-E(X)E(Y)。EX为随机变量X的数学期望,EXY是XY的数学期望。协方差在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。变量间相关的关系:一般有三种:正相关、负......
  • 协方差矩阵
     概念协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。其实简单来讲,协方差就是衡量两个变量相关性的变量。当协方差为正时,两个变量呈正相关关系(同增同减);当协方差为负时,两个变量呈负相关关系(一增一减)。......
  • numpy中计算相关系数的np.corrcoef
    np.corrcoef的作用计算Pearson乘积矩相关系数。它可以用来分析给定数据集中各个变量之间的线性相关程度,返回一个相关系数矩阵,相关系数矩阵中的值介于-1到1之间,包括-1和1。这些值表明了变量之间的线性相关性及其方向。具体来说,正值接近1表示正向线性相关,负值接近-1......
  • 皮尔逊相关系数(Pearson Correlation Coefficient)
    一、协方差协方差(Covariance)用于衡量两个随机变量的联合变化程度,方差是协方差的一种特殊情况,即变量和自身的协方差。协方差表示的是两个变量总体的误差,如果两个变量的变化趋势一致,那么两个变量的协方差为正值;如果两个变量的趋势相反,则两个变量之间的协方差为负值。没听懂,没关系......