方差
期望反应的时均值概念,方差反应的则是数据的波动概念,为了防止±波动在求和过程中抵消以及防止求abs导致的不可导问题,我们使用平方来统计波动数据。随机变量的方差定义为:
\[D(X)= E[(X-E(X))^2] \]对上式展开:
\[D(X) = E\lbrace X^2 -2XE(X) + E(X)^2 \rbrace = \\ E(X^2) - 2E(X)E(X) + E(X)^2 = \\ E(X^2) - E(X)^2 \]方差的性质
- \(D(X+C) = D(X)\)
证:
\[D(X+C) = E[(X+C)^2] - E(X+C)^2 = \\ E\lbrace X^2 +2CX + C^2\rbrace - E(X)^2 - C^2 - 2CE(X)= \\ E(X^2) - E(X)^2 = D(X) \]- \(D(CX) = C^2D(X)\)
证:
\[D(CX) = E[(CX)^2] - [CE(X)]^2 = E(C^2X^2) - C^2E(X)^2 \\ C^2E(X^2) - C^2E(X)^2 = C^2[E(X^2) - E(X)^2] = C^2D(X) \]- \(D(X±Y)=D(X)+D(Y)\) 仅XY独立时成立
当\(XY\)独立时,\(E(XY)=E(X)E(Y)\)
则:
协方差
协方差的定义为\(Cov(X,Y) = E[(X-EX)(Y-EY)]\)
适当化简上式:
可以发现其和\(D(X+Y)\)的关系式:
\[D(X+Y)= D(X)+D(Y) + 2[E(XY)- EXEY] = D(X)+D(Y)+2Cov(X,Y) \]协方差实际使用时,容易受到量纲的影响,比如分析身高相关的协方差时,使用m和cm作为单位,协方差数值上相差1万倍
协方差实际上描述的是变量相关性,当XY独立时,\(E(XY) = EXEY; Cov(X,Y) = 0\),但不能通过协方差为0判定XY独立,即独立一定不相关,不相关不一定独立
相关系数
定义相关系数为
\[\rho = \frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}}, \quad \quad-1 \le\rho\le 1 \]柯西施瓦兹不等式
\[[E(XY)]^2 \le [EX]^2[EY]^2 \]证明:
设\(g(t) = E[(tX-Y)^2]\) 易知:\(g(t) \ge 0\)
令\(X_1 = X-EX, Y_1 = Y-EY\)
\[\rho^2= \frac{[E(X_1Y_1)]^2}{EX_1^2EY_1^2} \quad\quad 由柯西施瓦兹不等式 \\ \rho^2 \le 1, 故 -1 \le \rho \le 1 \]\(\rho\)描述的是随机变量之间的线性关系, 纯线性关系可以表示为:\(Y=aX+ b\); 当\(\rho = -1\)时,变量之间是负的线性关系,当\(\rho = 1\) 时,变量之间是线性关系,当\(\rho = 0\)时,表示两者无线性关系(不是独立)
言外之意,(-1,0)时有负相关,(0,1)时是正相关,越靠近0,相关性越弱
原点矩和中心矩
k阶原点矩定义\(E(X^k)\),因此期望也叫做一阶原点矩
中心矩定义为\(E[(X-u)^k]\), 因此\(D(X)=E[(X-EX)^2]\)是以EX为中心的二阶中心矩,上面的EX是以原点(0)为中心的一阶矩
实际应用中,很少超过四阶矩
后续的随机过程中,还涉及到矩的应用