相关系数是根据样本数据计算的度量两个变量之间线性关系强的统计量,若相关关系是根据总体全部数据计算的,成为总体相关系数,记为\(\rho\);若是根据样本数据计算的,则称为样本相关系数,记为\(r\)。
总体相关系数记为:
样本相关系数记为:
\[r=\frac{n\sum{xy}-\sum{x}\sum{y}}{\sqrt{n\sum{x^2}-(\sum{x})^2}*\sqrt{n\sum{y^2}-(\sum{y})^2}}(2) \]其中\(x\)代表样本个体取值,\(X\)代表总体。
推导:
其中,
\[E(X-E(X))(Y-E(Y))=E(XY)-E(YE(X))-E(XE(Y))+E(E(X)E(Y))(4) \]其中,
\[E(YE(X))=E(X)E(Y),E(XE(Y))=E(X)E(Y),E(E(X)E(Y))=E(X)E(Y)(5) \]理解了式(3)的推导过程,对于样本相关系数公式(2)的推导就很容易了。
标签:总体,pearson,推导,相关系数,样本,sigma,sum From: https://www.cnblogs.com/sywang-0916/p/pearsoncorrelationcoefficient.html