首页 > 其他分享 >皮尔逊相关系数(Pearson Correlation Coefficient)

皮尔逊相关系数(Pearson Correlation Coefficient)

时间:2023-08-22 21:34:16浏览次数:37  
标签:Coefficient Pearson 两个 变量 相关系数 协方差 皮尔逊 相关性 Correlation

一、协方差

协方差(Covariance)用于衡量两个随机变量的联合变化程度,方差是协方差的一种特殊情况,即变量和自身的协方差。协方差表示的是两个变量总体的误差,如果两个变量的变化趋势一致,那么两个变量的协方差为正值;如果两个变量的趋势相反,则两个变量之间的协方差为负值。

没听懂,没关系。我们只要知道协方差表达了两类随机变量之间的变化关系

关于为什么方差为什么是协方差的特殊情况下但是表达的意义完全不同

协方差是统计学常用到的术语,在计算时涉及到了概率和相关性分析,公式如下:

公式原理

计算结果:

当Cov(X,Y) > 0,X和Y正相关;

当Cov(X,Y) < 0,X和Y负相关:

当Cov(X,Y) = 0,X和Y不相关。

二、皮尔逊相关系数

两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:

通过上式计算。使得ρ在(-1,1)之间:

皮尔森相关系数反映了两个变量的线性相关性的强弱程度,r的绝对值越大说明相关性越强。

当ρ>0时,表明两个变量正相关,即一个变量值越大则另一个变量值也会越大;
当ρ<0时,表明两个变量负相关,即一个变量值越大则另一个变量值反而会越小;
当ρ=0时,表明两个变量不是线性相关的(注意只是非线性相关),但是可能存在其他方式的相关性(比如曲线方式);

三、皮尔逊相关系数在机器学习中

在机器学习中常用来计算相似度,在数据标准化之后其实和欧几里得、余弦相似度之间并无明显地区别,可参看:https://www.zhihu.com/question/19734616

 

参考

标签:Coefficient,Pearson,两个,变量,相关系数,协方差,皮尔逊,相关性,Correlation
From: https://www.cnblogs.com/HOI-Yzy/p/17649737.html

相关文章

  • 二项式系数 BINOMIAL COEFFICIENTS
    基本恒等式BASICIDENTITIES符号\({\dbinom{n}{k}}\)就是二次项系数,将此符号读作“\(n\)选取\(k\)”。这种常用说法来源于它的组合解释——从一个有\(n\)个元素的集合选取\(k\)个元素做成子集的方法数。嗯,显然有\({\dbinom{n}{k}}=\dfrac{n(n-1)...(n-k+1)}{k(k-1)......
  • Rank Correlation
    目录概KendallrankcorrelationcoefficientSpearman’sfootruleKumarR.,VassilvitskiiS.Generalizeddistancesbetweenrankings.WWW,2010.概有些时候,我们会有比较两组ranking的相似度,比如:\[\bm{x}=[x_1,x_2,\ldots,x_i,\ldots,x_j,\ldots,x_n],......
  • 轮廓系数(Silhouette Coefficient Index)
    轮廓系数(SilhouetteCoefficientIndex)轮廓系数(SilhouetteCoefficientIndex)是一种聚类评估指标,用于评估数据聚类的效果。其取值范围在[-1,1]之间,指标值越大表示聚类结果聚类效果越好。具体来说,轮廓系数既要考虑聚类结果的紧密性,又要考虑聚类结果之间的分离度。如果一个数据......
  • Gini coefficient直观的解释与实现
    引言大家在机器学习中经常会看到基尼系数的词汇,有时候在做比赛的时候,有些赛题的ScoringMetric就是基尼系数。我们去Google或者Baidu,得到的都是些不甚满意的经济学相关......
  • 语义分割评价指标(Dice coefficient, IoU)
    语义分割任务常用的评价指标为Dicecoefficient和IoU。Dice和IoU都是用来衡量两个集合之间相似性的度量,对于语义分割任务而言即用来评估网络预测的分割结果与人为标注结果......
  • pearson总体相关系数到样本相关系数推导过程
    相关系数是根据样本数据计算的度量两个变量之间线性关系强的统计量,若相关关系是根据总体全部数据计算的,成为总体相关系数,记为\(\rho\);若是根据样本数据计算的,则称为样本相......
  • R语言Pearson相关性分析就业率和“性别平等”谷歌搜索热度google trend时间序列数据可
    全文链接:http://tecdat.cn/?p=31585原文出处:拓端数据部落公众号GoogleTrends,即谷歌趋势。谷歌趋势是谷歌旗下一款基于搜索数据推出的一款分析工具。它通过分析谷歌搜索......
  • 迁移学习(Deep CORAL)《Deep CORAL: Correlation Alignment for Deep Domain Adaptation
    论文信息论文标题:DeepCORAL:CorrelationAlignmentforDeepDomainAdaptation论文作者:BaochenSun,KateSaenko论文来源:ECCV2016论文地址:download 论文代码:downlo......
  • 含有nan的数据,计算pearson
    如果使用pandasSeries求Pearson的函数corr:如果是相同位置是NAN,就无视这些NAN,用剩下的元素来计算Pearson。如果是不同位置是NAN,就会计算得出NAN。 pandasDataFrame......
  • CCF-A(KDD'22)FedMSplit: Correlation-Adaptive Federated Multi-Task Learning across
    JiayiChenandAidongZhang.2022.FedMSplit:Correlation-AdaptiveFederatedMulti-TaskLearningacrossMultimodalSplitNetworks.InProceedingsofthe28thA......