数学建模--皮尔逊相关系数、斯皮尔曼相关系数

标签：这个 -- 相关系数检验斯皮尔曼皮尔逊数据我们

1.总体的皮尔逊相关系数

2.样本的皮尔逊相关系数

3.对于皮尔逊相关系数的认识

1.总体的皮尔逊相关系数

我们首先要知道这个皮尔逊相关系数里面的两个概念，我们的系数的计算要使用到这两个概念，一个就是总体的均值（就是求和之后求解平均值），xy各是一组数据，我们使用这个x里面的数据减去第一组的均值乘上第二组的数值减去均值，然后做乘法求和，除以on就是这个两组数据的协方差

皮尔逊相关系数就是在协方差的基础上面，除以各自对应的标准差，这个除以标准差的过程，实际上就是进行的这个标准化的过程，这个标准化之后的协方差就是我们的皮尔逊相关系数；

2.样本的皮尔逊相关系数

我们的总体的皮尔逊相关系数是除以这个数组的个数n,但是这个样本的皮尔逊相关系数是除以这个n-1,这个就是两者在计算上面的区别；

上面的这个无论是总体的皮尔逊相关系数，还是样本的皮尔逊相关系数，都是为了让我们了解这个背后的计算方法，在实际的数学建模里面，我们是使用的相关的数学软件里面的函数直接进行这个计算的，并不会用到上面的理论知识，但是只有了解这些理论知识，当我们的结果计算出来的时候，我们才可以让这个结果结合理论对于我们的题目进行描述性说明，达到我们的建模的效果；

3.对于皮尔逊相关系数的认识

通过上面的这个图形，我们也可以看出来同样是0.816的系数，我们的散点图的绘制效果完全不同，这个就是因为我们的这个皮尔逊相关系数使用是有自己的条件的，如果我们无论是什么模型都去计算这个皮尔逊相关系数，其实是没有他的真实含义的；

实际上只有两个变量之间是线性相关，这个相关系数的求解计算才会有实际意义，因此这个就要求我们首先要进行这个可视化，做出来这个散点图，根据这个散点图去判断我们的这个两个变量之间是否满足线性相关，只有满足的情况下我们再去计算这个皮尔逊相关系数；

对于上面的这四张图片，我们进行下面的解释，就是这个皮尔逊相关系数即使是一样的，但是这个实际情况却截然不同，第一个图像上面的数据点显然不是线性相关的，但是这个皮尔逊相关系数的计算结果显示这个数据集具有很强的相关性，离散的点对于这个皮尔逊系数的影响也很大，最后一张图的那个根本就没有相关关系，但是这个计算结果却很大，实际上这个计算结果是没有实际意义的；

因此，我们进行总结，当两个变量之间满足线性相关的时候，结果大就说明两个变量的相关性强，小就是两个变量的相关性弱，但是如果这两个变量就没有相关性，这个时候即使计算结果很大也不能说明两个变量之间具有较强的相关性；

4.描述性统计以及corr函数

下面这个就是多组向量，我们可以先进行可视化的工作，然后根据这个可视化的结果去判断这个是否满足线性相关，满足的话我们就是用这个corr函数进行皮尔逊相关系数的计算；

但是对于这样的数据类赛题，我们拿到这个数据之后最好是进行一下这个数据的描述性分析，就是计算这个数据的平均值，方差之类的，获得这个数据的数字特征，利于我们后续的分析；

我们使用下面的这个基本的计算方差，均值，标准差之类的函数对于这个数据的数字特征进行计算和说明，这个是我们的准备工作；然后我们就可以去调用这个corrcoef函数你进行这个相关系数的计算，这个计算结果就是一个6*6的矩阵，表示这6个变量之间一一对应的相关系数，因为这个1和2，2和1的这个相关系数应该是一样的，因此使用这个函数输出的这个矩阵也是一个对称矩阵，只需要看一半就可以知道任意两组数据之间的相关关系；