1. 散点图的用途
散点图是用两组数据构成多个坐标点,观察坐标点的分布,判断两者之间是否存在某种关联或总结坐标点的分布模式。
从散点图上可以解读两个变量的相互关系,所以一般用于做相关性分析。
2. 什么是相关性分析
对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度。通常用来分析两组或多组数据的变化趋势是否一致。比如熬夜频率与脱发是否相关? 再比如,天气温度是否与碳排放量多少相关?
临床上也需要分析两种疾病的相关性,比如新冠肺炎与心血管疾病的发生是否相关?相关性强弱如何?····这些问题都可以用相关性分析来解决,那么也可以用散点图的形式展现出来。
3. 相关性分析包括哪些内容?
变量间是否存在相关关系?
存在什么相关关系?线性 or 非线性?正相关 or 负相关?
相关性大小?强弱?
4. 相关性散点图怎么看?
1) 坐标轴:
x,y轴分别代表2个变量;
2) 相关性判断:
通过计算相关性系数判断相关性(主要是r值)
相关系数r是反映两个变量之间线性相关程度的指标(R2称为判定系数,用于评估回归模型系数拟合优度)
r的取值范围是[-1,1]。
相关关系的方向:正相关,则r>0;负相关,则r<0
相关关系的强弱:
3) 相关性系数的计算(前两种最常用)
Pearson系数:也叫线性相关系数,用于进行线性相关分析,是最常用的相关系数,当数据满足正态分布时会使用该系数。
Spearman系数:当数据不满足正态分布时,使用该系数。
Kendall系数:通常用于评分数据一致性水平研究(非关系研究)
4) 显著性判断(p值)
P值是用来进行显著性检验的,用来检验变量之间是否有差异以及差异是否显著,P值<0.05,代表数据之间存在显著性的差异。
示例:从图中我们可以得到的信息如下上图x,y轴就分别为LAG3和TRPV3的表达量; 相关性系数是通过Spearman系数来计算的;r=0.287,P<0.001:说明LAG3和TRPV3的表达呈显著弱正相关关系;
5. 其他形式的相关性散点图
不一样的只是形式,解图的方法还是不变,万变不离其宗
(上图显示的是强正相关关系,计算2种相关系数,还标出了回归曲线方程和R2数值,信息比较全面,doi: 10.1016/j.intimp.2020.106828)
(上图显示的是负相关关系,doi: 10.3389/fimmu.2022.872170)
(这张显示的是非线性相关关系,doi: 10.1016/j.intimp.2020.106828)
(这种散点图就是来观察样本分布的,与上面展示相关性的散点图有很大差别,doi: 10.3389/fcell.2022.793425)
标签:分析,系数,散点图,doi,相关性,相关 From: https://www.cnblogs.com/xiaogaobugao/p/16751193.html