首页 > 其他分享 >Pearson相关性分析 —— 入门案例

Pearson相关性分析 —— 入门案例

时间:2024-08-29 23:48:17浏览次数:9  
标签:Pearson 入门 线性关系 相关系数 显著性 相关性 之间 变量

简介

Pearson相关系数

Pearson相关系数是一种统计方法,用于衡量两个连续变量之间的线性相关程度。Pearson相关系数的值范围从-1到1,其中:

  • 接近1的值表示两个变量之间存在强正线性关系。
  • 接近-1的值表示两个变量之间存在强负线性关系。
  • 接近0的值表示两个变量之间没有线性关系。

Pearson相关系数可以用来判断数据是否线性相关,但需要注意以下几点:

  • 它只能检测线性关系,不能检测非线性关系。
  • 它假设两个变量都是连续的,并且分布接近正态分布。
  • 它对异常值敏感,异常值可能会对相关系数的计算结果产生较大影响。

Pearson相关系数的计算公式:
image

其中:

  • \(X_i\) 和 \(Y_i\) 分别是 \(X\) 和 \(Y\) 的第i个观测值。
  • \(\overline{X}\) 和 \(\overline{Y}\) 分别是 \(X\) 和 \(Y\) 的平均值。

利用P值检验

Pearson相关系数告诉我们变量之间是否存在线性关系以及这种关系的强度,但并不告诉我们这种关系是否具有统计显著性。p值提供了这种显著性的证据。因此,它们一起使用可以更全面地评估变量之间的关系。

  • p值越小,表示观察到的数据与零假设的偏差越大,即我们越有理由拒绝零假设,认为两个变量之间存在某种关系。
  • 通常,如果p值小于某个显著性水平(如置信水平0.05),我们认为结果具有统计显著性,即两个变量之间存在显著的相关性。

运行结果

image

根据结果,人均 GDP 和预期寿命之间的皮尔逊相关系数为 0.76,表示两个变量之间存在较强的正相关关系。p 值非常小(远小于置信水平 0.05),因此我们可以拒绝零假设,认为人均 GDP 和预期寿命之间存在显著的线性相关性。

Full Code

import numpy as np
from scipy.stats import pearsonr

# 第一列代表GDP,第二列代表人均寿命
gdp = np.array([62794, 39286, 47603, 42943, 41464, 34483, 46233, 31362, 11289, 8920,
                9771, 2010, 57305, 30371, 9946, 3894, 52367, 23219, 9370, 82950])
life_expectancy = np.array([78.5, 84.1, 80.8, 80.9, 82.3, 82.8, 81.9, 82.0, 72.4, 75.1,
                            76.4, 68.8, 82.6, 83.1, 75.0, 71.5, 81.6, 74.8, 77.4, 83.3])

corr, p_value = pearsonr(gdp, life_expectancy)

print(f"皮尔逊相关系数: {corr:.2f}")
print(f"p 值: {p_value:.4f}")

标签:Pearson,入门,线性关系,相关系数,显著性,相关性,之间,变量
From: https://www.cnblogs.com/marsh-mallow/p/18387734

相关文章

  • Datawhale X 李宏毅苹果书(入门) AI夏令营 task02笔记
    官方学习文档:https://linklearner.com/activity/16/14/55往期task01链接:https://mp.csdn.net/mp_blog/creation/editor/141535616李宏毅老师对应视频课程可供食用:https://www.bilibili.com/video/BV1JA411c7VT/?p=3机器学习基础线性模型        w跟b的值上期ta......
  • Datawhale X 李宏毅苹果书(入门) AI夏令营 task01笔记
    官方学习链接:https://linklearner.com/activity/16/14/42机器学习基础导读        通俗来讲,机器学习就是让机器具备找一个函数的能力。这里指的“找一个函数”,指的是找一个能够描述一个场景数学规律的函数模型,具体方法大致是:让机器运行算法,通过输入的数据,确定合适的......
  • 区块链入门
    1.1区块链技术的发展        随着2008年比特币(Bitcoin)的发明,一个被称为区块链(Blockchain)的新概念进入了人们的视野,这项新技术据信有可能彻底改变整个社会。        区块链有望对每个行业产生颠覆的影响,包括但不限于IT、金融、政府、媒体、医疗、法律......
  • Simscape入门小知识1——Mechanics Explorer
    前言Simscape模型搭建完毕后运行,模型就显示在MechanicsExplorer这个可视化工具里。本篇简单介绍一下该工具的各项操作。1.布局主要有三个窗口:可视化窗口:交互模型树窗口:模型搭建的逻辑关系模型属性窗口:某部件的属性1.1可视化窗口旋转:按住鼠标滚轮移动平移:shift+按住鼠标......
  • 机器学习新手入门笔记03#AI夏令营#Datawhale X 李宏毅苹果书#夏令营
    深度学习实践方法论在应用机器学习算法时,实践方法论能够帮助我们更好地训练模型。如果在Kaggle上的结果不太好,虽然Kaggle上呈现的是测试数据的结果,但要先检查训练数据的损失。看看模型在训练数据上面,有没有学起来,再去看测试的结果,如果训练数据的损失很大,显然它在训练集上面......
  • Python入门阶段---------容易错的点
    Python中笔试中容易出错的知识点汇总前言一、Python的变量命名规范二、List列表1.返回值2.列表中添加新元素3.列表中append()和extend()的区别三、字符串中的切片四、字典中键值对1.字典中的键也分类型2.字典中的查总结前言本文总结了Python入门中容易混......
  • 机器学习/数据分析--通俗语言带你入门随机森林,并用随机森林进行天气分类预测(Accuracy
    ......
  • NSIS入门笔记
    1.基本介绍NSIS(NullsoftScriptableInstallSystem)是一个专业的开源系统,用于创建Windows安装程序。平时工作中想要把exe文件打包,并且在不同系统之间安装,可以使用NSIS,本文使用版本为3.08。2.下载地址可以通过搜索引擎搜索NSIS,推荐安全下载链接:https://nsis.sourceforge.io......
  • ThinkPHP之入门讲解
    目录1ThinkPHP1.1框架1.1.1目录讲解1.1.1.15.x1.1.1.26.0以上1.1.2配置文件1.1.2.15.x1.1.2.26.0以上1.1.3函数文件1.1.3.15.x1.1.3.16.0以上1.2控制器1.2.1控制器的后缀1.2.2框架中的命名空间1.2.3url访问1.2.4调试模式1.2.4.15.x1.2.4.26.0以上1.3创建模块1.......
  • 笔记:第二节快速入门 流程图的使用(下)
     视频第九分钟左右,outArray的size设置为5,初始值定为zeros(1,5),仿真失败。作者将初始值改为为zeros(5,1),之后成功。我尝试将初始值仍定为zeros(1,5),只需将outArray的size设置为-1(代表继承之前格式的意思)或者改为(1,5),仿真也可以运行.按照我的理解对constant的输入[12345]或......