首页 > 其他分享 >数模——相关性分析

数模——相关性分析

时间:2023-08-03 14:22:16浏览次数:36  
标签:分析 定序 变量 定距 数模 相关性 定类 定比

相关性分析

基本变量:

定类、定序、定距、定比是统计学中对变量的常见分类方式,它们描述了不同类型变量的特征和测量尺度,以下是它们之间的区别:

1. 定类(Nominal)变量:

定类变量是指用于标识或分类个体或事物的变量,其取值仅表示不同的类别或分类,没有顺序或大小的含义。例如,性别(男、女)、血型(A、B、AB、O)等就属于定类变量。定类变量通常用符号或名称来表示。

2. 定序(Ordinal)变量:

定序变量是指具有一定顺序但无法测量其差异大小的变量。它们表示的是相对的顺序关系,而不是具体的数值大小。例如,教育程度(小学、中学、高中、大学)可以看作是一个定序变量。虽然它们有一定的顺序,但我们无法确定每个级别之间的具体差异。

3. 定距(Interval)变量:

定距变量是指具有一定的顺序和可以测量差异大小的变量,但没有绝对的零点。定距变量表示了变量之间的固定间隔,但没有一个真正意义上的“零”。例如,温度的摄氏度就是一个定距变量,0°C并不表示完全没有温度,只能说明相对于绝对零点的温度差异。

4. 定比(Ratio)变量:

定比变量是指具有一定顺序、可以测量差异大小,并且具有绝对零点的变量。定比变量具有绝对零点的意义是零点表示完全没有该属性或现象。例如,年龄、身高、重量都是定比变量,它们具有具体的数值大小,并且可以进行比较和计算。

总之,定类、定序、定距和定比是描述不同类型变量的方式,它们在测量尺度和所表示的信息的程度上具有不同的特征。了解变量的类型有助于我们选择适当的统计分析方法。

 

分析方法:

皮尔逊系数法 (Pearson相关系数):

  • 是统计学中运用最为广泛的一种相关程度分析统计量,检验是常用 t 统计量 (其中统计量 t 应当服从t (n-2) ,n为特征总量)。
  • 适用条件:
    • 两个变量均应由测量得到的连续变量
    • 两个变量应该均来自正态总体,或接近正态的单峰对称分布
    • 变量必须是成对的数据
    • 两个变量之间存在线性关系
    • 两个变量是定距、定比类型的变量
  • 相关性系数 r :
  • 统计量 t :大于上 a / 2分位点即为合理
  • 相关程度描述与区分:

Spearman相关性系数法:

  • 适用于度量定序变量与定序变量之间的的相关性分析。
  • 计算的具体步骤:
  1. 将变量按大小次序排序,从大到小排序
  2. 计算(赋予)等级次序,为每一个排序后的数据分配一个等级次序,最小值的等级为1,此后一次加1
  3. 计算等级差 di 、相关系数 rs 、检验统计量 t 
  4. 分析相关性
  • 相关性系数 rs

     

  • 其中 d表示 ( xi - y)2
  • 统计量 t :大于上 a / 2分位点即为合理,使用统计量 t 进行检验建议 n > 20。

其他:

 

标签:分析,定序,变量,定距,数模,相关性,定类,定比
From: https://www.cnblogs.com/Tatsukyou/p/17603228.html

相关文章

  • 数据分析框架1.0 从黄金思维圈到万能三步走
    有上过我SQL实战项目课程的同学会知道,这个项目很复杂,因为我在万能三步走的基础上,把分析逻辑拆成了两层:数据层和业务层。虽然逻辑复杂了,但同学反馈很实用,甚至有同学在工作中反复回看说能一次次地解决ta问题。今天,就给各位介绍这个落地的分析框架,我给它起名叫:勤思·平行分析框架。......
  • 数据分析框架1.0 从黄金思维圈到万能三步走
    有上过我SQL实战项目课程的同学会知道,这个项目很复杂,因为我在万能三步走的基础上,把分析逻辑拆成了两层:数据层和业务层。虽然逻辑复杂了,但同学反馈很实用,甚至有同学在工作中反复回看说能一次次地解决ta问题。今天,就给各位介绍这个落地的分析框架,我给它起名叫:勤思·平行分析框架。......
  • 三维墙板行业市场现状分析与发展前景预测报告
    2023-2029全球三维墙板行业调研及趋势分析报告2022年全球三维墙板市场规模约33亿元,2018-2022年年复合增长率CAGR约为%,预计未来将持续保持平稳增长的态势,到2029年市场规模将接近48亿元,未来六年CAGR为5.5%。全球五大三维墙板(3DWallPanels)制造商分别是GuangzhouShimaDecorating......
  • 软件供应链安全行业市场现状分析与发展前景预测报告
    2023-2029全球软件供应链安全行业调研及趋势分析报告2022年全球软件供应链安全市场规模约亿元,2018-2022年年复合增长率CAGR约为%,预计未来将持续保持平稳增长的态势,到2029年市场规模将接近亿元,未来六年CAGR为%。软件供应链是指在整个软件开发生命周期(SDLC)中涉及应用程序或在......
  • 软机器人夹持器行业市场现状分析与发展前景预测报告
    2023-2029全球软机器人夹持器行业调研及趋势分析报告2022年全球软机器人夹持器市场规模约18亿元,2018-2022年年复合增长率CAGR约为%,预计未来将持续保持平稳增长的态势,到2029年市场规模将接近98亿元,未来六年CAGR为26.6%。全球五大软机器人夹持器(SoftRoboticGripper)制造商分别是S......
  • 燃料电池备用电源行业市场现状分析与发展前景预测报告
    2023-2029全球燃料电池备用电源行业调研及趋势分析报告2022年全球燃料电池备用电源市场规模约11亿元,2018-2022年年复合增长率CAGR约为%,预计未来将持续保持平稳增长的态势,到2029年市场规模将接近67亿元,未来六年CAGR为29.0%。全球燃料电池备用电源(FuelCellBackupPower)主要厂商......
  • 青年旅社行业市场现状分析与发展前景预测报告
    2023-2029全球青年旅社行业调研及趋势分析报告2022年全球青年旅社市场规模约238亿元,2018-2022年年复合增长率CAGR约为%,预计未来将持续保持平稳增长的态势,到2029年市场规模将接近386亿元,未来六年CAGR为7.3%。全球青年旅社(YouthHostel)核心厂商有MEININGERHotels、GeneratorHost......
  • [数据分析与可视化] Python绘制数据地图4-MovingPandas入门指北
    MovingPandas是一个基于Python和GeoPandas的开源地理时空数据处理库,用于处理移动物体的轨迹数据。它提供了一组强大的工具,可以轻松地加载、分析和可视化移动物体的轨迹。通过使用MovingPandas,用户可以轻松地处理和分析移动对象数据,并从中提取有关行为、模式和趋势的见解。无论是处......
  • 可视化分析30天免费,瓴羊Quick BI助力企业转型
    在现代化的社会经济背景下,数字化转型正在以前所未有的速度加速,这在很大程度上推动了国内企业积极求取数字化升级的态势。在这个过程中,企业的创新和发展模式也正在不断地改变,尤其是针对数据驱动的智能决策系统,其重要性日益突出。商业BI工具市场以其活跃的态势蓬勃发展。它作为一种创......
  • 聚焦 TimescaleDB VS TDengine 性能对比报告,IoT 场景下全面分析写入与查询
    基于第三方基准性能测试平台TSBS(TimeSeriesBenchmarkSuite)标准数据集,TDengine 团队在TSBS的IoT场景中,预设了五种规模的卡车车队基础数据集,在相同的AWS云环境下对时序数据库(TimeSeriesDatabase) TDengine3.0 和TimescaleDB2.10.1进行了对比分析。本文将会从写入......