首页 > 其他分享 >使用SPSS分析数据简单教程

使用SPSS分析数据简单教程

时间:2024-07-29 18:19:37浏览次数:10  
标签:教程 显著性 假设 3.1 检验 SPSS 简单 0.05

1. SPSS

SPSS原名社会科学统计包Statistical Package for the Social Sciences),SPSS公司于2000年正式将英文全称更改为统计产品与服务解决方案Statistical Product and Service Solutions)。2009年7月28日,SPSS公司宣布该公司被IBM收购。

2. 解决什么问题?

一般我们使用SPSS来对数据进行处理和结果分析,常见的场景是显著性的计算,通过计算p值来得出2个因素之间是否存在显著性的关联。

2.1 显著性

有关显著性这里我们只简单记住2个概念,一个是显著性水平Significance Level

显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,用α表示。
常见的值如0.05或0.01。它代表了研究者愿意承担的犯第一类错误(错误地拒绝真实的原假设)的最大概率。
显著性水平帮助研究者控制假阳性结果的出现,即错误地认为处理效应是有意义的,而实际上可能是由于随机误差所致。‌

一个是P值probably value

P值是在原假设为真的情况下,观察到当前数据或更极端数据的概率。
P值衡量了观察到的效果在统计上显著的证据强度。
如果P值小于显著性水平(例如0.05),研究者通常会拒绝原假设,认为观察到的效果是统计显著的。
P值越小,拒绝原假设的理由越充分,表明观察到的效果不太可能是由随机误差产生的。‌

总结来说,显著性水平是研究者设定的一个标准,用于控制假阳性的出现概率;而P值是根据实际数据计算出来的,用于评估观察到的效果是否足够显著以拒绝原假设。
简而言之:p>α 推翻原假设,p<α 维持原假设。

3. 根据不同数据类型选择不同的处理方法

3.1 连续变量

首先对数据进行正态性检验(见3.1.1),如果数据符合正态分布,参照上表,根据组的数量,进行独立样本T检验(见3.1.2)或者单因素ANOVA(Analysis of Variance,方差分析,见3.1.3);如果数据不符合正态分布,参照上表,根据组的数量,进行曼-惠特尼 U 检验或者克鲁斯卡尔-沃利斯检验(见3.1.4)。

3.1.1 正态性检验




3.1.1.1 正态性检验结果解读


一般我们取显著性水平α=0.05,在输出的上表结果中,可以看到有左右2部分,分别采用了Kolmogorov-Smirnov (K-S) 检验Shapiro-Wilk (S-W) 检验,简单来讲,K-S适用于样本较大(n ≥ 50)的情况,S-W适用于小样本(n < 50)情况。但是一般来讲,样本数量<100使用S-W都是可行的。我们不能只关注p值,也要同时查看Q-Q图来辅助决策

如上图,如果点的分布与直线偏差不大,同时p值>0.05,那么我们便可以认为原假设成立,即:数据符合正态分布,否则则不是正态分布。

3.1.2 独立样本T检验




3.1.2.1 如何将一个变量重新编码成新的分组变量

例如上面提到的术后90天mRS评分是一个包含0~6共7个参数的分类变量,但是我们只需要将评分划分为2个组,那么就需要根据计算规则重新生成一个分组变量,操作如下


点击变化量


按范围添加
这样就生成了一个新的分组变量。

3.1.2.2 独立样本T检验结果解读


上图是结果输出,我们主要关注下表。
可以看到下表分为左右2部分,左边是Levene检验用于校验方法齐性,右边是t检验结果,上图中假定等方差的p = 0.054 > 0.05于显著性水平,拒绝原假设,认为方差是不相等的。所以看下面的那条数据(通常称为Welch's t检验)。
p = 0.090 > 0.05 ,不拒绝原假设,认为年龄和分组没关系。

3.1.3 单因素ANOVA检验



3.1.3.1 单因素ANOVA检验结果解读


p = 0.128 > 0.05 ,不拒绝原假设,认为年龄和评分没关系。

3.1.4 曼-惠特尼 U 检验




一般让SPSS自己选择方法就行了,也可以自己定制。

3.1.4.1 曼-惠特尼 U 检验结果解读


p = 0.654 > 0.05 ,不拒绝原假设,认为2者没关系。
我们选择一个>=3个分组的数据,就是克鲁斯卡尔-沃利斯检验了。

3.2 分类变量

卡方检验主要用于以下两种情况:
独立性检验 (Test of Independence):检验两个分类变量之间是否存在关联。例如,性别和喜欢的颜色之间是否有关联。
拟合优度检验 (Goodness of Fit Test):检验观察到的频率分布是否符合预期的频率分布。

3.2.1 卡方检验



3.2.1.1 卡方检验结果解读


主要关注第一行,皮尔逊卡方(Pearson Chi-Square)
p 值 = 1:这意味着检验的观察值与预期值完全吻合,几乎不可能出现这样的情况。通常来说,p 值为 1 表示没有任何证据反对零假设,换句话说,数据完全支持零假设(即变量之间没有关联)。
我们换个数据

如果p 值小于 0.05,说明在 95% 的置信水平下,我们可以拒绝零假设,表明变量之间存在显著关联。
但是上表中 p = 0.456 不能拒绝零假设,说明糖尿病和轻重症没有显著关联。

注意事项:
期望频数:检查每个单元格的期望频数,如果有单元格的期望频数低于 5,结果可能不可靠。SPSS 会在输出中显示期望频数。
数据量:确保数据量足够大,样本量过小会影响卡方检验的结果。

标签:教程,显著性,假设,3.1,检验,SPSS,简单,0.05
From: https://www.cnblogs.com/datangguanjunhou/p/18330743

相关文章

  • SqlSugar 多数据源的简单封装
    参考SqlSugar的官网文档,我自己封装了一个支持多数据库的UnitOfWork的SqlSugar封装类,直接使用SqlSugar的仓储操作如下:///<summary>///数据库实例基类///</summary>publicabstractclassBaseDbClient{///<summary>///获取数据库客户端实例......
  • 网络安全入门教程(非常详细)从零基础入门到精通,看完这一篇就够了。
    学前感言:1.这是一条坚持的道路,三分钟的热情可以放弃往下看了.2.多练多想,不要离开了教程什么都不会了.最好看完教程自己独立完成技术方面的开发.3.有时多google,baidu,我们往往都遇不到好心的大神,谁会无聊天天给你做解答.4.遇到实在搞不懂的,可以先放放,以后再来解决.基......
  • 【RTT-Studio】详细使用教程六:按键检测实现
    文章目录一、简介二、RTT时钟配置三、初始化配置四、完整代码五、测试验证一、简介本文主要介绍在RT-ThreadStudio中,如何对按键进行检测,分为两种方式进行检测:状态机方式:可以检测按键的单击、双击和长按,并且可以设置三个状态的检测时间长短,主要分为五个状态:未按、......
  • Hadoop伪分布式/分布式平台搭建教程以及安装过程中遇到部分问题的解决经验
    Hadoop伪分布式/分布式平台搭建教程声明:本搭建教程参考XMU的数据库实验室林子雨老师的搭建文档,附带了一点我们在安装时候遇到的问题和解决经验。XMU安装指导文档网址:https://dblab.xmu.edu.cn/blog/2544/目录文章目录Hadoop伪分布式/分布式平台搭建教程目录1.Linux......
  • java 教程
    Java基础廖雪峰Java教程阿里巴巴Java开发手册 下载pdf[书单]Java从入门到高级书籍推荐 SpringBootspringboot最全,最完整,最适合小白教程(基础篇) SpringCloudSpringCloud最佳实践方案(2021版本) MyBatis官网SpringBoot集成Mybatis保姆级教程MyBatis-Plus快速入门......
  • 怎么在虚拟机跑PCDN项目教程
    Windows启用Hyper-V​Hyper-V是微软推出的免费的虚拟化服务,从Windows8开始,其企业版.专业版.教育版系统都可以免费开启Hyper-V服务。注意:家庭版系统不支持Hyper-V,需要升级为专业版。注意:如果已经开启过Hyper-V,请跳过本步骤。下边我们以Win10为例,开启Hyper-V服务。​方法......
  • Javaweb简单的学生管理系统(增删改)
    学生servletimportjavax.servlet.ServletException;importjavax.servlet.annotation.WebServlet;importjavax.servlet.http.HttpServlet;importjavax.servlet.http.HttpServletRequest;importjavax.servlet.http.HttpServletResponse;importjava.io.IOException;......
  • Python全套教程,小白零基础入门必备!
    Python是一种语法简单、功能强大的编程语言,它注重的是如何高效解决问题。【教程领取方式在文末!!】正是这种简单实用的特性,让Python成为近年来最热门的编程语言之一。Python具有广泛的应用场景,包括:Web开发、数据分析、机器学习、网络爬虫、人工智能、量化交易等众多领......
  • GLSL教程 第11章:性能优化和调试
    目录11.1GLSL着色器的性能考量11.1.1减少计算复杂度避免不必要的计算使用适当的数据类型优化数学操作11.1.2减少内存访问减少纹理采样次数使用纹理缓存11.1.3优化数据传输减少数据传输量批处理(Batching)11.1.4使用高级渲染技术LevelofDetail(LOD)延迟渲染......
  • 将基于系统时间的循环系统更改为简单的 time.sleep()
    所以我试图修改我见过的游戏代码......这只是一个较大代码的片段。不过我发现很有趣,这段代码使用OCR,它会截取屏幕截图并上传一般概述,以与Webhooks的使用不一致。我发现它使用的系统是通过读取我的系统(计算机)时间...我想将其更改为一种更简单的方法来创建一个循环来每“x”分钟......