首页 > 其他分享 >R语言数据可视化分析案例:探索BRFSS数据

R语言数据可视化分析案例:探索BRFSS数据

时间:2024-01-16 16:59:27浏览次数:41  
标签:BRFSS ## 数据 BMI 可视化 之间 性别

原文链接:http://tecdat.cn/?p=9284

 

加载包 

   

library(tidyr)
library(knitr)
opts_chunk$set(echo = TRUE, fig.align = "center")

 

载入资料

  r
load("brfss2013.RData")

第1部分:数据

描述如何收集样本中的观测值,以及此数据收集方法对推断范围(可概括性/因果关系)的影响。http://www.cdc.gov/brfss/,以及下面的“有关数据的更多信息”部分。

“ BRFSS是一项横断面电话调查,州卫生部门每月通过座机和电话进行调查,并获得标准化问卷和CDC的技术和方法支持。在进行BRFSS座机电话调查时,访问员从一个家庭中随机选择的成年人那里收集数据。在进行BRFSS问卷的电话版本时,访问员从成年人中收集数据。”

推论范围(普遍性/因果关系):

普遍性:调查数据是从50个州和美国领土收集的,这使得数据看起来足够随机样本,从而可以将其推广到整个美国人口。

因果关系:由于所有参与者均未接受指定的治疗和对照组的治疗-无法假设因果关系-只能测量相关性。

方法论,偏见和需要改进的方面的问题:通过电话调查,有可能低估了几种类型的个人:

1.没有座机或手机的个人

2.拒绝回答或参加电话调查的个人。

3.在进行调查时无法通过电话联系/无法联系到调查的个人。

采访问题的答案尚未通过验证,这意味着受访者可以通过以下方式修改其回答:

1.过度报告理想的行为和/或特征。

2.漏报不良行为。

3.夸大或歪曲某些特征,例如身高,学历或收入。

4.错误地提供关键信息。

5.参与的机构之间的面试做法和问题集可能不一致。

供以后参考,如果数据集包含有关每个访谈的详细信息,例如收集数据的时间和访谈的持续时间,将很有用。

 

第2部分:研究问题

研究问题1:体重指数(BMI)是否与受访者自己的健康看法相关?

这个问题探讨了BMI“正常”的人是否对自己的健康状况有更好的认识。虽然BMI并不是完美的健康指标,但仍被公认为健康的初始指标。

使用的总变量:2

genhlth-一般健康

X_bmi5cat-将BMI分为4类(体重过轻,正常,超重,肥胖)的计算变量

————-

研究问题2:一个人的夜间睡眠时间与他们的能量水平之间是否存在相关性?性别之间有区别吗?

这是一个有趣的问题,因为经常吹嘘睡眠是维持良好总体健康的重要组成部分。研究表明,那些睡眠时间少于5小时的人甚至更容易患慢性或严重疾病。

使用的总变量:3

sleptim1-报告的睡眠时间

qlhlth2-在过去30天中,有几天被报告为“全力以赴”

性别-报告的生物性别

————-

研究问题3:总体生活满意度与受教育程度之间是否存在相关性?性别之间有什么区别吗?

这个问题将试图看看总体生活满意度和个人受教育程度之间是否存在任何关联。一些研究表明,与受教育程度较低的人相比,受教育程度较高的人较少出现婚姻问题,并且可能享有更好的健康状况。它将进一步探讨男性和女性之间是否存在任何差异。

使用的总变量:3

满意-整体生活满意度

教育-教育水平

性别-个人的生物性别

 

 

第3部分:探索性数据分析

研究问题1:体重指数(BMI)是否与受访者自身健康的看法相关?

  r
load("brfss2013.RData")
dim(brfss2013)
   
## [1] 491775    330

 

   
 
  r
q1 <- select(brfss2013,genhlth,X_bmi5cat) %>% na.omit()
dim(q1)
   
 
   
## [1] 463275      2

拥有460,000多个观察值,通过表格进行观察更容易,如下所示:

  r
prop.table(table(q1$genhlth,q1$X_bmi5cat),2)
   
##            
##             Underweight Normal weight Overweight      Obese
##   Excellent  0.19987805    0.26019496 0.17373887 0.07933813
##   Very good  0.26402439    0.35069868 0.35401238 0.26824837
##   Good       0.26146341    0.24667514 0.30698451 0.37088006
##   Fair       0.15829268    0.09751640 0.11943759 0.19913468
##   Poor       0.11634146    0.04491484 0.04582665 0.08239876

 

 表中 有大量的数据。 

  r
g1 <- ggplot(q1) + aes(x=X_bmi5cat,fill=genhlth) + geom_bar(position = "fill")
g1

每列代表4种BMI类别(体重过轻,正常,超重,肥胖)和描述自己健康状况的受访者比例。

可以得出结论,在一定程度上,对这一问题的回答是“是”。个体的BMI与他或她自己对健康的看法之间似乎存在关联。

 研究问题2:一个人的夜间睡眠时间与他们的能量水平之间是否存在相关性?性别之间有区别吗?

   
##     qlhlth2          sex         sleptim1     
##  Min.   : 0.00   Male  :162   Min.   : 2.000  
##  1st Qu.: 2.00   Female:287   1st Qu.: 6.000  
##  Median :15.00                Median : 7.000  
##  Mean   :15.56                Mean   : 7.013  
##  3rd Qu.:28.00                3rd Qu.: 8.000  
##  Max.   :30.00                Max.   :12.000
## Warning: Removed 12 rows containing non-finite values (stat_smooth).
## Warning: Removed 12 rows containing missing values (geom_point).

睡眠时间和充满能量的天数之间似乎总体上呈正相关。女性的相关性似乎比男性略强,因为男性的数据分布更广泛。

++++++++++++++++++++++++

研究问题3:总体生活满意度与受教育程度之间是否存在相关性?性别之间有什么区别吗?

   
## # A tibble: 4 x 2
##   lsatisfy          count
##   <fct>             <int>
## 1 Very satisfied     5378
## 2 Satisfied          5506
## 3 Dissatisfied        598
## 4 Very dissatisfied   161
  r
q3 %>% group_by(educa) %>%   summarise(count=n())
   
## # A tibble: 6 x 2
##   educa                                                        count
##   <fct>                                                        <int>
## 1 Never attended school or only kindergarten                      10
## 2 Grades 1 through 8 (Elementary)                                496
## 3 Grades 9 though 11 (Some high school)                         1078
## 4 Grade 12 or GED (High school graduate)                        3708
## 5 College 1 year to 3 years (Some college or technical school)  3055
## 6 College 4 years or more (College graduate)                    3296
  r
q3 %>% group_by(sex) %>%   summarise(count=n())
   
## # A tibble: 2 x 2
##   sex    count
##   <fct>  <int>
## 1 Male    4078
## 2 Female  7565

男性和女性的教育水平和总体生活满意度之间似乎总体上呈正相关。至少完成了高中(或同等学历)的人的满意度似乎更高。数据中还存在某些异常值,其中一些反馈者在没有受过教育的情况下会“满意”或“非常满意”。由于大多数人口至少已从高中毕业,因此该数据似乎准确地代表了受访者的分布。

 


最受欢迎的见解

1.R语言动态图可视化:如何、创建具有精美动画的图

2.R语言生存分析可视化分析

3.Python数据可视化-seaborn Iris鸢尾花数据

4.r语言对布丰投针(蒲丰投针)实验进行模拟和动态

5.R语言生存分析数据分析可视化案例

6.r语言数据可视化分析案例:探索brfss数据数据分析

7.R语言动态可视化:制作历史全球平均温度的累积动态折线图动画gif视频图

8.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

9.python主题LDA建模和t-SNE可视化

标签:BRFSS,##,数据,BMI,可视化,之间,性别
From: https://www.cnblogs.com/tecdat/p/17968042

相关文章

  • 在 STM32 中使用环形队列的方式接收串口数据
    在STM32中使用环形队列的方式接收串口数据#include<stdio.h>#include<stm32f10x.h>#include<stm32f10x_usart.h>//定义环形队列的结构体typedefstruct{uint8_t*buffer;//数据缓冲区uint16_tsize;//缓冲区大小uint16_tfront;//队列头索引......
  • 数据库排查慢查询和死锁
    参考地址:https://blog.csdn.net/qq_48424581/article/details/133770383慢查询1\检查是否开启慢查询日志:连接进入mysql数据库后输入命令showvariableslike'slow_query_log';2\在/etc/my.cnf中配置开启可配置记录所有支线时间超过long_query_time秒的查询语句log-slow-que......
  • 方法论:仓储物流规划--数据分析(转)
     老K-LaoK专栏同名微信公众号:智能仓储物流技术研习社。​关注他 8人赞同了该文章导语大家好,我是智能仓储物流技术研习社的社长,你的老朋友,老K。知识星球 * 原创电子书 * 深海社区 * 微信群文:尹军琪在做物流规划设计时,人们往往对设计指标......
  • 52.数据库操作
    数据库操作数据库操作是每一门编程语言中都必不可少的操作。使用程序操作数据库之前,需要在本地或服务器先安装数据库,比如MySQL数据库。Python中使用第三方模块PyMySQL操作数据库,使用前需要先进行安装。安装PyMySQLpipinstallpymysql操作流程使用 PyMySQL 模块......
  • 在国产操作系统下管理Oracle数据库
    Oracle公司是全球最大的信息管理软件及服务供应商,其开发的数据库产品因性能卓越而闻名,占有最大的市场份额,被广泛用于各个市场领域。然而在信创化的时代,国产操作系统已然是大势所趋,但是由于历史原因,在应用开发中使用Oracle数据库是市场主流,因此用户急需一款可以在国产操作系统上......
  • 使用shell脚本将doDBA采集到的日志会话信息导入到MySQL数据库
    【背景说明】使用doDBA工具监控的会话信息导入到MySQL数据库的表中【环境说明】doDBA工具采集会话信息(之前有脚本说明)【脚本说明】处理dodba日志信息将日志的innodb日志信息去除审计日志的名称要改为原来的dodba.log名称cd/data/backup/doDBA/log/cpdodba_20231226_09......
  • SqlSugar新增数据
    1、插入方式1.1单条插入实体//返回插入行数db.Insertable(insertObj).ExecuteCommand(); //都是参数化实现//异步: await db.Insertable(insertObj).ExecuteCommandAsync() //插入返回自增列 (实体除ORACLE外实体要配置自增,Oracle需要配置序列)db.Insertable(in......
  • SqlSugar更新数据
    1、根据实体对象更新所谓按实体对象更新就是:db.Updateable(参数对象)有参数的重载db.Updateable(实体或者集合).ExecuteCommand() //右标题1 下面的所有菜单优点1、代码少2、支持各种批量修改缺点1、不支持表达式和sql函数2、依赖 实体对象,没实体对象就需......
  • SqlSugar删除数据
    1、根据实体删除1.1强类型实体 需要配置主键,根据主键删除需要给实体配置主键,参考文档实体配置//单个实体db.Deleteable<Student>(new Student() { Id = 1 }).ExecuteCommand(); //List<实体> (可以不加Where)List<Student> list=new List<Student>(){......
  • 数据库高可用方案
    MySQL高可用架构MySQL高可用架构主要包括:主从复制(Master-SlaveReplication):通过将主数据库的更改同步到一组从数据库来实现高可用性。当主数据库宕机时,从数据库可以被提升为新的主数据库。主主复制(Master-MasterReplication):两个或多个主数据库相互同步,每个主数据库都可以处理......