首页 > 其他分享 >R语言医学数据分析实践-数据读写

R语言医学数据分析实践-数据读写

时间:2024-10-17 12:18:06浏览次数:9  
标签:数据分析 文件 读取 读写 写入 医学 CSV 数据 函数

【图书推荐】《R语言医学数据分析实践》-CSDN博客

《R语言医学数据分析实践 李丹 宋立桓 蔡伟祺 清华大学出版社9787302673484》【摘要 书评 试读】- 京东图书 (jd.com)

R语言编程_夏天又到了的博客-CSDN博客

R编程环境的搭建-CSDN博客

在分析公共卫生数据时,数据来源和数据格式多种多样,如文本数据、Excel数据、SPSS数据以及SAS数据等。在R语言中,数据的读取和写入是数据分析处理的重要环节。R语言提供了多种方法来读取和写入不同格式的数据,包括文本文件、Excel文件、SAS数据文件等。本节将介绍常用的数据读写方法。

2.3.1  读取文件

首先是读取文本文件。read.table()函数可用于将文本数据导入R,并将数据保存为一个数据框。例如代码h<-read.table(file='文件路径', header = FALSE,  sep = "", skip = 0, nrows = -1)。其中:

  1. file:表示要读取的文本文件,路径中注意使用“\\”或“/”。
  2. sep:表示用什么分隔符分隔字段,默认以空格分隔。
  3. header:在读取数据时,决定是否将第一行数据作为变量的名称。
  4. skip:表示跳过前几行,从第几行开始读取数据。
  5. nrows:指定读取文件中的行数。

另一种常见的文本格式文件是CSV(逗号作为分隔符)文件。CSV格式是一种兼容性强的文件交换格式,在各类数据管理软件和统计软件中十分常见。read.csv()函数可用于读取CSV格式文件,该函数的用法与read. table()基本一致。为了更清晰地理解R语言数据的读取,下面来看一个示例。

假设有一个包含患者身高、体重和血压的文本文件clinical_data.txt,数据内容如下:

Patient_ID  Height  Weight  Blood_Pressure
1           170     70      120/80
2           165     65      130/85
3           180     80      140/90

通过以下代码读取该文本文件:

clinical_data <- read.table("clinical_data.txt", header = TRUE, sep = "", skip = 0, nrows = -1)

有一个包含患者年龄、性别和诊断的CSV文件clinical_data.csv,数据内容如下:

Patient_ID Age Gender Diagnosis
1 45 Male Hypertension
2 30 Female Diabetes
3 55 Male Hyperlipidemia

通过以下代码读取该CSV文件:

clinical_data <- read.table("clinical_data.csv", header = TRUE, sep = " ", skip = 0, nrows = -1)

文本文件和CSV文件的读取步骤及读取结果如图2-9所示。

图2-9

2.3.2  写入文件

在R语言中,写入文件通常使用write.table()或write.csv()等函数,具体取决于要保存的数据类型和文件格式。例如,代码“write.table(b, file = '文件路径', sep = ',', row.names = F,quote = F,append = T)”用于将数据写入文件,其函数主要参数的含义如下。

  1. sep = ',':表示用“,”作为字段分隔符。
  2. row.names = F:表示不添加行号。
  3. quote = F:表示不添加双引号。
  4. append = TRUE:表示将数据附加到文件尾,而不是覆盖文件。

为了更清晰地理解R语言数据的写入,参考以下示例:

clinical_data <- data.frame(
  Patient_ID = c(1, 2, 3),
  Age = c(45, 30, 55),
  Gender = c("Male", "Female", "Male"),
  Diagnosis = c("Hypertension", "Diabetes", "Hyperlipidemia")
)  #创建一个包含患者年龄、性别和诊断的数据框
write.csv(clinical_data, file = "clinical_data_output.csv", row.names = FALSE) #将数据框写入CSV文件

图2-10展示了创建的数据框的内容和将其写入CSV文件的过程。

图2-10

2.3.3  读写其他数据文件

R语言提供了很多功能包,用于读取其他格式的数据文件。例如,使用haven程序包中的read_spss()函数可以读取SPSS数据,read_sas()函数可以读取SAS数据,read_stata()函数可以读取Stata数据。使用这些函数可以将需要的数据导入R并转换为数据框格式。haven程序包还提供了相应的导出数据的函数,例如,write_sav()函数可以写入SPSS格式文件,write_sas()函数可以写入SAS格式文件,write_dta()函数可以写入Stata格式文件。

以下是其他类型数据读写的示例:

install.packages("haven")
library(haven)     #安装并加载haven程序包
#读取文件
data <- read_spss("clinical_data.sav")  	#读取以“.sav”为后缀的SPSS文件数据
data <- read_sas("clinical_data.sas7bdat")	#读取以“.sas7bdat”为后缀的SAS文件数据
data <- read_stata("clinical_data.dta")  	#读取以“.dta”为后缀的Stata文件数据
#写入文件
clinical_data <- data.frame(
  patient_id = c(1, 2, 3, 4, 5),
  age = c(35, 45, 50, 28, 62),
  gender = c("M", "F", "M", "F", "M"),
  diagnosis = c("Hypertension", "Diabetes", "Obesity", "Asthma", "Hyperlipidemia")
)  #创建一个示例的数据框
write_sav(clinical_data, "clinical_data.sav") #写入SPSS文件
write_sas(clinical_data, "clinical_data.sas7bdat") #写入SAS文件
write_sav(clinical_data, "clinical_data.dta") #写入Stata文件

标签:数据分析,文件,读取,读写,写入,医学,CSV,数据,函数
From: https://blog.csdn.net/brucexia/article/details/143007698

相关文章

  • 深入理解Java并发读写锁—ReentrantReadWriteLock
    ReentrantReadWriteLock使用场景ReentrantReadWriteLock是Java的一种读写锁,它允许多个读线程同时访问,但只允许一个写线程访问(会阻塞所有的读写线程)。这种锁的设计可以提高性能,特别是在读操作的数量远远超过写操作的情况下。在并发场景中,为了解决线程安全问题,我们通常会......
  • TuxeraNTFS2023破解版软件dmg安装包(苹果系统读写win分区软件)
    ......
  • 程序员转行做什么好:数据分析师、AI大模型工程师、产品经理和云计算工程师。
    先给结论再说理由:数据分析师、AI大模型工程师、产品经理和云计算工程师。这些领域不仅因应了当前技术发展的趋势,也为程序员提供了转型的广阔舞台和职业发展的新机遇。一起来看看吧!数据分析师:数据驱动决策的关键程序员转行时,应考虑当前市场上的热门行业和岗位需求。例如,A......
  • 易基因:MeRIP-seq等揭示m6A RNA甲基转移酶METTL3抑制剂在体内和体外抑制前列腺癌进展 |
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。前列腺癌(Prostatecancer,PCa)是全球男性中最常见的恶性肿瘤之一,也是导致男性癌症死亡的第二大原因。尽管雄激素受体(Androgenreceptor,AR)信号通路在前列腺癌进展中至关重要,但长期雄激素剥夺治疗(androgendeprivati......
  • 【25届计算机毕设选题推荐】基于Python的黑龙江旅游景点数据分析系统的设计与实现 【
    ✍✍计算机编程指导师⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流!⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程......
  • 【计算机毕设选题推荐】基于Python的广东旅游数据分析 【附源码+数据库+部署】
    ✍✍计算机编程指导师⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流!⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程......
  • SPSS常见数据分析方法比较汇总
    SPSS是全球领先的统计分析与数据挖掘产品,全名:StatisticalProductandServiceSolutions成立于1968年,是世界上应用最广泛的专业统计和数据模型软件之一。目前,SPSS、SAS、Stata一齐被称为三大权威统计软件。一、常用多变量分析技术比较汇总表注: 卡方分析:定量两个定性......
  • 深入理解Java并发读写锁——ReentrantReadWriteLock
    ReentrantReadWriteLock使用场景ReentrantReadWriteLock是Java的一种读写锁,它允许多个读线程同时访问,但只允许一个写线程访问(会阻塞所有的读写线程)。这种锁的设计可以提高性能,特别是在读操作的数量远远超过写操作的情况下。在并发场景中,为了解决线程安全问题,我们通常会使用关......
  • 人工智能是如何预测足球比赛?大小球亚盘数据分析推荐
    今天的文章主要包含了三部分内容:1,AI预测足球的过程。2,举例说明。3,影响AI预测准确率的原因。AI预测足球比赛的过程,其实并不复杂,主要就是下面几步,大家可以和自己平时预测比赛做个对照,看看我们和机器的区别在哪里:1,评估影响比赛结果的因素AI通过大模型的训练数据和知识库,运用机......
  • python数据分析与可视化
    关注我,持续分享逻辑思维&管理思维&面试题;可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导;推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容。一顿烧烤不到的费用,让人能紧跟时代的浪潮。从普通网站,到公众号、小程序,再到AI大模型网站。干货满满。学成后可......