首页 > 其他分享 >r语言基本操作1——r语言基本操作

r语言基本操作1——r语言基本操作

时间:2024-04-09 21:32:43浏览次数:24  
标签:文件 语言 数据 矩阵 data 基本操作 TRUE 向量

r语言作为一种常用于数据处理领域语言,较为广泛使用的是其对数据进行操作的功能,基础包括变量赋值、数据类型、数据导出和导入等,更深层次还包括统计相关函数、库函数调用、数据整合整理等,在r语言中也有很多第三方包,类似于python的库函数,在特定情况下可以被调用并完成特定操作。

接下来介绍一些r语言的基本知识和相关操作:

一、R 和R studio

r语言是一种解释的语言,类似于MATLAB,是按行步进运行的,同时也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。
类似于Python和Pycharm、C/C++和visual studio,r语言有自己的idle(R)以及开源集成开发环境(R studio),R studio提供了一个具有很多功能的环境,使R更容易使用,是在终端中使用R的绝佳选择。值得注意的是R studio是英文编辑环境,使用时需要注意。

在编写r程序时,更建议使用R studio

具体的安装方式不再叙述,详细可见这篇文章:
R及RStudio下载安装教程(超详细)

二、工作目录的设置

工作目录会影响r运行过程中输出文件的位置以及读取文件的路径,所有的文件读取和写入操作都会默认在这个目录下进行,除非另有指定。
一般情况下使用setwd()函数设置工作目录

setwd("pathway")

例如设置工作路径为桌面文件夹:

setwd("C:/Users/zhang/Desktop")

值得注意的是,从Windows系统复制的文件地址

“C:\Users\zhang\Desktop”

分隔符使用的是反斜杠"“,但是r语言中要求使用正斜杠”/",要注意替换

设置工作目录后,可以用相对路径直接读取或写入该目录下的文件,而不需要提供完整的路径,这样可以简化代码,并且避免在每个文件操作中都指定完整的绝对路径。

如果想知道当前的工作目录是什么,可以使用getwd()获取,便会直接输出当前的目录

三、变量与变量赋值

变量名

与其他编程语言类似,r语言的变量名设置也有类似的规则:

变量名可以包含字母、数字、点号和下划线,不能包含其他符号,必须以字母或点号开头。变量名是区分大小写的。

变量赋值

在R中,通常使用 <-= 运算符进行变量赋值。
例如:

x <- 10
y = 5
#这将把值10赋给变量x,把值5赋给变量y。
x <- 10
x <- x + 5  # x的值为15

删除变量

可以使用rm()函数删除已存在的变量。例如:

x <- 10
rm(x)  # 删除变量x

特殊值

在R中,有一些特殊的值,如NA表示缺失值、Inf表示无穷大等。

变量值查看

每当存储完一个变量之后,R studio右侧的变量框中便会出现该变量的相关信息,类似MATLAB,①可以通过点击该变量显示该变量的详细信息,②也可以通过view(变量名)来查看一个变量的详细信息,③也可以直接变量名来查看该变量的值。

四、数据类型

R语言是基于对象的语言,R中一切事物都可以看做是对象
对象有四种基本类型:

  1. 数值型(numeric):用于存储数值,可以是整数或浮点数。例如:5、3.14。
  2. 字符型(character):用于存储文本或字符。字符型的值需要用引号括起来。例如:“Hello”、‘World’。
  3. 逻辑型(logical):用于存储逻辑值,即TRUE或FALSE。例如:TRUE(T)、FALSE(F)。
  4. 复数型(complex):用于存储复数,由实部和虚部组成。例如:1+2i、2-3i。
    在某些函数中,还要求有一种类型——因子型:
    因子型(factor):用于表示具有限定数量的离散取值的变量。

可以用class()查看变量的数据类型
在R中,可以使用不同的函数进行数据类型之间的转换。以下是一些常用的数据类型转换函数:

as.numeric():#将其他数据类型转换为数值型。
as.character():#将其他数据类型转换为字符型。
as.logical()#将其他数据类型转换为逻辑型。
as.complex()#将其他数据类型转换为复数型。
as.factor()#将其他数据类型转换为因子

五、数据结构

R语言的数据结构包括向量(Vector)、列表(List)、矩阵(Matrix)、数据框(Data Frame)等。

1.向量(Vector):

向量是R语言中最基本的数据结构之一,是由一组相同类型的元素组成的一维数组。可以使用c()函数创建向量,例如:

x <- c(1, 2, 3, 4, 5)

R语言中的向量有以下几种类型:
- 逻辑向量(logical vector):包含TRUE或FALSE。
- 整数向量(integer vector):包含整数。
- 数值向量(numeric vector):包含浮点数。
- 字符串向量(character vector):包含字符型数据。
可以使用索引来访问向量中的元素,例如:x[1]表示访问向量x的第一个元素。

2.列表(List):

列表是由不同类型的元素组成的数据结构,可以包含向量、矩阵、数据框等。使用list()函数创建列表
例如:

list <- list(name = "John", age = 30, scores = c(80, 85, 90))
a <- c(1,2,3,4)
b <- c(“apple",“banana",“~rap e")
c <- matrix(1:10,nrow = 5)
d <-“Hello world”
mylist<- list(a,b,c,d)

列表中的元素可以通过名称或索引进行访问,例如:

my_list$name
#或
my_list[[1]]

3.矩阵(Matrix):

矩阵是二维的数据结构,包含相同类型的元素。可以使用matrix()函数创建矩阵

matrix(data, nrow, ncol, byrow = FALSE, dimnames = NULL)

其中:
data: 用来填充矩阵的数据。这可以是一个向量、列表或数组。
nrow: 矩阵的行数。
ncol: 矩阵的列数。
byrow: 一个逻辑值,指示矩阵是按行还是按列填充。默认值为 FALSE,表示按列填充。
dimnames: 一个包含两个元素的列表,用来指定行名和列名。如果提供了该参数,则必须是长度为2的列表,每个元素都是长度与相应维度相同的字符向量。

例如:

mat <- matrix(1:9, nrow = 3, ncol = 3)

可以通过行列索引来访问矩阵中的元素,例如:mat[1, 2]表示访问矩阵mat的第一行第二列的元素。m[m>30]代表m中所有大于30的元素。

数组可以视为一种多层矩阵,建立数组可以使用array()函数

array(data, dim = NULL, dimnames = NULL)

其中:
data: 用来填充数组的数据。这可以是一个向量、列表或矩阵。
dim: 数组的维度。可以是一个整数向量,指定每个维度的大小;也可以是一个具有维度属性的对象,例如矩阵或数组。
dimnames: 一个包含维度名称的列表。每个元素都是一个字符向量,指定相应维度的名称。

例如:

# 创建一个2x3x2的三维数组
arr1 <- array(1:12, dim = c(2, 3, 2))
print(arr1)
# 输出:
# , , 1
# 
#      [,1] [,2] [,3]
# [1,]    1    3    5
# [2,]    2    4    6
# 
# , , 2
# 
#      [,1] [,2] [,3]
# [1,]    7    9   11
# [2,]    8   10   12

# 创建一个2x2x2的三维数组,并同时指定维度名称
arr2 <- array(1:8, dim = c(2, 2, 2), dimnames = list(c("row1", "row2"), c("col1", "col2"), c("depth1", "depth2")))
print(arr2)
# 输出:
# , , depth1
# 
#      col1 col2
# row1    1    3
# row2    2    4
# 
# , , depth2
# 
#      col1 col2
# row1    5    7
# row2    6    8

4.数据框(Data Frame):

数据框是一种类似于电子表格的数据结构,由多个列组成,每一列可以是不同的类型。可以使用data.frame()函数创建数据框,每列可以是不同类型的数据(例如字符型、数值型、逻辑型等)

data.frame(...)

其中(…) 表示可以传入多个参数,每个参数对应数据框的一个列。
例如:

df <- data.frame(name = c("John", "Alice", "Bob"), age = c(30, 25, 35), score = c(80, 85, 90))

数据框中的列可以通过名称来访问,例如:df$namedf[["name"]]
数据框也可以通过行列索引来访问,例如:df[1, 2]表示访问数据框df的第一行第二列的元素。
在这里插入图片描述

六、数据的导入和导出

r导入和导出数据分为二进制数据和其他常见的数据格式。

1. 二进制数据

导入二进制数据

# 使用load()函数加载二进制数据文件
load("data.RData")

导出二进制数据

# 使用save()函数将R对象保存为二进制数据文件
save(data, file = "data.RData")

2.txt 文件

导入 txt 文件

write.table(x, file, append = FALSE, quote = TRUE, sep = " ", eol = "\n", na = "NA", dec = ".", row.names = TRUE, col.names = TRUE, ...)

x: 要写入文件的数据框或矩阵。
file: 要写入的文件路径。
append: 一个逻辑值,指定是否在文件末尾追加内容,默认为 FALSE。
quote: 一个逻辑值,指定是否在字符型数据周围加上引号,默认为 TRUE。
sep: 字段之间的分隔符,默认为一个空格。
eol: 行末的分隔符,默认为换行符。
na: 指定如何表示缺失值,默认为 “NA”。
dec: 指定小数点的字符,默认为 “.”。
row.names 和 col.names: 逻辑值,指定是否写入行名和列名,默认为 TRUE。
…: 其他参数。

导出 txt 文件

3.CSV 文件

导入 CSV 文件

# 使用read.csv()函数导入CSV文件
data <- read.csv("data.csv", header = TRUE)

导出 CSV 文件

write.csv(x, file, append = FALSE, quote = TRUE, sep = ",", eol = "\n", na = "NA", row.names = TRUE, col.names = TRUE, ...)

其中参数含义与write.table()相似

4.Excel 文件

导入 Excel 文件

# 使用readxl包导入Excel文件
library(readxl)
data <- read_excel("data.xlsx", sheet = 1)

导出 Excel 文件

libary(openxlsx)
write.xlsx(x, file, asTable = FALSE, overwrite = TRUE, ...)

x: 数据框或一个(命名的)对象列表。
file: 要保存xlsx文件的文件路径。
asTable: 如果为TRUE,将使用writeDataTable()而不是writeData()来将x写入文件(默认值:FALSE)。
overwrite: 覆盖现有文件(默认为TRUE,与write.table一样)。

标签:文件,语言,数据,矩阵,data,基本操作,TRUE,向量
From: https://blog.csdn.net/zhanghongyi_cpp/article/details/137547365

相关文章

  • 肖恩带你看C语言·编译和链接
    来咯来咯,又见面咯,看看编译和链接的知识,了解一下就好,不必深究~~~运行环境运行环境是指运行编译后的C语言程序所需的硬件和软件环境。硬件环境:包括CPU、内存、硬盘等物理设备,这些设备提供了程序运行所需的硬件资源。软件环境:主要是指操作系统和相关的库文件。操作系统提供......
  • C语言分支语句和循环语句(非常详细的分支循环讲解)
    目录选择语句if-else语句if嵌套switch语句逻辑操作符!逻辑非&&逻辑与||  逻辑或循环语句while循环do-while循环for循环break和continue语句 break语句continue语句选择语句if-else语句if语句的语法形式if(表达式){语句}在C语言中非0为真,0为假......
  • C语言08-函数(递归、字符串、日期时间、数学计算函数),指针
    第11章函数11.7递归函数​ ——相当于俄罗斯套娃;一个程序未执行结束会挂起,相当于堆栈一个函数在函数体内又调用了本身,我们称为递归调用,这样的函数就是递归函数。递归函数成功执行需满足以下两个条件:(1)必须有一个明显的结束条件。(2)必须有一个趋近于结束条件的趋势......
  • C语言循环结构综合案例1
    昨天我们复习了了选择结构的综合案例,那么我们今天开始复习循环结构。循环结构的内容比较多,所以我会将内容分为两天给大家展示,那么今天的实例题目也会比较多一些,所以也请各位能够耐心完成学习我列于文中一些小题,在独立完成理解后,我相信大家对C语言的学习和理解也会有一些全新的......
  • 使用C语言函数对数组进行操作
        前言       在我们了解数组和函数之后,我们对数组和函数进行结合,之后完成一些操作吧    题目描述    杰克想将函数与数组结合进行一些操作,以下是他想要达到的效果,请你帮帮他吧!    创建一个整型数组,完成对数组的操作   ......
  • C语言:指针详解(2)
    目录一、数组名的理解二、使用指针访问数组三、一维数组传参的本质四、冒泡排序五、二级指针六、指针数组正文开始一、数组名的理解在上一篇博客中我们在使用指针访问数组的内容时有这样的代码:intarr[10]={1,2,3,4,5,6,7,8,9,10};int*p=&arr[0];这里我......
  • 【C语言中的操作符详解】
    目录一 C语言中的操作符详解:1.算术操作符2.关系操作符(比较操作符)3.逻辑操作符4.位操作符5.赋值操作符6.条件(三元)操作符7.其他操作符8.递增和递减操作符二c语言操作符,应用场景:算术操作符:位操作符:关系操作符:逻辑操作符:赋值操作符:条件(三元)操作符:其他......
  • 汇编语言和C语言得优势和劣势简析
    汇编语言和C语言各自具有不同的优势和劣势,适用于不同的编程场景和需求。以下是对两者的一些比较:汇编语言的优势:硬件接近性:汇编语言直接对应机器指令,可以精确控制硬件,非常适合底层硬件编程和系统级编程。例如,在编写操作系统内核、设备驱动程序或实时系统时,汇编语言可以确保对......
  • C语言--extern关键字介绍
    在C语言中,extern关键字用于声明一个变量或函数是在其他地方定义的,而不是在当前文件中。它告诉编译器,变量的定义或函数的实现在其他地方,这样编译器就不会在当前编译单元中查找它们的定义。这样做的好处是可以将一个大型程序分割成多个源文件,每个源文件可以单独编译,最后链接成一......
  • R语言多元Copula GARCH 模型时间序列预测|附代码数据
    原文链接  http://tecdat.cn/?p=2623原文出处:拓端数据部落公众号 最近我们被要求撰写关于CopulaGARCH的研究报告,包括一些图形和统计输出。和宏观经济数据不同,金融市场上多为高频数据,比如股票收益率序列。直观的来说,后者是比前者“波动”更多且随机波动的序列,在一元或多元......