数据合并和dplyr包的介绍

时间：2024-10-16 15:48:39浏览次数：3

标签：q1 10 FALSE 数据 08 合并介绍 dplyr leadship

数据合并

选取数据newdata<- leadship[,c（1:6）]选取了q1到q5

或者

vars<- c("q1", "q2", "q3", "q4", "q5")

Newdata<- leadship[, vars]

> print(newdata)

q1 q2 q3 q4 q5

1 5 4 5 5 5

2 3 5 2 5 5

3 3 5 5 5 2

4 3 3 4 NA NA

5 2 2 1 2 1

剔除变量

myvars<- names(leadship) %in% c("q3", "q4") 给myvars中leadship中的q3，q4列名

> print(myvars)

[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE

[11] FALSE

其中的%in%是指判断左边的目标中是否有在右边目标中的数据。

在我们的数据中NA位于p4，p5位置因此我们需要去除这两列然后将其导入一个新的数据框

Newdata<- leadship[!myvars]选取了leadship数据框中除了p4，p5的所有列

> print(newdata)

mangaerID testdata countrys gender age q1 q2 q3 age1

1 1 10/24/08 us m 32 5 4 5 young

2 2 10/28/08 us f 45 3 5 2 old

3 3 10/1/08 uk f 25 3 5 5 young

4 4 10/12/08 uk m 39 3 3 4 middle age

5 5 5/1/09 uk f 99 2 2 1 old

选取观测值

Subset（）

Dplyr包是一个很好用的数据处理包，接下来我会对其中的一些常用功能进行介绍首先我们用一下计算函数

leadship<- mutate(leadship, total_score= q1+q2+q3,

mean_score=total_score/3)

这个函数会在我们的leadship数据框中形成两个新列应该是类似我们之前提到的within函数（我认为的）

leadship$gender<- recode(leadship$gender, "m"="male", "f"="female")之后这个是可以重新定义变量的函数recode（数据位置， “旧变量”=“新变量”）

leadship<- rename(leadship, "mangaer_ID"=mangaer, "sex"=gender)可以重新命名数据框的列名

leadship<- arrange(leadship, desc(sex), desc(total_score))对数据进行排序，排序标准是sex和total_score，默认升序，我加了个dplyr包的desc（）函数可以使其变成倒序。

leadship_rate<- select(leadship, mangaer_ID, mean_score)我们可以选取其中的数据将其放到一个新的数据框中进行分析，在这里我选取了mangaer_ID, mean_score两列数据。他们会生成一个新的数据框名为leadship_rate

leadship_men_high<- filter(leadship, sex=="male" & total_score> 10)然后我们筛选一下数据，选

出其中为男性并且总得分大于10的

这个是我们的原始数据，经过我们上面的filter之后变成下面的样子

自此dplyr包基础函数介绍完毕，最后做个总结

Mutate（）计算

Recode（）重新编辑变量

Rename（）重新命名列名或者行名 ps：行名我没试过理论上应该是可行

Arrange（）进行排序

Select（）选取其中某一部分的数据 ps：他同样可以通过“：”来完成选取一个范围例如select（leadship， q1：q3）功能类似于[]但是select相比于[]他可以实现更精细的选择

Filter（）对数据进行筛选，将筛选出的数据放入新的数据框

标签：q1,10,FALSE,数据,08,合并,介绍,dplyr,leadship
From： https://blog.csdn.net/2403_87131305/article/details/142984318

ADI 亚德诺半导体 Analog Devices 产品的应用介绍和物料推荐（一）
各位电子行业的伙伴们！今天来聊聊ADI亚德诺半导体。ADI可是全球知名的半导体公司哦！它专注于模拟信号处理，在通信、工业、汽车等众多领域都有卓越表现。ADI的产品以高性能著称，在通信领域提供的放大器、数据转换器、射频芯片等，能满足通信系统对信号处理的高要求。在工业领域，其......
javaWeb项目-ssm+jsp股票交易管理系统功能介绍
本项目源码（点击下方链接下载）：java-ssm+jsp股票交易管理系统实现源码(项目源码-说明文档)资源-CSDN文库项目关键技术开发工具：IDEA、Eclipse编程语言:Java数据库:MySQL5.7+框架：ssm、Springboot前端：Vue、ElementUI关键技术：springboot、SSM、vue、MYSQL、MAVEN数据库工......
Office365 Exchange Hybrid No.01 基础介绍
Office365ExchangeHybridNo.01基础介绍背景：某大型企业在本地部署了单域多站点的活动目录（AD域和Exchange的SMTP域不一样）；在总部IDC机房中部署了ExchangeServer2013高可用架构（多域名），且部署硬件反垃圾邮件网关Exchange用户5000+多个预警报警通知平台与ExchangeServer集成......
Office365与本地Exchange混合部署之邮件流介绍详情
Office365与本地Exchange混合部署之邮件流介绍详情Office365与本地Exchange混合部署之邮件流介绍详情我们前面的文章中有介绍了本地Exchange与Office365实现Exchange服务混合部署。然后在配置了混合部署后遇到了一些邮件投递错误及迁移用户的相关错误，都陆续解决了，同时都做了相......
Exchange 2013接收连接器介绍
Exchange2013接收连接器介绍Exchange 2013默认的接受连接器有5种如下：那么，如何区分和理解这5种接收连接器呢？首先明确接收连接器的定义：接收连接器用于控制发送到Exchange组织的入站邮件流。接收连接器的作用域限于单台服务器，及每个接收连接器都属于单台服务器，其设......
泛型的使用和介绍
一、泛型的介绍按照之前的写法，有几个问题1.程序中有大量的黄色警告2.在遍历的时候，迭代器不知道元素本身的类型，需要向下转型二、泛型的使用方法使用泛型[参数化类型]改进集合的使用。语法格式：<引用数据类型>publicclassFanXingDemo1{publicstaticvoidmain(Stri......
【新人系列】Python 入门（二）：Python IDE 介绍
✍个人博客：https://blog.csdn.net/Newin2020?type=blog......
linux 操作系统下 dpkg-preconfigure 命令介绍和使用案例
linux操作系统下dpkg-preconfigure命令介绍和使用案例dpkg-preconfigure命令介绍dpkg-preconfigure是Debian和基于Debian的Linux发行版中用于预配置软件包的工具。它允许用户在安装软件包之前，提前提供配置选项，从而简化安装过程。命令格式dpkg-preconfigure[选......
合并两个排序的链表
输入两个链表，并将它们的值按照递增的顺序合并成一个新的链表。题目要求如下：我们可以创建两个新的链表，其中一个作为中间变量来存储合并后的链表，另一个链表记录中间链表并作为返回值返回。代码如下：/***structListNode{* intval;* structListNode*next;*}......
Elasticsearch介绍
Elasticsearch是一个分布式搜索和分析引擎，通常用于处理大规模的结构化和非结构化数据。它基于开源的Lucene库，提供了强大、实时的搜索能力和精细的分析功能。Elasticsearch通常与其他工具（如Logstash、Kibana等）一起使用，构成了著名的ELKStack（后来改名为ElasticStack）。完整......

数据合并和dplyr包的介绍

相关文章

赞助商

阅读排行