首页 > 其他分享 >深入浅出数据分析-CH13整理数据-R语言/EXCEL

深入浅出数据分析-CH13整理数据-R语言/EXCEL

时间:2024-03-26 17:59:03浏览次数:25  
标签:CH13 分列 深入浅出 EXCEL readr 清洗 data 替换

EXCEL原始数据,本文章附件,下面介绍两种处理方式:EXCEL&R

 一、EXCEL清洗数据格式

点分列的第一个分列

 填入其他一个#,点击下一步完成

 分列后的表格如图

 

按下ctrl+F,点击替换全部

 

 此时此刻处理完成FirstName,开始处理LastName

选中C列

 CTRL+F,输入(*),点击全部替换

 处理结果如下 上一步用的是通配符替换,*代表任意字符

(*)的意识是吧(任意字符)替换为空字符,即完成数据整理

 

二、R语言清洗数据格式

读取本地文件

 data <- read_csv("D:/学习/hfda_ch13_raw_data.csv")

如果报错记得导入csv的包

install.packages("readr")  # 安装 readr 包
library(readr)             # 加载 readr 包

查看文档

head(data)

下面是做一个清洗LastName的操作

NewLastName <- sub("\\(.*\\)","",data$LastName)
head (NewLastName)

NewLastName <- sub("\\(.*\\)","",data$LastName)
head (NewLastName)


data$LastName<-NULL
data$LastName <- NewLastName
write.csv(data, file = "D:/学习/hfda_ch13_raw_data_modified.csv")

 

 结果如图:

 三、清洗重复数据

dataSorted <-data[order(data$PersonID),]
head(dataSorted,n=50)

 删除重复数据

unique(data)

 重新创建一个表格,并输出

dataNamesOnly<-dataSorted
dataNamesOnly$CallID<-NULL
dataNamesOnly$Time<-NULL
dataNamesOnly<-unique(dataNamesOnly)
head(dataNamesOnly,n=50)
write.csv(dataNamesOnly,file="D:/学习/dataNamesOnly.csv")

标签:CH13,分列,深入浅出,EXCEL,readr,清洗,data,替换
From: https://blog.csdn.net/Adore_rui/article/details/137049695

相关文章

  • Java使用EasyExcel实现对excel文件的读写
    文章目录前言一、EasyExcel是什么?二、使用步骤1.引入库2.创建实体类3建立数据库4先建两个excel表5书写Mapper6书写测试类总结前言提示:这里可以添加本文要记录的大概内容:在学习Java中难免会有对文件的读写操作,像word文档、pdf文件以及excel表。这些读写操作都大......
  • 前端实现导出table表格为Excel、CSV
    js实现导出table表格为Exceljquery.table2excel.js要基于jquery的基础上才能使用,是一款专门导出excel的插件jquery-3.3.1.js下载http://www.jq22.com/jquery-info122代码如下:<!DOCTYPEhtml><html><head><metacharset="utf-8"><metaname="viewpor......
  • 如何使用 JavaScript 导入和导出 Excel
    前言在现代的Web应用开发中,与Excel文件的导入和导出成为了一项常见而重要的任务。无论是数据交换、报告生成还是数据分析,与Excel文件的交互都扮演着至关重要的角色。本文小编将为大家介绍如何在熟悉的电子表格UI中轻松导入Excel文件,并以编程方式修改表格或允许用户进行编辑,最......
  • vue中导出excel表格, Workbook 导出的表格的单元格格式设置为文本
    <template><button@click="exportExcel">导出Excel</button></template><script>importXLSXfrom'xlsx';exportdefault{methods:{exportExcel(){//创建Workbook和工作表constworkbook=......
  • 前端导入导出 Excel
    前端导入导出Excel文件通常使用一些现成的库或工具来简化操作。以下是一种常见的实现方法:导出Excel1.使用现成的库可以使用像xlsx或exceljs这样的JavaScript库来生成Excel文件。这些库提供了创建Excel文件所需的各种功能和API。//使用xlsx库示例constXLSX......
  • C#中DataGrid导出Excel文件
    privatevoidbtnExport_Click(objectsender,RoutedEventArgse){System.Diagnostics.Stopwatchsw=newSystem.Diagnostics.Stopwatch();sw.Start();grid.SelectAllCells();grid.ClipboardCopyMod......
  • 纯前端调用原生Office实现Web在线编辑Word/Excel/PPT,支持私有化部署
    在日常协同办公过程中,一份文件可能需要多次重复修改才能确定,如果你发送给多个人修改后再汇总,这样既效率低又容易出错,这就用到网页版协同办公软件了,不仅方便文件流转还保证不会出错。但是目前一些在线协同Office属于模拟Office,在线模拟OFFICE编辑过的文档,再用本机Office编辑都存在......
  • python处理excel,删除行和列+去除重复列
    删除指定的行与列点击查看代码importxlwingsasxw#下載下來的Excel,列和行有很多空白的,要先刪除掉.#打开Excel文件workbook=xw.Book('test.xlsx')sheet=workbook.sheets[0]#删除1-12行sheet.range('1:12').api.EntireRow.Delete()#删除A-G列sheet.range(......
  • Python+openpyxl 拆分Excel合并的单元格
    图片数据是举例子。在实际使用中,从需求网页上下载的生产资料是带有合并单元格的,但在处理的时候需要拆分开,不然不好操作。使用openpyxl可以实现操作如果没有安装openpyxl库,首先安装openpyxl在命令行执行pipinstallopenpyxl点击查看代码importopenpyxlpath=r"test.......
  • python + xlwings 根据条件筛选Excel里的所需资料
    实际有用,有效,满足我的个人需要。点击查看代码importxlwingsasxwdeffiler():try:app=xw.App(visible=False,add_book=False)app2=xw.App(visible=False,add_book=True)wb=app.books.open('new_file.xlsx')#打开原始数据表......