首页 > 其他分享 >Excel数据分析1 导入+清洗

Excel数据分析1 导入+清洗

时间:2023-08-20 20:12:38浏览次数:48  
标签:数据分析 技巧 分列 Excel 导入 分隔符 替换 竖线

数据分析流程

导入——清洗(70%时间)——处理——展现

导入数据避坑指南

1.表格导入:谨慎选择导入格式

2.非表格导入:多技巧综合灵活运用

快速复制方法,点击起始点,(拖动页面滚轮条),shift点击结束点,即可选中中间区域

 清洗此数据

首先倒退思维

一套房源应该在EXCEL中为一行,那么我们需要将txt中多行数据变为一行

所以需要引入新的载体,WORD

 复制到word中,如图所示,有多个换行符号

在替换中

 特殊格式,段落标记就是换行符

 

选择替换为三个竖线,因为三竖线出现概率小

这时候全部变为一行,那需要再改成每一套分成一行,再看源数据哪里的区别

 因为每个不同房源结尾都是/平,所以我们根据这个换行

 

这时候再复制到excel中,就是每行开始的了,每行都是三竖线开始,开头没有 补齐开头

选择分列,用分隔符号|,选择连续分隔符号(这样三个视为一个)

接下来的数据进行进一步分列

如低楼层(共26层)1室1厅    用(,)分列

如果只想替换某一范围内的数据,就选中范围

描述内容中,-杭州替换成|||再分列

如临安临安,那就用字段宽度分列,可以用分列线拖动分列

导入数据技巧总结

1.长短复制技巧:shift

2.分列技巧:固定宽度/分隔符号

3.替换技巧:信息末尾特定文本 ^p分段符,|||替换;灵活替换

标签:数据分析,技巧,分列,Excel,导入,分隔符,替换,竖线
From: https://www.cnblogs.com/JWmorning/p/17644489.html

相关文章

  • Excel根据单元格颜色设置折线图颜色
    https://www.coder.work/article/7850118 遍历 SeriesCollection的Chart并捕获Formula每个 Series .使用 Split 获取对源数据(公式的第3部分)的引用.设置ForeColor.RGB每个 Series等于 Interior.Color与其关联的数据范围。SubColorMyChart()DimmyChart......
  • Convert excel file to csv
    /**Convertexcelfiletocsv*/publicfunctionexcel_to_csv(){ini_set('max_execution_time','0');ini_set('memory_limit','1G');$xls_file=storage_path('excel_......
  • 如何在控制台查看excel内容
    最近发现打开电脑的excel很慢,而且使用到的场景很少,也因为mac自带了预览的功能。但是shigen就是闲不住,想自己搞一个excel预览软件,于是在一番技术选型之后,我决定使用python在控制台显示excel的内容。具体的需要的功能有:查看excel的某一行信息查看某个范围的信息,信息的区间为[start,en......
  • Excel中最后一列 iv列
    "IV1"是一个单元格引用,表示Excel中的一个特定单元格。在Excel中,列的标识是字母,从A开始逐渐增加,IV代表第256列。IV列通常用于存储大量数据,因为它是Excel中最后一列的标识。使用IV列可以容纳更多的数据,尤其是在需要处理大量数据的情况下。conta(b1:iv1)......
  • xlwings 代替Excel VBA,原来真的可以
    https://blog.51cto.com/u_13389043/6229675  这里要给大家重点推荐的是表中的win32com包和xlwings包。win32com包将Excel、Word和Powerpoint等软件的所有对象打包成一个COM组件提供给Python调用,所以,它使用的对象模型跟VBA使用的对象模型是完全一样的。 Excel脚本编程有......
  • xlwings dataframe保存到excel
    https://www.5axxw.com/questions/simple/zijy7y 使用xlwings保存DataFrame到Excel可以按如下方法进行:1.导入必要的模块,例如:xlwings和pandas。2.读取数据并转换成DataFrame类型。3.使用xlwings打开Excel文件,创建一个Sheet并将数据写入该Sheet。例如下面的代码段展示了如......
  • IT行业招聘数据分析与岗位推荐系统-计算机毕业设计源码+LW文档
    内容摘要随着社会经济的快速发展,人们的生活水平得到了显著提高,但随之而来的社会问题也越来越多。其中最为显著的就是就业问题。为此,招聘信息的展示也变得越来越为重要。但是在大量的招聘信息中,人们在提取自己最想要的信息时变得不那么容易,对于应聘者也是如此。本系统通过对网络爬虫......
  • 金融行业招聘数据分析系统的设计与实现-计算机毕业设计源码+LW文档
    摘要随着社会经济的快速发展,人们的生活水平得到了显著提高,但随之而来的社会问题也越来越多。其中最为显著的就是就业问题。为此,招聘信息的展示也变得越来越为重要。但是在大量的招聘信息中,人们在提取自己最想要的信息时变得不那么容易,对于应聘者也是如此。本系统通过对网络爬虫的......
  • 导出运营数据Excel报表_代码开发
           ......
  • 操作excel的xlwt库难道没有删除sheet 的方法吗?
    大家好,我是皮皮。一、前言前几天在Python最强王者群【小马哥】问了一个Python自动化办公处理的问题,一起来看看吧。各位大神,操作excel的xlwt,这个添加sheet的时候可以用add_sheet方法,xlwt难道没有删除sheet的方法吗?没有找到怎么用xlwt去删除一个sheet。二、实现过程这里【维......