【Python数据预处理系列】精通Pandas：数据清洗中的字符串分割技巧（例子：如何将籍贯列中的横线替换为省份和市区）

时间：2024-06-05 19:59:38浏览次数：33

标签：分割 Python 列中 Pandas df split str data 籍贯

本文将深入探讨Pandas库在数据清洗中的应用，特别是字符串分割技巧。

在数据分析的预处理步骤中，有效地处理和准备原始数据是至关重要的一步。我们将通过具体示例，展示如何使用Pandas中的 .str.split() 函数来对数据集中的字符串进行分割，进而提取所需信息。

本文例子讲解如何将包含横线的籍贯列拆分为省份和市区两个部分。首先，我们创建了一个空的DataFrame，然后使用data["籍贯"].str.split('-')方法对"籍贯"列进行字符串分割。接着，我们分别提取了分割后的第一部分（省份）和第二部分（市区），并将它们添加到新的DataFrame中。这些操作可以帮助我们在数据分析过程中更好地处理和利用原始数据。

一、准备数据

此数据是关于每个样本的籍贯信息，前半部分为省份或自治区，后半部分为市区。

即”省份-市区“

import pandas as pd
data=pd.read_excel("籍贯.xlsx")

二、使用.str.split('-')方法进行字符串分割。

#首先，创建一个空的DataFrame，命名为df。
df=pd.DataFrame()

#使用data["籍贯"].str.split('-')方法对"籍贯"列进行字符串分割。
data["籍贯"].str.split('-')

这里.str.split('-')是pandas中的一个内置函数，用于对字符串进行分割。

是针对DataFrame中的Series对象data["籍贯"]，用于执行字符串操作。

三、提取分隔符”-“前的省份数据

str[0]表示提取列表中的第一个元素，即分割后的第一部分，它代表了省份。

#str[0]表示提取列表中的第一个元素，即分割后的第一部分，它代表了省份。
df['省份'] =data["籍贯"].str.split('-').str[0]

四、提取分隔符”-“后的市区数据

str[1]表示提取列表中的第二个元素，即分割后的第二部分，它代表了市区。

#str[1]表示提取列表中的第二个元素，即分割后的第二部分，它代表了市区。
df['市区'] = data["籍贯"].str.split('-').str[1]

#df['地区'] = df['省份'] + '-' + df['市区']

标签：分割,Python,列中,Pandas,df,split,str,data,籍贯
From： https://blog.csdn.net/2301_81199775/article/details/139480556

python 函数形参前带*或者两个星** 收集元组或者字典，实参前带星*或者两个星** 解开序
函数的形参前面带一个星*，代表着不定长参数，实际上是收集了不定长的实参，作为一个元组。形参前面带两个星**，代表可以接收不定长参数，并且调用该函数时实参要指定参数名，实际上是收集了一个不定键个数的字典。实参前带一个星*，表示解开当前的序列，再做为参数传递。实参前带两个星**，表示......
请自行构建一个Mysql容器并将Python开发数据保存到此数据库用户名数据库名不限制
下面是一个完整的示例，展示如何构建一个MySQL容器，并使用Python脚本将数据保存到数据库中。启动MySQLDocker容器首先，确保Docker已经安装。然后打开终端或命令提示符，运行以下命令来拉取MySQLDocker镜像并启动容器：dockerpullmysql:latestdockerrun--namemy-mys......
会Python要怎么接单兼职？怎么把它作为副业发展呢？？
学习资源已打包，需要的小伙伴可以戳这里学习资料1.网络爬虫：爬取网站或者APP数据，把数据提供给用户，或者有的要提供程序2.web后台接口：比如使用Flask提供API接口，这种其实我比较喜欢，但是需求量不多3.数据处理与分析：可以用Pytrhon直接搞定，或者借助Pandas实现一、淘宝接单......
python eof是什么
EOF，为EndOfFile的缩写，通常在文本的最后存在此字符表示资料结束。在微软的DOS和Windows中，读取数据时终端不会产生EOF。此时，应用程序知道数据源是一个终端（或者其它“字符设备”），并将一个已知的保留的字符或序列解释为文件结束的指明；最普遍地说，它是ASCII码中的替换字符（Control......
python如何编译成exe文件
python如何编译成exe文件？具体步骤如下：1、使用pycharm安装pyinstaller。2、找到pyinstaller的安装目录。C:\Users\lounious\PycharmProjects\untitled\venv\Scripts\pyinstaller-script.py注意在该目录的母目录下一般有我们的程序文件C:\Users\lounious\PycharmProject......
python运维怎么学
运维工程师和开发人员一样，同属于IT从业人员，很多人认为运维人员不需要懂开发，其实不然，不懂开发的运维道路会越走越窄。现阶段，掌握一门Python开发已经成为高级运维工程师的必备技能了，那么Python运维要学习哪些内容，如何才能学好？下面给大家介绍一下：1、学习编程不止是学习语法，需要......
（数据科学学习手札161）高性能数据分析利器DuckDB在Python中的使用
本文完整代码及附件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes1简介大家好我是费老师，就在几天前，经过六年多的持续开发迭代，著名的开源高性能分析型数据库DuckDB发布了其1.0.0正式版本。DuckDB具有极强的单机数据分析性能表现，功能丰......
无缝融合：使用 Python 和 PyFFmpeg 合并视频的完整指南
前言在当今数字化时代，视频内容无处不在。从社交媒体到在线教育，视频已经成为我们生活中不可或缺的一部分。但是，有时候我们可能需要将多个视频片段合并成一个，创造出更丰富、更有吸引力的内容。而今天，我们将向您展示如何使用Python和PyFFmpeg工具实现这一目标。准备工作：安装P......
音频剪裁大师：使用 Python 和 ffmpeg 分割音频的完整指南
前言在音频处理中，有时候我们需要对音频文件进行分割，提取其中的部分内容以满足特定需求。而Python提供了许多强大的工具和库来实现这一目标，其中ffmpeg是一个功能强大的工具，它不仅支持音频分割，还能进行音频转码、合并、提取等操作。本文将介绍如何使用Python和ffmpeg来分......
流畅的python--第七章
把函数视为对象在python中，函数是一等对象。编程语言研究人员把“一等对象”定义为满足以下条件的程序实体：在运行时创建；能赋值给变量或数据结构中的元素；能作为参数传给函数；能作为函数的返回结果。示例7-1创建并测试一个函数，读取函数的__doc__属性，再检查函数的类型......

【Python数据预处理系列】精通Pandas：数据清洗中的字符串分割技巧（例子：如何将籍贯列中的横线替换为省份和市区）

一、准备数据

二、使用.str.split('-')方法进行字符串分割。

三、提取分隔符”-“前的省份数据

四、提取分隔符”-“后的市区数据

相关文章

赞助商

阅读排行

【Python数据预处理系列】精通Pandas：数据清洗中的字符串分割技巧（例子：如何将籍贯列中的横线替换为省份和市区）

一、准备数据

二、 使用.str.split('-')方法进行字符串分割。

三、提取分隔符”-“前的省份数据

四、提取分隔符”-“后的市区数据

相关文章

赞助商

阅读排行

二、使用.str.split('-')方法进行字符串分割。