本文主要是在pandas中如何对字符串进行切分。我们考虑一下下面的应用场景。
这个是我们的数据集(data),可以看到,数据集中某一列(name)是某个行业的分类。各个行业之间用符号 ‘|’分割。
我们要把用每个‘|’进行分割的内容抽取出来。
pandas有个一步到到位的方法,非常方便。
import pandas as pd
data['name'].str.split('|',expand=True)
- 1
- 2
关键是参数expand,这个参数取True时,会把切割出来的内容当做一列。 如果不需要pandas为你分好列,expand=False就可以了。
通过上面一步,我们可以得到下面的结果。
这个时候已经切成3列了。
然后,我们如果只想要第一列的话,只需要做:
data['name'].str.split('|',expand=True)[0]
AppName_column = df['名称'].str.split('-',expand=True)[0]
标签:True,split,str,data,pandas,expand
From: https://www.cnblogs.com/weifeng1463/p/17646280.html