1.展示数据
import pandas as pd import numpy as np data = {"grammer":["python", "c", "java", "go", np.nan, "sql", "php", "c++"], "score": [1,2,np.nan,4,5,6,7,10]} df = pd.DataFrame(data) df
2.提取含有某数据的行
df[df["grammer"]=="python"] #提取含有python的行,参数:列名称,关键词
3.提取指定列数据
df["grammer"] #参数为列名称
4.提取指定列含有指定数据,的布尔值
res = df["grammer"].str.contains("python") #参数:列名称,关键词 res.fillna(value = False, inplace=True) df[res] #找到是正确的,数据返回的列
5.获取全部的列名称有哪些
df.columns #Index(['grammer', 'popularity'], dtype='object')
6.修改列名称
df.rename(columns={"score":"popularity"},inplace = True)#修改列名称 df
7.统计元素的出现次数
df["grammer"].value_counts() # 参数:列名称, 注意小括号
8.空值填充:用上下文的平均值填充
df["popularity"] = df["popularity"].fillna(df["popularity"].interpolate()) df
标签:df,res,popularity,python,grammer,名称,操作,直接,pandas From: https://www.cnblogs.com/zwx901323/p/16928258.html