首页 > 其他分享 >pandas (一)

pandas (一)

时间:2022-09-26 22:03:00浏览次数:40  
标签:weight S3 S2 DataFrame df3 pd pandas

1 Pandas序列Series

1.1 根据列表生成序列 Series

X=[1,3,6,4,9];X
weight=[67,66,83,68,70];weight
sex=['女','男','男','女','男'];sex
S1=pd.Series(X);S1
S2=pd.Series(weight);S2
S3=pd.Series(sex);S3

1.2 序列合并concat

pd.concat([S2,S3],axis=0) # 0维,附加到序列后面
pd.concat([S2,S3],axis=1) # 1维,附加到新的一列

1.3 序列切片

S1[2]
S3[1:4]

2 Pandas数据框DataFrame

2.1 空数据框DataFrame

pd.DataFrame() 

2.2 根据列表创建数据框columns index

pd.DataFrame(X)
 # 创建一个列名为`weight`,索引为`A` `B` `C` `D` `E`的数据框
pd.DataFrame(weight,columns=['weight'],index=['A','B','C','D','E'])

2.3 根据字典创建数据框

df1=pd.DataFrame({'S1':S1,'S2':S2,'S3':S3});df1

# 索引来自列表`X`
df2=pd.DataFrame({'sex':sex,'weight':weight},index=X);df2

2.4 增加数据框列

df2['weight2']=df2['weight']**2;df2

2.5 删除数据框列del

del df2['weight2'];df2

2.6 缺失值处理 isnull() isnull().sum() dropna()

df3=pd.DataFrame({'S2':S2,'S3':S3},index=S1);df3
df3.isnull() # 缺失值则返回 True,否则返回 False

df3.isnull().sum() # 返回每列中包含的缺失值个数

df3.dropna() # 直接删除含有缺失值的行,多变量谨慎使用 不改变df3

2.7 数据框排序

df3.sort_index() # 按index排序
df3.sort_values(by='S3') # 按S3列值排序

标签:weight,S3,S2,DataFrame,df3,pd,pandas
From: https://www.cnblogs.com/luna2333/p/16732501.html

相关文章

  • pandas基础知识(未完成)
    pandas基础知识pandas的数据结构SeriesPandasSeries类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型Series由索引(index)和列组成,函数如下:Series只能......
  • pandas中,parse_dates和date_parser
      parse_dates和date_parserparse_dates(动词,主动解析格式)date_parser(名词,指定解析格式去解析某种不常见的格式)parse_dates(动词,主动解析格式)parse_dates=True:尝试......
  • 如何使用pandas中的时序数据分组运算
    https://www.zhihu.com/search?type=content&q=Pandas聚合时间序列数据注意以下的聚合是从当前时间点往后一段时间计算的。tmp_group=ori_data.groupby(['cols',pd.Gr......
  • Python pandas Dataframe sort_values 无效
    一定要注意df=df.sort_values()这个函数不是原地改变数据的同时也要主注意,在文档里虽然是这么写的,但是jupyter环境打印的是返回值......
  • pandas 读取 excel 时指定某些列
    单列其中B就代表excel表中的列索引standard_word=pd.read_excel('合并.xlsx',usecols='B')多列其中C:AK就代表excel表中的列索引generalized_word=pd.read_exce......
  • pandas 加载股票日线数据 load_csv
    1defload_csv():2#从csv文件读取股票日线数据3file="data/300474.csv"4df=pd.read_csv(file,encoding="gbk")5#数据以日期升序排......
  • 安装pycharm安装geopandas 成功经验
    本人经验,使用pycharm,10.3版本的python,感觉其他版本的python也能安装得上先安装geopandas依赖的包,下载连接,注意下载自己电脑版本对应的包版本GDAL-3.4.3-cp310-cp310......
  • pandas 处理数据并发送邮件
    知识点1:SQL读取并创建dataframe知识点2:python发送邮件知识点3:dataframe中某列series取唯一值知识点4:dataframe切片知识点5:dataframe中如何应用apply函数知识点6:函数的......
  • 根据条件选择pandas DataFrame中的行
    让我们看看如何根据PandasDataFrame中的某些条件选择行。使用运算符根据特定列值选择行'>','=','=','<=','!=' 。  代码#1:使用基本方法从给定数据框中选择“......
  • pandas_pandas_网站log分析
    #读取整个文件夹的log,合并到一个dataframe\1.遍历文件夹读取log\2.然后通过concat函数将这些log合并一个大的dataframe-----------------------------------------......