数据结构介绍
series
- 给一组数据增加索引
- 索引在左,值在右
dataframe
- 表格型数据结构,包含一组有序的列,每列还可以是不同的数据类型
基本功能
重新索引 reindex
- 对索引重新排序,值也随之排序
data = np.arange(0,3)
a = pd.Series(data)
print(a)
print(a.reindex([3,2,1]))
print(a)
丢弃轴上的项 drop
索引,选取和过滤
- 利用标签切片,末端是包含的
使用 loc 和 iloc进行选取
- loc就是使用标签以及列名选取,iloc就是按照列的顺序选取
data = np.arange(16).reshape(4,4)
a = pd.DataFrame(data,index=['a','b','c','d'],columns=['一','二','三','四'])
print(a)
print(a.loc['a',['一','三']])
print(a.iloc[0,[0,2]])
算术运算和数据对齐
- 相加有空值 使用add()方法,fill_value填充
dataframe和series之间运算
- 广播 dataframe - series 每行都减
函数的应用和映射
- np的ufuncs方法也可以作用于 pd 上
排序和排名
- sort_index方法 按照索引排序 默认升序(ascending=false)
- sort_values 按值排序
根据多个列排序,传入名称列表即可
frame.sort-values(by=['a','b'])
214 cuizhijie
标签:series,dataframe,索引,print,排序,data,pandas From: https://www.cnblogs.com/braveman1021/p/17000992.html