1. Series类型
Series类型由一组数据及与之相关的数据索引组成
也可以自定义索引:
1.1 初始化
从标量创建:
从字典创建:
从ndarray类型创建:
1.2 基本操作
Series类型包括index和values两部分。
Series类型的操作类似ndarray类型
Series类型的操作类似Python字典类型
可以使用in
、get
等方法
1.3 对齐操作
Series类型在运算中会自动对产不同索引的数据。当多个series对象之间进行运算的时候,如果不同series之间具有不同的索引值,那么运算会自动对齐不同索引值的数据,如果某个series没有某个索引值,那么最终结果会赋值为NaN。
1.4 name属性
Series对象和索引都可以有一个名字,存储在属性.name中
1.5 修改
Series对象可以随时修改并即刻生效
2. DataFrame类型
DataFrame类型由共用相同索引的一组列组成
DataFrame是一个表格型的数据类型,每列值类型可以不同
DataFrame既有行索引、也有列索引
DataFrame常用于表达二维数据,但可以表达多维数据。
2.1 初始化
从二维ndarray对象创建
从一维ndarray对象字典创建
从列表类型的字典创建
例:
上例中,若要取出某行某列
3. 数据类型操作
3.1 重新索引
.reindex()能够改变或重排Series和DataFrame索引
.reindex(index=None,columns=None,...)的参数
例如新增一列:
3.2 索引类型
索引类型的常用方法
例:删除一列,添加一行c0,且由c1填充而来
3.3 删除指定索引对象
.drop()能够删除Series和DataFrame指定行或列索引
默认修改0轴元素,如果有要求可使用axis=某数