** Series结构是由索引+值组成的。**
Series.values # 得到值
Series.index # 得到索引
创建一个Series,并赋予其标签索引:
s1 = pd.Series([2,3,4,5,6],index=[0,1,2,3,4])
通过字典方式创建Series:
s2 = pd.Series({"小猫":66,"小狗":77,"小牛":88})
返回值会告诉dtype类型,如果想改变类型可以后跟.astype('类型')。
loc与iloc
loc:标签索引(注:标签索引是可以取到结束值的)
iloc:行号索引
通过索引取值的一些做法:
s1.loc[0]
s1.loc[1:4]
更改值:
s1.loc[0] = 要赋予的值
筛选:
类似array
s1[(s1>2) | (s1<5)]
运算:
S1+S1 当索引无法匹配的时候,会返回NaN值。
解决方法:
例:s1.add/sub/mul/div(s2,fill_value = 0)
返回描述性统计值的函数:
s1.describe()
apply方法:(可以应用于 DataFrame 的行或列,以及Series对象。)
apply不改变原始Series、DataFrame。
s1.apply(自定义函数、匿名函数lambda x,y:x+y)
匿名函数的一些用法:
例1:add = lambda x, y: x + y # 定义一个lambda函数,接收两个参数
result = add(3, 5) # 输出:8
例2:# 计算商(如果y不为0)
divide = lambda x, y: x / y if y != 0 else "除数不能为0"
result = divide(5, 3) # 输出:1.6666666666666667
result = divide(5, 0) # 输出:"除数不能为0"