pandas中的groupby函数,可以对数据进行分组,然后对分组后的数据进行聚合操作,比如求和、平均值、最大值、最小值等。平时使用groupby处理后,通常使用aggregate函数进行聚合操作。其实,groupby分组之后的聚合操作方法还很多,具体可以参考官方文档。
1. 读取数据
dataframe=pd.DataFrame({'name':['Joe','Jim','Henry','Sam','Max',],'salary':[70000,90000,80000,60000,90000,],'department':['IT','IT','Sales','Sales','IT',]})其中,name是员工姓名,salary是员工薪资,department是员工所属部门。问题是:如何找出每个部门最高的薪资?
2. groupby处理
dataframe_max= dataframe.groupby(['department'],as_index=False).aggregate({'salary':'max'})其中,groupby对department就行分组处理;as_index=False表示不使用分组的列作为索引,否则会出现多级索引。aggregate函数表示对分组后的数据进行聚合操作,{'salary':'max'}表示对salary列进行最大值操作。 标签:salary,函数,max,dataframe,groupby,分组,department,pandas From: https://www.cnblogs.com/DidierFeng/p/17853837.html