如果DataFrame结构的索引是日期时间数据,或者包含日期时间数据列,可以使用resample()方法进行重采样,实现按时间段查看员工业绩的功能。DataFrame结构的resample()方法语法为:
resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention='start', kind=None, loffset=None, limit=None, base=0, on=None, level=None)
其中,参数rule用来指定重采样的时间间隔,例如'7D'表示每7天采样一次;参数how用来指定如何处理两个采样时间之间的数据,不过该参数很快会被丢弃不用了;参数label = 'left'表示使用采样周期的起始时间作为结果DataFrame的index,label='right'表示使用采样周期的结束时间作为结果DataFrame的index。
假设有文件“超市营业额2.xlsx”存放于C:\Python36文件夹中,其中有工号、姓名、日期、时段、交易额、柜台这几列数据,包含2019年3月1日至2019年3月31日的数据,格式如图所示:
参考代码与运行结果:
公众号“Python小屋”
标签:采样,None,Python,resample,DataFrame,label,参数,pandas From: https://blog.51cto.com/u_9653244/6454790