- drop_duplicates(subset=None, keep='first', inplace=False)
- subset:用来指定特定的列,默认所有列
- keep:删除重复项并默认保留first出现的项
- sort_values(by=[],ascending=[])
- by:按照特定列排序
- ascending:默认False降序。True为升序。
- head(n),tail(n)
- head:取前n行
- tail:取倒数n行
- rename(columns={'':''})给列重命名
- rank(method='', ascending=[])默认降序排列,排名连续12345
- method:可取值为‘average’,'first','min','max','dense'
- first: 两值相同,谁先出现谁序号在前
- min: 两值相同,取顺序排名中最小的排名作为该值排名12245
- dense: 相同值序号相同12245
- method:可取值为‘average’,'first','min','max','dense'
- DataFrame.index取索引列的值
- len(DataFrame)取表的行数
- DataFrame.get(i)取第i行的值
- pd.DataFrame({'columnName':colName})创建df
- groupby后agg、lambda、transform、apply(https://blog.csdn.net/shijie97/article/details/100203634)
- transform:返回与原表等长的列向量
- Dateoffset(1): 日期偏移函数,代表日期加1天
- nunique()和unique()
- nunique()返回不同值的个数
- unique()去重返回
标签:相同,梳理,DataFrame,ascending,默认,排名,刷题,pandas,first From: https://www.cnblogs.com/dretrtg/p/17832728.html