首页 > 其他分享 >pandas应知必会

pandas应知必会

时间:2023-11-28 16:55:25浏览次数:40  
标签:df pandas col 下单 必会 应知 data id axis

# 创建df
columns = [A,B,C,D] data = [[1,2,3,4],[5,6,7,8]] df = pd.DataFrame(data,columns=columns)
# 对某列求和
df[A].sum() #普通求和
df[(df['是否下单'] == '下单' )].sum() #筛选求和
# 添加一列, axis=1,指定计算的方向是行而不是列,apply()对元素进行逐元素遍历操作
data["x1"]=data[[A,B]].apply(lambda x:x[A]+x[B],axis=1)
# 将列筛选、转换为dict
df[(df['是否下单'] == '下单' ) & (~df['销售id'].isin(KA_中B))].groupby(['售卖区'])['商户id'].count().to_dict()
df.loc[条件,取列]#df.loc[(df[A]=1),B]
# 条件计数
len(df[df['销售id'].isin(中B)])
len(df[(df['是否下单'] == '下单' ) & (df['销售id'].isin(中B))])
# 排序:先按col_b列降序,再按col_a列升序排序
df.sort_values(by=['col_b','col_a'],axis=0,ascending=[False,True])
# 限制返回、切片、limit、offset、first、last
df.iloc[:10] #行筛选
df.loc[:,[A,B]] #列筛选
df.get() #指定索引位置的行或列
# 逐行计算
df['col2'] = df['col1'].map(lambda x: x**2)
# 遍历
for i in df.head(10).itertuples():
print(i[1])

 

标签:df,pandas,col,下单,必会,应知,data,id,axis
From: https://www.cnblogs.com/airgeek/p/17492967.html

相关文章

  • python pandas绘图
    pandas绘图导包importmatplotlib.pyplotasplt#进行图形绘制的常用模块。#结合Pandas和Matplotlib.pyplot,您可以在数据分析和可视化方面有更多的灵活性。折线图#折线图s=pd.Series([100,200,300,200,150,80])s.plot()使用了Pandas的Series对象,并调用了其......
  • pandas 索引
    这行代码使用Pandas进行数据筛选,具体做了以下操作:pythonCopycodedf=df.loc[pd.notna(df["ab"])]解释如下:df["ab"]:这是DataFrame中名为"ab"的列(可能是小写或大写,取决于实际的列名)。这一列的数据将用于过滤DataFrame。pd.notna(df["ab"]):这是一个布尔条件,它......
  • 如何在pandas.series.str.contains中匹配以".xls"开头的行
    是的,.在正则表达式中是一个特殊字符,它匹配除了换行符以外的任何字符。如果你想要匹配一个实际的.字符,你需要在它前面加上一个反斜杠\来进行转义。因此,'\.'在正则表达式中表示一个.字符。例如,如果你想要匹配字符串".xls",你需要使用正则表达式'\.xls'。这个正则表达式匹配以.字符开始......
  • # yyds干货盘点 # 盘点一个Pandas处理Excel表格实战问题(下篇)
    大家好,我是皮皮。一、前言继续接着上一篇文章说,这一篇文章我们一起来看看大佬们的解决办法。二、实现过程这里【郑煜哲·Xiaopang】和【瑜亮老师】给了一个提示,如下图所示:后来【隔壁......
  • Pandas基本使用(三)
    算数运算"""前面减后面add加法sub减法div除法floordiv整除mul乘法pow幂次方后面减前面rsub减法rdiv除法rfloordiv整除rpow幂次方替换无穷大replace(np.inf,0)np.nanNaNnp.infinf......
  • pandas datetime 获取当前时间之前一个月的时间
    在Python中,我们可以使用pandas和datetime模块来获取当前日期之前一个月的时间。以下是一个示例:使用pandas:importpandasaspdfrompandas.tseries.offsetsimportDateOffset#获取当前日期now=pd.to_datetime('today')#计算一个月前的日期one_month_ago=now-DateOf......
  • Pandas实现这列股票代码中10-12之间的股票筛出来
    大家好,我是皮皮。一、前言前几天在Python白银交流群【YVONNE......
  • # yyds干货盘点 # Pandas实现这列股票代码中10-12之间的股票筛出来
    大家好,我是皮皮。一、前言前几天在Python白银交流群【YVONNE......
  • Python在使用pandas时内存使用过大导致服务器宕机,有哪些优化方法?
    当使用pandas处理大规模数据时,内存使用量可能会迅速增加,导致服务器宕机。为了解决这个问题,可以采用以下几个优化方法:数据类型优化:使用更小的数据类型,例如将int64转换为int32或int16,节省内存空间。对于字符串类型,尽量使用'category'类型,它会使用更少的内存。分块处理:使......
  • 【Python】geopandas 读取 shp/geojson 边界文件
    1.读取shp/geojson边界文件importgeopandasasgpdfile='media/abc.geojson'gdf=gpd.read_file(file)#将GeoDataFrame转换为GeoJSON字符串geojson=json.loads(gdf.to_json())features=geojson['features']2.获取边界文件的网格范围importgeopandas......