大家好,我是Python进阶者。
一、前言
前几天在Python最强王者交流群【wen】问了一个Pandas处理数据的问题,问题如下:
import pandas as pd
import polars as pl
import time
start_time = time.time()
df = pd.read_excel('G:\input\测试.xlsx', sheet_name=None, dtype=str,engine='calamine')
sheet_names = list(df.keys())
for sheet_name in sheet_names:
df_sheet = pl.read_excel('G:\input\测试.xlsx', sheet_name=sheet_name)
print(f'{sheet_name}----------{df_sheet.height}')
end_time = time.time()
time_taken = end_time - start_time
请教,需求是统计excel表格每个sheet的行数,请问还有更快捷的方法么?
之前没使用calamine引擎,13万行数据大概需要50秒,使用calamine压缩到10秒
二、实现过程
后来【隔壁
标签:yyds,sheet,name,df,excel,wen,time,calamine From: https://blog.51cto.com/u_13389043/11947027