import pandas as pd
import glob
pd.set_option('display.float_format', lambda x: f'{x:.0f}' if pd.notna(x) else x)
dtypes = {'所属区':str, '个人编号':str, '身份证号码':str, '姓名':str, '单位编号':str, '单位社会信用代码':str, '单位名称':str, '人员用工单位':str, '用工单位社会信用代码':str, '用工单位完整名称':str}
# 获取所有.xls 文件的路径
files = glob.glob('./*.xlsx')
# 创建一个空的 DataFrame 来存储合并后的数据
combined_df = pd.DataFrame()
# 遍历每个文件并合并数据
for file in files:
df = pd.read_excel(file,sheet_name=['用工明细'], header=0, skiprows=0,dtype=dtypes)
fdtmp=df['用工明细'].iloc[0:]
fdtmp1=fdtmp[fdtmp['个人编号'].notna()]
combined_df = pd.concat([combined_df, fdtmp1], ignore_index=True)
print(file, len(fdtmp1), len(combined_df))
# 将合并后的数据保存到新的 Excel 文件中
combined_df.to_excel('combined.xls', index=False)
标签:pd,df,py,combined,str,xls,用工
From: https://blog.csdn.net/viviliving/article/details/143360790