首页 > 其他分享 >py使用df合并一万个xls到一个xls

py使用df合并一万个xls到一个xls

时间:2024-11-01 08:49:04浏览次数:3  
标签:pd df py combined str xls 用工

import pandas as pd
import glob

pd.set_option('display.float_format', lambda x: f'{x:.0f}' if pd.notna(x) else x)
dtypes = {'所属区':str, '个人编号':str, '身份证号码':str, '姓名':str, '单位编号':str, '单位社会信用代码':str, '单位名称':str, '人员用工单位':str, '用工单位社会信用代码':str, '用工单位完整名称':str}
# 获取所有.xls 文件的路径
files = glob.glob('./*.xlsx')

# 创建一个空的 DataFrame 来存储合并后的数据
combined_df = pd.DataFrame()

# 遍历每个文件并合并数据
for file in files:

    df = pd.read_excel(file,sheet_name=['用工明细'], header=0, skiprows=0,dtype=dtypes)

    fdtmp=df['用工明细'].iloc[0:]
    fdtmp1=fdtmp[fdtmp['个人编号'].notna()]

    combined_df = pd.concat([combined_df, fdtmp1], ignore_index=True)
    print(file, len(fdtmp1), len(combined_df))

# 将合并后的数据保存到新的 Excel 文件中
combined_df.to_excel('combined.xls', index=False)

标签:pd,df,py,combined,str,xls,用工
From: https://blog.csdn.net/viviliving/article/details/143360790

相关文章

  • python基础(集合)
    学习目标:集合的概念,创建,增加元素,移除元素,运算(交集,并集,差集,对称差集),推导式一.集合的概念:Python中的集合(set)是一种无序、无重复元素的数据结构,它的元素是不可变的(可哈希的)集合是由大括号{}包围的元素集合如果定义空集合,即不包含任何元素,必须使用set()函数定义二.集合的创建......
  • 基于python的语音识别与蓝牙通信的温控系统
    基于python的语音识别与蓝牙通信的温控系统大家好我是君君学姐,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于python的语音识别与蓝牙通信的温控系统。项目源码以及部署相关请联系小村学长,文末附上联系信息。......
  • python利用openpyxl处理excel(应用案例一)
    一前言环境:win10python3.8二应用案例如上要实现这样一张表格1分析不能去指定在某个位置去插入某个字段,如在a1去插入商品,a2去插入类型。不能这样做,给出字段后,要自动挨个插入2如一级字段批次信息要与它下面的二级字段相对应,二级字段占据了三列,一级字段也要占3列,且要合......
  • python+flask计算机毕业设计骨科门诊患者档案管理系统(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、选题背景关于骨科门诊患者档案管理系统的研究,现有研究主要集中在综合性医院患者档案管理方面,专门针对骨科门诊患者档案管理的研究较少。在国内......
  • 每日python小白:如何打印九九乘法表?
    一、代码展示以防各位心急,咱先搬上来代码:代码一:初级版foriinrange(1,10):forjinrange(1,10):print("%d*%d=%d"%(i,j,i*j),end="")print()效果:代码二:完整版foriinrange(1,10):forjinrange(1,i+1):print("%d*%d=%d"......
  • 大型xlsx文件内容快速读取
    openpyxl的性能还是不够用,我经常会导出很多的xlsx文件获取里面的数据来分析操作。下面的代码可以直接将xlsx的文本内容直接转为二维列表返回使用:def获取数据形成二维列表_原封不动版_V2(path:str)->list:zip_file=zipfile.ZipFile(path)monitor_typeName=os.path......
  • 【深度学习】从公式推导来深入理解误差反向传播算法2:《深度学习入门基于Python的理论
    《深度学习入门基于Python的理论与实现》中实现了2层全连接神经网络的代码对MNIST数据集的28x28像素0-9手写数字灰度图像进行分类,本文将重点对代码中的two_layer_net类的gradient函数中的误差反向传播的代码进行公式推导验证。验证小批量数据的交叉熵损失函数对第2层权重......
  • 学习python第十天
    今天学习了闭包,语法糖(列表推导式),装饰器,迭代器,生成器相关笔记如下'''知识点:1.闭包2.语法糖(列表推导式)3.装饰器4.迭代器5.生成器'''#高阶函数#deffunc(a):#res=a()#func2()#print(a())##deffunc2():#return"python"#......
  • python的基本数据类型有哪些
    摘要:PYTHON的基本数据类型主要包括:1、数字类型2、字符串类型3、列表类型4、元组类型5、集合类型6、字典类型。数字类型是最常见的数据类型,涉及整数、浮点数、复数等。数字类型在数据科学、机器学习等领域尤为重要,其包含了整形(Int)、浮点型(Float)和复数(Complex)等子类型。它们分......
  • Python基于TensorFlow实现卷积神经网络-双向长短时记忆循环神经网络加注意力机制回归
    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后关注获取。1.项目背景随着大数据时代的到来,对复杂数据结构的理解和预测成为许多领域的重要课题。在这些领域中,无论是视频分析、语音识别还是自然语言处理,都面临着需......