py使用df合并一万个xls到一个xls

时间：2024-11-01 08:49:04浏览次数：4

标签：pd df py combined str xls 用工

import pandas as pd
import glob

pd.set_option('display.float_format', lambda x: f'{x:.0f}' if pd.notna(x) else x)
dtypes = {'所属区':str, '个人编号':str, '身份证号码':str, '姓名':str, '单位编号':str, '单位社会信用代码':str, '单位名称':str, '人员用工单位':str, '用工单位社会信用代码':str, '用工单位完整名称':str}
# 获取所有.xls 文件的路径
files = glob.glob('./*.xlsx')

# 创建一个空的 DataFrame 来存储合并后的数据
combined_df = pd.DataFrame()

# 遍历每个文件并合并数据
for file in files:

    df = pd.read_excel(file,sheet_name=['用工明细'], header=0, skiprows=0,dtype=dtypes)

    fdtmp=df['用工明细'].iloc[0:]
    fdtmp1=fdtmp[fdtmp['个人编号'].notna()]

    combined_df = pd.concat([combined_df, fdtmp1], ignore_index=True)
    print(file, len(fdtmp1), len(combined_df))

# 将合并后的数据保存到新的 Excel 文件中
combined_df.to_excel('combined.xls', index=False)

标签：pd,df,py,combined,str,xls,用工
From： https://blog.csdn.net/viviliving/article/details/143360790

python基础（集合）
学习目标：集合的概念，创建，增加元素，移除元素，运算（交集，并集，差集，对称差集），推导式一.集合的概念：Python中的集合（set）是一种无序、无重复元素的数据结构，它的元素是不可变的（可哈希的）集合是由大括号{}包围的元素集合如果定义空集合，即不包含任何元素，必须使用set()函数定义二.集合的创建......
基于python的语音识别与蓝牙通信的温控系统
基于python的语音识别与蓝牙通信的温控系统大家好我是君君学姐，混迹在java圈的辛苦码农。今天要和大家聊的是一款基于python的语音识别与蓝牙通信的温控系统。项目源码以及部署相关请联系小村学长，文末附上联系信息。......
python利用openpyxl处理excel(应用案例一)
一前言环境：win10python3.8二应用案例如上要实现这样一张表格1分析不能去指定在某个位置去插入某个字段，如在a1去插入商品，a2去插入类型。不能这样做，给出字段后，要自动挨个插入2如一级字段批次信息要与它下面的二级字段相对应，二级字段占据了三列，一级字段也要占3列，且要合......
python+flask计算机毕业设计骨科门诊患者档案管理系统（程序+开题+论文）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、选题背景关于骨科门诊患者档案管理系统的研究，现有研究主要集中在综合性医院患者档案管理方面，专门针对骨科门诊患者档案管理的研究较少。在国内......
每日python小白：如何打印九九乘法表？
一、代码展示以防各位心急，咱先搬上来代码：代码一：初级版foriinrange(1,10):forjinrange(1,10):print("%d*%d=%d"%(i,j,i*j),end="")print()效果：代码二：完整版foriinrange(1,10):forjinrange(1,i+1):print("%d*%d=%d"......
大型xlsx文件内容快速读取
openpyxl的性能还是不够用，我经常会导出很多的xlsx文件获取里面的数据来分析操作。下面的代码可以直接将xlsx的文本内容直接转为二维列表返回使用：def获取数据形成二维列表_原封不动版_V2(path:str)->list:zip_file=zipfile.ZipFile(path)monitor_typeName=os.path......
【深度学习】从公式推导来深入理解误差反向传播算法2：《深度学习入门基于Python的理论
《深度学习入门基于Python的理论与实现》中实现了2层全连接神经网络的代码对MNIST数据集的28x28像素0-9手写数字灰度图像进行分类，本文将重点对代码中的two_layer_net类的gradient函数中的误差反向传播的代码进行公式推导验证。验证小批量数据的交叉熵损失函数对第2层权重......
学习python第十天
今天学习了闭包，语法糖（列表推导式），装饰器，迭代器，生成器相关笔记如下'''知识点：1.闭包2.语法糖（列表推导式）3.装饰器4.迭代器5.生成器'''#高阶函数#deffunc(a):#res=a()#func2()#print(a())##deffunc2():#return"python"#......
python的基本数据类型有哪些
摘要：PYTHON的基本数据类型主要包括：1、数字类型2、字符串类型3、列表类型4、元组类型5、集合类型6、字典类型。数字类型是最常见的数据类型，涉及整数、浮点数、复数等。数字类型在数据科学、机器学习等领域尤为重要，其包含了整形（Int）、浮点型（Float）和复数（Complex）等子类型。它们分......
Python基于TensorFlow实现卷积神经网络-双向长短时记忆循环神经网络加注意力机制回归
说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后关注获取。1.项目背景随着大数据时代的到来，对复杂数据结构的理解和预测成为许多领域的重要课题。在这些领域中，无论是视频分析、语音识别还是自然语言处理，都面临着需......

py使用df合并一万个xls到一个xls

相关文章

赞助商

阅读排行