首页 > 编程语言 >XML文件批量合并成Excel表格(Python)

XML文件批量合并成Excel表格(Python)

时间:2023-05-25 09:44:49浏览次数:37  
标签:XML xml Python Excel DataFrame file path data

import os
import xml.etree.ElementTree as ET
import pandas as pd

folder_path = "C:/xxx/Desktop/2022"  # 替换为你的文件夹路径

# 获取文件夹中的所有文件
file_list = os.listdir(folder_path)

# 创建一个空的DataFrame来存储所有XML文件的数据
all_data = pd.DataFrame()

# 循环处理每个文件
for file_name in file_list:
    if file_name.endswith(".xml"):
        file_path = os.path.join(folder_path, file_name)
       
        # 解析XML文件
        tree = ET.parse(file_path)
        root = tree.getroot()
       
        # 提取XML数据并转换为DataFrame
        xml_data = {}
        for element in root.iter():
            xml_data[element.tag] = element.text
       
        df = pd.DataFrame(xml_data, index=[0])
       
        # 将DataFrame添加到总的数据集中
        all_data = pd.concat([all_data, df], ignore_index=True)

# 将数据保存为Excel文件
excel_file_path = "C:/xxx/Desktop/2022/file.xlsx"  # 替换为你的输出文件路径,如:/path/to/output/file.xlsx
all_data.to_excel(excel_file_path, index=False)

print("转换完成!Excel文件已保存。")

  运行前请确保对应的库装好

标签:XML,xml,Python,Excel,DataFrame,file,path,data
From: https://www.cnblogs.com/Allen8/p/17430259.html

相关文章

  • Python 自动化爬虫利器 Playwright
    Python自动化爬虫利器PlaywrightPythonPlaywright是一个基于Node.js的自动化测试库,它支持多种浏览器(Chrome、Firefox、Safari、Edge等),并提供了一些方便的API来模拟用户在浏览器中的行为。本篇将介绍PythonPlaywright库的基本使用教程。安装首先需要安装PythonPlay......
  • #yyds干货盘点# LeetCode程序员面试金典:Excel表列名称
    1.简述:给你一个整数 columnNumber,返回它在Excel表中相对应的列名称。例如:A->1B->2C->3...Z->26AA->27AB->28... 示例1:输入:columnNumber=1输出:"A"示例2:输入:columnNumber=28输出:"AB"示例3:输入:columnNumber=701输出:"ZY"示例4:输入:colum......
  • python:Error: EPERM: operation not permitted, mkdir 'F:\Program Files\nodejs\n
     可以发现文件没有权限npmERR!Error:EPERM:operationnotpermitted,mkdir'F:\ProgramFiles\nodejs\node_global\node_modules'将nodejs的文件权限改为完全控制之后操作即可 ......
  • 用Python设计第一个游戏
    代码展示"""用Pyhon设计第一个游戏"""print("游戏开始了家人们")temp=input("大家来猜一猜我心里面想的哪个数字,")guwss=int(temp)ifguess==666;print("你是小昂肚子里的蛔虫嘛?!")print("哎呦喂!猜对了,奖励你写一段代码吧")else:print("......
  • 用python查找文件
    查找特定路径下的文件点击查看代码importos#显示当前路径路径=os.getcwd()print(路径)for文件inos.scandir(放入要查询的目录):#这个方法遍历文件比较快,比较好用#文件.name查询文件名字,文件.path查询文件路径,还有其他方法可以查询文件的其他信息,很方便的找特定......
  • 【SQL用法】Mybatis框架中的xml文件中经常使用的sql语句
    本文目录一、insert语句二、select查询语句三、批量添加四、与时间比较相关的项目中经常会用到的sql语句有:一、insert语句<!--保存用户信息--><insertid="save">insertintomainsite_product_message<trimprefix="("suffix=")"suffixOverrides=","......
  • Python查缺补漏2
    Python查缺补漏2函数对象的引用在Python中,函数名其实就是指向一个函数对象的引用,完全可以把函数名赋给一个变量,类似于C++的函数指针:>>>a=abs#变量a指向abs函数>>>a(-1)#所以也可以通过a调用abs函数1空函数如果想定义一个什么事也不做的空函数,可以用pass语句:defn......
  • python turtle 海龟绘图,绘制小猪佩奇
    项目介绍:瞎玩的,要用Python来画小猪佩奇。其实这个实现并不难,只要使用Python的内置模块turtle进行绘图即可。但是,如要完成一个好的作品,还是需要耗费一定时间的,因为你要提前布置好所有点的坐标和走线样式等,以及实际测试中会反复调试也比较麻烦。下面就是最终完成的小猪佩琪效果动态图......
  • 【IntelliJ IDEA】idea中的插件之一:Free Mybatis plugin跳转插件的使用(方便在Dao接口
    本文目录一、安装二、使用最近在使用一个非常好用的跳转插件,用着很顺手,效率比之前提高了很多。之前使用MyBatis框架或者是在IDEA中,发现Mapper接口和XML文件之间跳转十分的麻烦,我之前经常的操作是在Mapper接口中将接口名称复制一下,然后去查找对应的XML文件,打开后CRTL+F查找对应的xml......
  • Python——datetime库
    Python——datetime库datetime是Python内置的一个处理日期和时间的标准库,可以轻松处理日期和时间,也可以进行日期和时间的格式化操作。下面是一些datetime库中常用的方法:datetime.date:返回表示日期的对象。datetime.time:返回表示时间的对象。datetime.datetime:返回日期和时......