如何保留 Excel 表头和第一行数据并追加 CSV 数据

时间：2024-06-05 15:01:01浏览次数：22

准备工作

在开始之前，确保你的 Python 环境中已经安装了 openpyxl 和 pandas 库。可以使用以下命令进行安装：

pip install openpyxl pandas

第一步：编写函数保留表头和第一行数据

我们首先编写一个函数 keep_first_two_rows，用于保留指定工作表的表头和第一行数据，其余数据将被删除。

from openpyxl import load_workbook

def keep_first_two_rows(filepath, sheetname):
    try:
        # 加载 Excel 文件
        wb = load_workbook(filepath)
        ws = wb[sheetname]

        # 删除第三行之后的所有行
        ws.delete_rows(3, ws.max_row)

        # 保存修改后的 Excel 文件
        wb.save(filepath)
        print(f"成功保留表头和第一行数据到工作表 {sheetname}")
    except Exception as e:
        print(f"保留表头和第一行数据时出错: {e}")

解释：

load_workbook(filepath)：加载指定路径的 Excel 文件。
wb[sheetname]：获取指定名称的工作表。
ws.delete_rows(3, ws.max_row)：从第三行开始删除所有后续行，只保留前两行。
wb.save(filepath)：保存对 Excel 文件的修改。

第二步：编写函数追加 CSV 数据

接下来，我们编写一个函数 append_data_from_csv，用于将 CSV 文件中的数据追加到指定工作表的末尾。

import pandas as pd
from openpyxl import load_workbook

def append_data_from_csv(filepath, sheetname, csv_filepath):
    try:
        # 从 CSV 文件中读取新数据
        new_data = pd.read_csv(csv_filepath)

        # 加载 Excel 文件
        wb = load_workbook(filepath)
        ws = wb[sheetname]

        # 将新数据追加到工作表末尾
        for r_idx, row in enumerate(new_data.values, ws.max_row + 1):
            for c_idx, value in enumerate(row, 1):
                ws.cell(row=r_idx, column=c_idx, value=value)

        # 保存修改后的 Excel 文件
        wb.save(filepath)
        print(f"成功从 CSV 文件中追加新数据到工作表 {sheetname} 后面")
    except Exception as e:
        print(f"追加新数据时出错: {e}")

解释：

pd.read_csv(csv_filepath)：使用 pandas 从指定路径读取 CSV 文件中的数据。
wb[sheetname]：获取指定名称的工作表。
enumerate(new_data.values, ws.max_row + 1)：从工作表的最后一行开始，逐行追加 CSV 数据。
ws.cell(row=r_idx, column=c_idx, value=value)：将 CSV 文件中的每个值插入到 Excel 工作表的对应单元格中。
wb.save(filepath)：保存对 Excel 文件的修改。

第三步：主程序调用

最后，我们编写主程序，调用以上两个函数，完成具体操作。

if __name__ == "__main__":
    # 指定 Excel 文件路径、工作表名和 CSV 文件路径
    excel_file_path = "C:\\Users\\Administrator\\Desktop\\销售系数数据同步.xlsx"
    sheet_name = "商品费用"
    csv_file_path = "F:\\工作内容\\我的数据\\商品费用解析数据\\商品费用数据汇总.csv"

    # 调用函数保留表头和第一行数据
    keep_first_two_rows(excel_file_path, sheet_name)

    # 调用函数从 CSV 文件中追加新数据到指定工作表后面
    append_data_from_csv(excel_file_path, sheet_name, csv_file_path)

解释：

excel_file_path：指定 Excel 文件的路径。
sheet_name：指定工作表名称。
csv_file_path：指定 CSV 文件的路径。
keep_first_two_rows(excel_file_path, sheet_name)：调用函数保留表头和第一行数据。
append_data_from_csv(excel_file_path, sheet_name, csv_file_path)：调用函数从 CSV 文件中追加新数据到指定工作表。

完整代码

from openpyxl import load_workbook
import pandas as pd

def keep_first_two_rows(filepath, sheetname):
    try:
        # 加载 Excel 文件
        wb = load_workbook(filepath)
        ws = wb[sheetname]

        # 删除第三行之后的所有行
        ws.delete_rows(3, ws.max_row)

        # 保存修改后的 Excel 文件
        wb.save(filepath)
        print(f"成功保留表头和第一行数据到工作表 {sheetname}")
    except Exception as e:
        print(f"保留表头和第一行数据时出错: {e}")

def append_data_from_csv(filepath, sheetname, csv_filepath):
    try:
        # 从 CSV 文件中读取新数据
        new_data = pd.read_csv(csv_filepath)

        # 加载 Excel 文件
        wb = load_workbook(filepath)
        ws = wb[sheetname]

        # 将新数据追加到工作表末尾
        for r_idx, row in enumerate(new_data.values, ws.max_row + 1):
            for c_idx, value in enumerate(row, 1):
                ws.cell(row=r_idx, column=c_idx, value=value)

        # 保存修改后的 Excel 文件
        wb.save(filepath)
        print(f"成功从 CSV 文件中追加新数据到工作表 {sheetname} 后面")
    except Exception as e:
        print(f"追加新数据时出错: {e}")

if __name__ == "__main__":
    # 指定 Excel 文件路径、工作表名和 CSV 文件路径
    excel_file_path = "C:\\Users\\Administrator\\Desktop\\销售系数数据同步.xlsx"
    sheet_name = "商品费用"
    csv_file_path = "F:\\工作内容\\我的数据\\商品费用解析数据\\商品费用数据汇总.csv"

    # 调用函数保留表头和第一行数据
    keep_first_two_rows(excel_file_path, sheet_name)

    # 调用函数从 CSV 文件中追加新数据到指定工作表后面
    append_data_from_csv(excel_file_path, sheet_name, csv_file_path)

标签：csv,wb,filepath,Excel,表头,ws,CSV
From： https://www.cnblogs.com/lcl-cn/p/18233057

CsvHelper：一个轻便高性能的Csv文件读写操作开源库！
Csv是一种非常常见的文件格式，采用纯文本格式，不依赖于任何特定的软件或数据库，且文件体积小，易于使用。平常项目开发中，需要都会采用这种格式，这就涉及到Csv文件的读写操作。下面介绍一个轻便高性能的Csv文件读写操作开源库。01项目简介CsvHelper是一个.Net开源库，这是一个强......
EasyExcel 导出，导入自定义表头，表头更名
一、场景在同一个场景中导出的Excel中的表头字段（title）存在不同的名称（表头、标题），在导出时，要存在差异化，并且导出的模版要同时可以导出二、方案在导出时，添加自定义的handler，对导出的字段进行处理，更换导出的字段名称在导入时，自定义需要获取的表头名称三、代码示例测试类imp......
使用Apache POI操作Excel
案例一：（创建工作表）在使用ApachePOI操作Excel时，如果要处理大量的数据（例如十万级别的行），则需要特别注意性能优化。以下是一些优化建议和详细说明：使用SXSSFWorkbook：SXSSFWorkbook是XSSFWorkbook的流式版本，可以有效地节省内存，因为它会将数据写入磁盘而不是全部保存在内存中。这是......
百万级表格实测，excel是时侯使用XLOOKUP了，比VLOOKUP简单、不出错、快
使用场景：用“证件号码”查找“Sheet4表”（272181行）的“姓名”列，填充到“Sheet1”表的空白列中。为了演示传说中的二进制查找，我们预先对“Sheet4”进行了按“证件号码”排序。1、VLOOKUP：我们第一次使用公式为：=VLOOKUP(B2,Sheet4!$A$2:$B$272181,1,FALSE)，这个公式并没有找到数据......
一键导入excel电子表格到mysql，一次导入100个100万行的电子表，合并导入到一张数据库表里
适用场景：从数据库中同一张大数据表导出的N个excel表格，他们的结构是相同的。那你说我不需要这个功能，我分表导入数据库，然后我写sql语句合并在一起就完事了。我以前也一直是这样处理的。几个表或者十多个表合并成一个表，我们写sql，忍忍也就过去了。但是上百个表合并成一个表......
使用EasyPOI导出的 Excel 表格字段为中文
导入导出添加依赖：<dependency><groupId>com.github.tobato</groupId><artifactId>fastdfs-client</artifactId><version>1.26.6......
05-Excel基础操作-学习笔记
使用分列工具整理数据导出的数据是文本文件即以.txt结尾的文件，放入Excel中，是一种常见的操作。具体操作打开文本格式的数据，Ctrl+A全选——Ctrl+C复制——新建excel表格——点击A1单元格（注意，这里不要双击）——Ctrl+V粘贴——选中A列——数据选项卡——分列——勾选“分隔符号(D)”......
Python神技：pd.read_excel怎样读取多sheet页数据
哈喽，大家好，我是木头左！今天，我要分享的是一个非常实用的Python技能，那就是如何在Python的pandas库中使用pd.read_excel函数来读取Excel文件的多个sheet页数据。一、为什么要读取Excel的多个sheet页数据？在数据分析和处理的过程中，经常需要处理包含多个sheet页的Excel文件。比如，你......
数据库初识、介绍、SQL语句的由来(库、表、记录表头、表单)、SQL语句基础(注释以及修
【一】数据库初识【1】文件存储（1）基于内存保存一开始做员工系统是基于列表或字典（内存）来存储数据（2）文件操作在Python指令中学习文件操作，将一些数据都保存到了本地的文本文件中。因为先前学习了如何搭建TCP的客户端和服务端并且在这之中TCP服务端作为存储服务，TCP客户......
pdf如何转换成excel文档？这3个方法免费!
职场人士常常会遇到PDF文件格式，因为PDF便于传输且能够保持排版稳定，因此在文件分享中备受青睐。然而，PDF文件中的表格数据可能涉及到公式和函数，而PDF格式又不易编辑，这时我们就需要将其转换为Excel格式进行编辑修改。因此，掌握PDF转换成Excel的技能对职场人士来说非常有意义。幸运的......

如何保留 Excel 表头和第一行数据并追加 CSV 数据

准备工作

第一步：编写函数保留表头和第一行数据

第二步：编写函数追加 CSV 数据

第三步：主程序调用

完整代码

相关文章

赞助商

阅读排行