首页 > 编程语言 >python文件操作相关(excel)

python文件操作相关(excel)

时间:2025-01-02 19:01:34浏览次数:7  
标签:文件 wb openpyxl python excel Excel ws row

python文件操作相关(excel)

在 Python 中,操作 Excel 文件通常使用 openpyxl、pandas 和 xlrd/xlwt 等库

  • openpyxl:适合读写 .xlsx 文件,支持高级功能
  • pandas:适合数据分析和处理,支持读写 .xlsx 和 .xls 文件
  • xlrd/xlwt:适合读写旧版 .xls 文件
  • xlsxwriter:适合创建复杂的 .xlsx 文件
  • pyxlsb:适合读取 .xlsb 文件

1. openpyxl 库

openpyxl 是一个专门用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件的库,它支持 Excel的高级功能,如公式、图表、样式等

主要功能

  • 读取 Excel 文件:加载 Excel 文件并读取数据
  • 写入 Excel 文件:创建或修改 Excel 文件并保存
  • 操作工作表:添加、删除、重命名工作表
  • 单元格操作:读取、写入、修改单元格内容
  • 样式设置:设置单元格的字体、颜色、边框等样式。
from openpyxl import Workbook, load_workbook

# 创建一个新的 Excel 文件
wb = Workbook()
ws = wb.active
ws.title = "Sheet1"

# 写入数据
ws['A1'] = "Name"
ws['B1'] = "Age"
ws['A2'] = "Alice"
ws['B2'] = 25
ws['A3'] = "Bob"
ws['B3'] = 30

# 保存文件
wb.save("example.xlsx")

# 读取 Excel 文件
wb = load_workbook("example.xlsx")
ws = wb["Sheet1"]

# 读取单元格数据
for row in ws.iter_rows(min_row=1, max_col=2, max_row=3, values_only=True):
    print(row)

openpyxl其他用法

创建与删除

  1. 创建新的工作表:

    wb.create_sheet('NewSheet')
    
  2. 删除工作表:

    del wb['SheetName']
    

操作单元格

  1. 访问单元格:

    • 通过坐标访问:
      cell = ws['A1']
      
    • 通过行和列索引访问:
      cell = ws.cell(row=1, column=1)
      
  2. 获取单元格的值:

    value = ws['A1'].value
    
  3. 遍历行和列:

    • 遍历所有行:
      for row in ws.iter_rows():
          for cell in row:
              print(cell.value)
      
    • 遍历特定范围的单元格:
      for row in ws['A1':'C3']:
          for cell in row:
              print(cell.value)
      

追加数据

  1. 在现有工作表末尾追加一行:

    from openpyxl import load_workbook
    
    wb = load_workbook('example.xlsx')
    ws = wb.active
    
    # 获取当前最后一行的行号
    max_row = ws.max_row
    
    # 追加新行
    new_row = ['Value1', 'Value2', 'Value3']
    for col_idx, value in enumerate(new_row, start=1):
        cell = ws.cell(row=max_row + 1, column=col_idx)
        cell.value = value
    
    wb.save('example.xlsx')
    
  2. 使用 openpyxl.utils 追加数据:

    from openpyxl import load_workbook
    from openpyxl.utils import get_column_letter
    
    wb = load_workbook('example.xlsx')
    ws = wb.active
    
    max_row = ws.max_row
    new_data = [
        ['Value1', 'Value2', 'Value3'],
        ['Value4', 'Value5', 'Value6']
    ]
    
    for row_idx, row_data in enumerate(new_data, start=max_row + 1):
        for col_idx, value in enumerate(row_data, start=1):
            col_letter = get_column_letter(col_idx)
            cell = ws[f'{col_letter}{row_idx}']
            cell.value = value
    
    wb.save('example.xlsx')
    
  3. 使用 ws.append 追加数据:

ws.append 方法接受一个列表作为参数,列表中的每个元素会被依次写入工作表当前最后一行的每个单元格中

  1. 创建一个新的工作簿并追加数据:

    from openpyxl import Workbook
    
    # 创建一个新的工作簿
    wb = Workbook()
    ws = wb.active
    
    # 追加一行数据
    ws.append(['Value1', 'Value2', 'Value3'])
    
    # 保存工作簿
    wb.save('example.xlsx')
    
  2. 在现有工作簿中追加数据:

    from openpyxl import load_workbook
    
    # 加载现有的工作簿
    wb = load_workbook('example.xlsx')
    ws = wb.active
    
    # 追加多行数据
    ws.append(['Value4', 'Value5', 'Value6'])
    ws.append(['Value7', 'Value8', 'Value9'])
    
    # 保存工作簿
    wb.save('example.xlsx')
    
  3. 追加包含公式的行:

    from openpyxl import load_workbook
    
    # 加载现有的工作簿
    wb = load_workbook('example.xlsx')
    ws = wb.active
    
    # 追加包含公式的行
    ws.append(['SUM(A1:A10)', 'AVERAGE(B1:B10)'])
    
    # 保存工作簿
    wb.save('example.xlsx')
    

格式化单元格

  1. 设置字体样式:

    from openpyxl.styles import Font
    
    cell = ws['A1']
    cell.font = Font(size=14, bold=True, color='FF0000')
    
  2. 设置单元格填充颜色:

    from openpyxl.styles import PatternFill
    
    fill = PatternFill(start_color='FFFF00', end_color='FFFF00', fill_type='solid')
    cell.fill = fill
    
  3. 设置边框:

    from openpyxl.styles import Border, Side
    
    thin = Side(border_style='thin', color='000000')
    border = Border(left=thin, right=thin, top=thin, bottom=thin)
    cell.border = border
    

合并单元格

  1. 合并单元格:

    ws.merge_cells('A1:B1')
    
  2. 取消合并单元格:

    ws.unmerge_cells('A1:B1')
    

插入图片

  1. 插入图片:
    from openpyxl.drawing.image import Image
    
    img = Image('example.png')
    ws.add_image(img, 'A1')
    

公式

  1. 设置公式:
    cell = ws['A1']
    cell.value = '=SUM(B1:B10)'
    

打印设置

  1. 设置打印区域:

    ws.print_area = 'A1:D10'
    
  2. 设置页眉和页脚:

    ws.header_footer.center_header.text = "&[Date]"
    ws.header_footer.right_footer.text = "&[Page] of &[Pages]"
    

保护工作表

  1. 保护工作表:

    ws.protection.password = 'password'
    ws.protection.enable()
    
  2. 取消保护工作表:

    ws.protection.disable()
    

其他功能

  • 条件格式化:

    from openpyxl.formatting import Rule
    from openpyxl.styles import PatternFill
    from openpyxl.styles.differential import DifferentialStyle
    
    red_fill = PatternFill(start_color='FF0000', end_color='FF0000', fill_type='solid')
    dxf = DifferentialStyle(fill=red_fill)
    rule = Rule(type='expression', dxf=dxf, formula=['A1>10'])
    ws.conditional_formatting.add('A1:A10', rule)
    
  • 数据验证:

    from openpyxl.worksheet.datavalidation import DataValidation
    
    dv = DataValidation(type='list', formula1='"Item1,Item2,Item3"', allow_blank=True)
    dv.add('A1')
    ws.add_data_validation(dv)
    
  • 超链接:

    from openpyxl.cell import Cell
    from openpyxl.worksheet.hyperlink import Hyperlink
    
    cell = ws['A1']
    cell.value = 'Click here'
    cell.hyperlink = Hyperlink(display='Click here', ref='A1', location='https://www.example.com')
    

2. pandas 库

pandas 是一个强大的数据分析库,支持读取和写入 Excel 文件。它通常用于处理结构化数据,如表格数据

主要功能

  • 读取 Excel 文件:将 Excel 文件加载为 DataFrame
  • 写入 Excel 文件:将 DataFrame 保存为 Excel 文件
  • 数据处理:支持数据筛选、排序、聚合等操作
  • 多工作表操作:支持读取和写入多个工作表
import pandas as pd

# 读取 Excel 文件
df = pd.read_excel("example.xlsx", sheet_name="Sheet1", engine='openpyxl')
print(df)

# 数据处理
df['Age'] = df['Age'] + 1  # 将年龄加 1
print(df)

# 写入 Excel 文件
df.to_excel("modified_example.xlsx", index=False)

3. xlrd 和 xlwt 库

xlrd 用于读取 Excel 文件(仅支持旧版 .xls 格式),xlwt 用于写入 Excel 文件(仅支持旧版 .xls 格式)

主要功能

  • 读取 Excel 文件:xlrd 可以读取 .xls 文件的内容
  • 写入 Excel 文件:xlwt 可以创建或修改 .xls 文件
import xlrd
import xlwt

# 读取 Excel 文件
workbook = xlrd.open_workbook("example.xls")
sheet = workbook.sheet_by_index(0)
for row in range(sheet.nrows):
    print(sheet.row_values(row))

# 写入 Excel 文件
workbook = xlwt.Workbook()
sheet = workbook.add_sheet("Sheet1")
sheet.write(0, 0, "Name")
sheet.write(0, 1, "Age")
sheet.write(1, 0, "Alice")
sheet.write(1, 1, 25)
workbook.save("example.xls")

4. xlsxwriter 库

xlsxwriter 一个专门用于写入 Excel 文件的库,支持创建复杂的 Excel 文件,如添加图表、公式、条件格式等

主要功能

  • 创建 Excel 文件:支持创建 .xlsx 文件
  • 高级功能:支持图表、公式、条件格式、数据验证等
  • 样式设置:支持设置单元格样式
import xlsxwriter

# 创建一个新的 Excel 文件
workbook = xlsxwriter.Workbook('example.xlsx')
worksheet = workbook.add_worksheet('Sheet1')

# 写入数据
worksheet.write('A1', 'Name')
worksheet.write('B1', 'Age')
worksheet.write('A2', 'Alice')
worksheet.write('B2', 25)

# 添加图表
chart = workbook.add_chart({'type': 'column'})
chart.add_series({'values': '=Sheet1!B2:B2'})
worksheet.insert_chart('D2', chart)

# 保存文件
workbook.close()

5. pyxlsb 库

pyxlsb 用于读取 Excel 二进制文件(.xlsb 格式)

主要功能

  • 读取 .xlsb** 文件**:支持读取 Excel 二进制文件
from pyxlsb import open_workbook

# 读取 Excel 二进制文件
with open_workbook('example.xlsb') as wb:
    with wb.get_sheet(1) as sheet:
        for row in sheet.rows():
            print([item.v for item in row])

应用场景

  • 数据导入导出:将数据库或其他数据源的数据导出为 Excel 文件,或从 Excel 文件中导入数据
  • 报表生成:使用 openpyxl 或 xlsxwriter 生成带有图表和样式的报表
  • 数据分析:使用 pandas 对 Excel 文件中的数据进行清洗、分析和可视化
  • 自动化任务:批量处理多个 Excel 文件,如合并、拆分、格式转换等

参考资料

标签:文件,wb,openpyxl,python,excel,Excel,ws,row
From: https://blog.csdn.net/weixin_42333247/article/details/144833002

相关文章

  • 构建PDF文件问答系统——从文档加载到检索增强生成
    技术背景介绍老铁们,相信你们都知道,PDF格式的文档在信息存储上有它的独有之处,尤其是那些长篇大论的年报或者技术白皮书之类。不过问题来了,这些文档里的非结构化数据本身不太容易直接喂给语言模型(LLM)。所以,今天我们就来聊聊如何搭建一个能从PDF文件中回答问题的系统——也就......
  • DL00681-基于YOLO算法的山体滑坡检测python含数据集
    山体滑坡是常见的自然灾害之一,尤其在多雨或地震活动频繁的地区,滑坡的发生往往会对人类生命财产造成严重威胁。传统的山体滑坡监测方法依赖人工巡查、地质勘探以及静态监测设备,这些手段不仅周期长、成本高,而且难以实现对滑坡灾害的及时预警。随着遥感技术和计算机视觉技术的进步,基......
  • Python爬虫获取股市数据,有哪些常用方法?
    Python股票接口实现查询账户,提交订单,自动交易(1)Python股票程序交易接口查账,提交订单,自动交易(2)股票量化,Python炒股,CSDN交流社区>>>网页直接抓取法Python中有许多库可用于解析HTML页面来获取股市数据。例如BeautifulSoup,它能够轻松地从网页的HTML结构中提取出想要的数据......
  • 基于STP文件的智能比对系统:思通数科带来高效机械制造解决方案
    在机械制造领域,设计图纸与实物之间的精准对比至关重要,传统的比对方式往往需要耗费大量时间且容易出现错误,导致生产效率低下并影响产品质量。为了解决这些问题,思通数科推出了一套基于STP文件的智能比对系统,结合大模型技术,集成了多项先进功能,如以图搜图、实物比对和多视图生成,帮助企......
  • 基于Python+Django的网上银行综合管理系统设计与实现(毕业设计/课程设计源码+论文+部署
    文章目录前言详细视频演示项目运行截图技术框架后端采用Django框架前端框架Vue可行性分析系统测试系统测试的目的系统功能测试数据库表设计代码参考数据库脚本为什么选择我?获取源码前言......
  • 基于Python的教师职业发展与晋升平台设计与实现(毕业设计/课程设计源码+论文+部署)
    文章目录前言详细视频演示项目运行截图技术框架后端采用Django框架前端框架Vue可行性分析系统测试系统测试的目的系统功能测试数据库表设计代码参考数据库脚本为什么选择我?获取源码前言......
  • python 时间库之pendulum
    Pendulum:掌握时间的艺术,让Python日期时间操作不再复杂第一部分:背景介绍在Python开发中,处理日期和时间是一个常见但复杂的任务。datetime模块虽然功能强大,但使用起来不够直观。Pendulum库的出现,就是为了简化这一过程,它提供了更人性化的API来处理日期和时间。第二部分:Pendulum......
  • 【python】词云wordcloud
    参考链接知乎:Python库——词云库Wordcloud(附源码):由浅入深知乎:ython生成词云图太简单了|拿来就用能的Python词云图代码:进阶【Python】生成词云图太简单了|拿来就用能的词云图代码:辅助参考使用Python绘制词云图的详细教程:辅助参考csdn使用Python绘制词云图的详细教程TB......
  • Python 3 安装与环境配置完整教程
    Python3安装与环境配置完整教程Python是一门强大且易学的编程语言,广泛应用于数据分析、人工智能、Web开发等领域。如果你打算在Windows系统中使用Python3,本教程将详细指导你如何完成Python3的下载、安装以及环境变量的配置。......
  • WPF通过外部资源文件为主页面控件编写样式
    1.增加外部样式文件,添加资源词典(WPF)文件创建公共样式文件GlobalStyles.xaml 编写样式文件,以<style>标记开头,TargetType属性为控件类型,如按钮“Button”,单选按钮“RadioButton”等,x:Key属性自定义命名,控件在引用属性的时候需将Style属性设置为{StaticResourcekey属性}......