首页 > 编程语言 >如何使用Python将PDF转为Excel

如何使用Python将PDF转为Excel

时间:2023-11-06 15:23:26浏览次数:51  
标签:文档 Python Excel bool pdf PDF

PDF文件是一种静态文档格式,通常难以编辑,而Excel则是一个灵活的表格工具。如果你需要处理PDF表格中的数据,那么将其导出为Excel文件可以大大节省工作时间和精力。Excel提供的强大数据编辑和格式化功能,允许你对转换后的PDF数据进行修改、排序、筛选、计算等操作。同时,你还可以调整单元格大小、更改字体、应用样式等。本文将提供在Python中将PDF表格转换为Excel文件的解决方案。


一、环境准备

需要先安装Spire.PDF for Python库来帮助实现PDF转Excel。可以通过以下pip命令安装:(或参考 如何在 VS Code 中安装 Spire.PDF for Python

pip install Spire.PDF

 

二、Python 将PDF转为Excel 实现步骤

1. 加载PDF文档。

2. 创建 XlsxLineLayoutOptions 类的对象来指定转换选项。

3. 应用上述设置的转换选项,然后使用 PdfDocument.SaveToFile() 将PDF文件保存为Excel xlsx表格。

其中XlsxLineLayoutOptions类的构造函数接受以下5个参数:

参数  描述
convertToMultipleSheet (bool)  表示是否将多个 PDF 页面渲染到一个 Excel 工作表中
rotatedText (bool)  表示是否显示旋转的文本
splitCell (bool) 表示一个包含多行文本的 PDF 表格单元格是否会在 Excel 中被拆分成多行
wrapText (bool)  表示是否对 Excel 单元格中的文本进行换行
overlapText (bool)  表示是否显示重叠的文本

 

 

 

 

 

 

 

测试代码:

from spire.pdf.common import *
from spire.pdf import *
 
# 创建PdfDocument对象
pdf = PdfDocument()
 
# 加载PDF文档
pdf.LoadFromFile("数据.pdf")
 
# 创建 XlsxLineLayoutOptions 对象来指定转换选项
convertOptions = XlsxLineLayoutOptions(True, True, False, True, False)
 
# 设置转换选项
pdf.ConvertOptions.SetPdfToXlsxOptions(convertOptions)
 
# 将PDF文档保存为Excel XLSX格式
pdf.SaveToFile("Pdf转Excel.xlsx", FileFormat.XLSX)
pdf.Close()
 

 

转换结果:

 

实现更多Python对PDF文档的处理功能:Spire.PDF for Python 中文教程

标签:文档,Python,Excel,bool,pdf,PDF
From: https://www.cnblogs.com/Yesi/p/17812785.html

相关文章

  • (十)Python之数字类型
    数字类型数字类型用于存储数值,他们是不可改变的数据类型,这意味着改变数字数据类型会分配一个新的对象,当你指定一个值时,Number对象就会被创建:num=15int:整型Python3整型是没有限制大小的,可以当作long类型使用,所以Python3没有Python2的long类型,举例1010055float:浮点型用来表......
  • (十一)Python之字符串类型
    字符串类型Python中的字符串用单引号(‘’)或双引号(”“)括起来,同时使用反斜杠(\)转义特殊字符语法:s=”a1a2...an“(n>=0)Python使用单引号(‘)、双引号(“)、三引号(”“”)来表示字符串、其中三引号可以由多行组成,它是编写多行文本的快捷语法,常用于文档字符串,在文件的特定地点,被当作注......
  • (九)Python之标准数据类型
    数据类型数据类型用来确定要存储在内存单元中的数据的类型,在Python中,变量没有类型,我们所说的“类型”是变量所指定的内存中对象的类型不可变数据(三个):Number(数字)、String(字符串)、Tuple(元组);不可变数据类型:当该数据类型的对应变量的值发生了改变,那么它对应的内存地址也会发生改......
  • 记一次centos7安装python的mysql-client
    Exception:Cannotfindvalidpkg-configname.SpecifyMYSQLCLIENT_CFLAGSandMYSQLCLIENT_LDFLAGSenvvarsmanually起初安装发现缺少pkg-config和 MYSQLCLIENT_LDFLAGS环境变量,安装和手动声明环境变量后又报新的错MYSQL_OPT_SSL_ENFORCE......
  • Python数据类型bytes 和 bytearray
    bytes和bytearray都是二进制世界的成员,用二进制的方式去理解才能看清他的本质。理解bytes和bytearray0和1是计算机工作的根本,单个的0和1只能表达两种状态,无法满足我们复杂的计算,于是计算机使用了8位即一个byte作为一个储存的基本单位。byte由8bit组成,例如   0000......
  • Python 使用Scapy构造特殊数据包
    Scapy是一款Python库,可用于构建、发送、接收和解析网络数据包。除了实现端口扫描外,它还可以用于实现各种网络安全工具,例如SynFlood攻击,Sockstress攻击,DNS查询攻击,ARP攻击,ARP中间人等。这些工具都是基于构造、发送和解析网络数据包来实现的,可以用于模拟各种网络攻击,测试网络安全防......
  • 免费领取Python学习资料
    话不多说,直接上Python学习资料QQ·群: 894692354(不单独一一发了,要的人太多,实在忙不过来)......
  • 从零开始学习Python
    从零开始学习Python是一个令人兴奋和有趣的过程。无论你是完全没有编程经验,还是已经熟悉其他编程语言,Python都可以成为你迈向程序员之路的理想起点。首先,在开始学习之前,请确保在计算机上安装了最新版本的Python解释器。官方网站(https://www.python.org)提供了可下载并按指引进行安......
  • How to search for ? (question mark) in Excel
    The?isawildcardwhichrepresentsasinglecharacter,andthe*isawildcardcharacterthatrepresentsanystringofcharacters.Whensearchingforeitherwildcardcharacter,Excelwillsimplyfindeverything,whetherornottheseactualcharactersapp......
  • Python_pytest +文件名,报错—— zsh: command not found: pytest
     原因:由于“通过pip安装pytest不会使其成为系统命令,而是会将其安装到python”“-m命令将pytest作为其自己的命令运行,然后任何后续脚本都将作为参数。”解决:所以我们在命令窗口执行时应该在.py文件所在路径下执行  python-mpytest-vtest_wework.py这个问题终于......