我正在 python 中使用 aspose.pdf 将 pdf 转换为 excel 。但问题是它只能将 pdf 的前 4 页转换为 Excel。下面是我的代码

时间：2024-08-06 15:04:36浏览次数：15

标签：python user-interface

`从 tkinter 导入 * 将 aspose.pdf 导入为 ap 从 tkinter 导入文件对话框 import pandas as pd

input_pdf = filedialog.askopenfilename(filetypes=(("PDF 文件", " .pdf"), ("所有文件", " . "))) output_file = filedialog.asksaveasfilename(defaultextension=".xlsx", your text filetypes=(("Excel 文件", " .xlsx"), ("所有文件"," . ") ))

document = ap.Document(input_pdf)


save_option = ap.ExcelSaveOptions()
save_option.minimize_the_number_of_worksheets = True
print("Page Count:", str(len(document.pages)))
save_option.Number= (0, len(document.pages))  

document.save(output_file, save_option)

问题出在这一行代码：

save_option.Number= (0, len(document.pages))

这行代码并不会像你预期的那样设置要转换的页码范围。 save_option.Number 属性用于设置单个工作表的索引，而不是页码范围。

为了转换所有页面，你需要迭代 PDF 文档的每一页，并将它们分别保存到 Excel 工作表中。

以下是如何修改代码以转换所有页面的方法：

from tkinter import *
import aspose.pdf as ap
from tkinter import filedialog

input_pdf = filedialog.askopenfilename(filetypes=(("PDF 文件", "*.pdf"), ("所有文件", "*.*")))
output_file = filedialog.asksaveasfilename(defaultextension=".xlsx", filetypes=(("Excel 文件", "*.xlsx"), ("所有文件", "*.*")))

document = ap.Document(input_pdf)

save_option = ap.ExcelSaveOptions()
save_option.minimize_the_number_of_worksheets = False  # 关闭合并工作表

# 迭代每一页并保存
for i in range(len(document.pages)):
    save_option.page_index = i
    save_option.page_count = 1
    document.save(output_file.replace(".xlsx", f"_{i+1}.xlsx"), save_option)

代码解释:

关闭合并工作表: save_option.minimize_the_number_of_worksheets = False 确保每页 PDF 都会被保存到一个独立的 Excel 工作表中。
循环遍历所有页面: 使用 for i in range(len(document.pages)) 循环遍历文档中的所有页面。
设置要转换的页面: 使用 save_option.page_index = i 和 save_option.page_count = 1 设置只转换当前循环到的页面。
保存文件: 使用 document.save() 方法保存文件，并通过在文件名中添加页码来区分不同的文件。

注意: 这段代码会将 PDF 文件的每一页保存到一个独立的 Excel 文件中。如果你希望将所有页面保存到同一个 Excel 文件的不同工作表中，则需要使用更复杂的逻辑来操作 Excel 文件。

标签：python,user-interface
From： 78837613

如何在selenium python中访问电子邮件中的所有文件夹
我使用imaplib库，但有时无法访问某些帐户，我使用poplib但它只支持访问主邮箱，但不支持访问其他文件夹，如垃圾邮件我想使用imaplib，但不会出现有时甚至无法访问的错误尽管我有一个帐户，但我仍然可以访问它，或者是否有另一个库可以快速支持该帐户？你想要使用Selenium和Python......
python安装torch-cluster、torch-scatter、torch-sparse和torch-geometric | torch_ge
1.检查CUDA版本【方法1】用nvidia-smi已装cuda，用nvidia-smi或nvcc-V查看【方法2】用torch已装torch，用torch代码打印importtorchprint(torch.__version__)#查看pytorch安装的版本号print(torch.cuda.is_available())#查看cuda是否可......
Python：学生成绩管理系统（大学编程期末实验）
引言在这个信息时代，教育管理的自动化已成为提高效率的关键。本文将介绍如何使用Python开发一个学生成绩管理系统，旨在简化成绩记录、查询和分析的过程。创作灵感来源本项目灵感来源于我在教育机构的工作经历，以及对提高教育管理效率的持续追求。通过复盘过往项目，我意识到一个......
手把手教你使用Python网络爬虫下载一本小说（附源码）
大家好，我是Python进阶者。前言前几天【磐奚鸟】大佬在群里分享了一个抓取小说的代码，感觉还是蛮不错的，这里分享给大家学习。一、小说下载如果你想下载该网站上的任意一本小说的话，直接点击链接进去，如下图所示。只要将URL中的这个数字拿到就可以了，比方说这里是951，那么这个数字......
借助 Transformer 实现美股价格的预测（Python干货）
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话： Transformer是一种在自然语言处理等领域广泛应用的深度学习架构，与传统的循环神经网络（RNN）相比，Transformer可以并行处理输入序列的各个位置，大大提高了计算效率。而且通过多层的深度堆叠，能够学习......
将 Mojo 与 Python 结合使用
Mojo允许您访问整个Python生态系统，但环境可能会因Python的安装方式而异。花些时间准确了解Python中的模块和包的工作原理是值得的，因为有一些复杂情况需要注意。如果您以前在调用Python代码时遇到困难，这将帮助您入门。Python中的模块和包让我们从Python开始，如......
Mojo和Python中的类型详解
调用Python方法时，Mojo需要在原生Python对象和原生Mojo对象之间来回转换。大多数转换都是自动进行的，但也有一些情况Mojo尚未处理。在这些情况下，您可能需要进行显式转换，或调用额外的方法。Python中的Mojo类型Mojo基本类型隐式转换为Python对象。目前支持的......
python绘制圆柱体
importosimportrandomimportnumpyasnpimportmatplotlib.pyplotasplt#合成管道数据集defplot_cylinder(center,radius,height,num_points=100):#生成圆柱体的侧面点坐标theta=np.linspace(0,2*np.pi,num_points)intervalZ=np.floor(h......
计算机毕业设计必看必学!! 86393 基于微服务架构的餐饮系统的设计与实现，原创定制程序,
摘要近年来,我国经济和社会发展迅速,人们物质生活水平日渐提高,餐饮行业更是发展迅速,人们对于餐饮行业的认识和要求也越来越高。传统形式的餐饮行业都是以人为本,管理起来需要很多人力、物力、财力,既不方便管理者的管理,也不方便顾客实时了解餐厅动态,给传统餐......
python之高阶内容
规范使用：类和对象模块导入，模块内部参数是：if__name__=="__main__":导入包（需要使用的公共代码模块）：创建python包，里面放共同模块异常捕获优化：自定义异常classMyError(Exception):#异常捕获的类def__init__(self,length,min_len):#length为用户输入的密码长度......

我正在 python 中使用 aspose.pdf 将 pdf 转换为 excel 。但问题是它只能将 pdf 的前 4 页转换为 Excel。下面是我的代码

相关文章

赞助商

阅读排行