记录一个pdf转xlsx的方法

时间：2024-05-27 23:33:26浏览次数：30

标签：xlsx input 记录 file import pdf name

import tkinter.filedialog
import pandas as pd
import os
import pdfplumber
import tkinter


class PdfReader:
    # output_file = tkinter.filedialog.asksaveasfile(title='保存到', initialfile=f"{name}.xlsx", filetypes=[("excel文件", ".xlsx")])
    @staticmethod
    def catch(input_file):
        with pdfplumber.open(input_file) as pdf:
            # 提取文件名，父目录地址
            name = input_file.split('/')[-1][:-4]
            path = os.path.dirname(input_file)
            # 抓取pdf表格
            pages = pdf.pages
            writer = pd.ExcelWriter(os.path.join(path, f'{name}.xlsx'))
            count = 1
            for page in pages:
                table = page.extract_table()
                # 生成结果
                df = pd.DataFrame(columns=range(len(table[0])), data=table)
                df.to_excel(writer, sheet_name=f'Sheet{count}', index=None)
                count += 1
            writer.close()

    def process(self):
        input_files = tkinter.filedialog.askopenfilenames(title='选择转化文件')
        for i in input_files:
            try:
                self.catch(input_file=i)
                print(i, '转化成功')
            except:
                print(i, '转化失败')


if __name__ == '__main__':
    PdfReader().process()

标签：xlsx,input,记录,file,import,pdf,name
From： https://www.cnblogs.com/AZ26/p/18216858

【专题】2024餐饮行业及营销趋势报告合集PDF分享（附原数据表）
原文链接：https://tecdat.cn/?p=36256原文出处：拓端数据部落公众号2024年，餐饮行业的趋势展望聚焦于健康、国潮、单品爆款和情感体验四大方向。首先，健康成为了消费者在选择餐饮时的首要考量。人们越来越注重食材的新鲜度和健康性，对菜品的口味也有了更高的要求。这意味着餐饮品牌需......
CF 随机跳题记录
\(0\)表示完全没看题解，\(1\)表示看了一点题解，\(2\)表示抄的题解。12001245B-RestrictedRPS【1】指令：/duelproblem1200constructive_algorithms标签：构造，贪心\(4\)发。aclink。第一眼看题感觉和构造完全没有关系。当可以使用的时候尽量使用，填上对应的字符串。如......
推式子的做题记录
「LOJ#3399」CommunicationNetwork首先列出式子，\(ans=\sum\limits_{T_2}|T_1\capT_2|2^{T_1\capT_2}\)注意到有\(f(S)=\sum\limits_{T\subseteqS}\sum\limits_{T'\subseteqT}(-1)^{T-T'}f(T')\)证明可考虑计算每个\(T'\)的贡献，由于\(T'\subse......
不同厂商SOC芯片在视频记录仪领域的应用
不同SoC公司芯片在不同产品上的应用信息：大唐半导体芯片型号:LC1860C(主控)+LC1160(PMU)产品应用:红米2A(399元)大疆晓Spark技术规格:28nm工艺，4个ARMCortex-A7处理器，1.5GHz主频，2核MaliT628GPU，1300万像素摄像处理，1080P@30fps编解码Movidius芯片型号:Myriad2......
力扣刷题记录： 2134. 最少交换次数来组合所有的 1 Ⅱ
这道题是第275场周赛的Q2，LC竞赛分为1748，主要考察滑动窗口。说实话这道题要想到是滑动窗口就很简单，否则就根本无从下手。方法一.滑动窗口（时间超过62.53%C++用户）处理环形数组的一个很有效的技巧就是“追加”，把整个nums数组追加到nums数组后面，......
MySQL函数查询目录树问题记录
DELIMITER//CREATEFUNCTION`getChildXzqhList`(rootIdBIGINT)RETURNSVARCHAR(4000)BEGINSETSESSIONgroup_concat_max_len=1000000;--设置为1MB设置GROUP_CONCAT函数输出的最大长度大小，太小的话整体会被截掉RETURN(WITH......
民国漫画杂志《时代漫画》第26期.PDF
时代漫画26.PDF:https://url03.ctfile.com/f/1779803-1248635183-9832d2?p=9586(访问密码:9586)《时代漫画》的杂志在1934年诞生了，截止1937年6月战争来临被迫停刊共发行了39期。ps:资源来源网络!......
民国漫画杂志《时代漫画》第28期.PDF
时代漫画28.PDF:https://url03.ctfile.com/f/1779803-1248635321-5c67ad?p=9586(访问密码:9586)《时代漫画》的杂志在1934年诞生了，截止1937年6月战争来临被迫停刊共发行了39期。ps:资源来源网络!......
扫描的PDF图纸怎么转换为CAD文件？
在工程项目中，我们经常需要将扫描的PDF图纸转换为CAD文件，以便进行更精确的编辑和修改。那么扫描的图纸怎么转CAD呢？以下将详细介绍三种将扫描的PDF图纸转换为CAD文件的方法，供您参考。方法一：使用专业的PDF转CAD软件这是最常见也最便捷的方法之一。市面上有许多专业的PDF转CAD软件，如......
AutoCAD中图形打印成PDF后尺寸为什么比实际绘图尺寸小几毫米？
最近有小伙伴提问，将CAD打印成PDF后，再将PDF文件重新导入到CAD软件中比对，发现图形比原CAD图形尺寸小了几毫米，如下：这个主要是打印比例设置导致的，CAD默认打印比例默认勾选的是「布满图纸」，即布满到了实际打印范围，这个实际打印范围如果你没有事先对图纸进行修改到边界为0，那么就会......

记录一个pdf转xlsx的方法

相关文章

赞助商

阅读排行