首页 > 其他分享 >记录一个pdf转xlsx的方法

记录一个pdf转xlsx的方法

时间:2024-05-27 23:33:26浏览次数:30  
标签:xlsx input 记录 file import pdf name

import tkinter.filedialog
import pandas as pd
import os
import pdfplumber
import tkinter


class PdfReader:
    # output_file = tkinter.filedialog.asksaveasfile(title='保存到', initialfile=f"{name}.xlsx", filetypes=[("excel文件", ".xlsx")])
    @staticmethod
    def catch(input_file):
        with pdfplumber.open(input_file) as pdf:
            # 提取文件名,父目录地址
            name = input_file.split('/')[-1][:-4]
            path = os.path.dirname(input_file)
            # 抓取pdf表格
            pages = pdf.pages
            writer = pd.ExcelWriter(os.path.join(path, f'{name}.xlsx'))
            count = 1
            for page in pages:
                table = page.extract_table()
                # 生成结果
                df = pd.DataFrame(columns=range(len(table[0])), data=table)
                df.to_excel(writer, sheet_name=f'Sheet{count}', index=None)
                count += 1
            writer.close()

    def process(self):
        input_files = tkinter.filedialog.askopenfilenames(title='选择转化文件')
        for i in input_files:
            try:
                self.catch(input_file=i)
                print(i, '转化成功')
            except:
                print(i, '转化失败')


if __name__ == '__main__':
    PdfReader().process()

标签:xlsx,input,记录,file,import,pdf,name
From: https://www.cnblogs.com/AZ26/p/18216858

相关文章

  • 【专题】2024餐饮行业及营销趋势报告合集PDF分享(附原数据表)
    原文链接:https://tecdat.cn/?p=36256原文出处:拓端数据部落公众号2024年,餐饮行业的趋势展望聚焦于健康、国潮、单品爆款和情感体验四大方向。首先,健康成为了消费者在选择餐饮时的首要考量。人们越来越注重食材的新鲜度和健康性,对菜品的口味也有了更高的要求。这意味着餐饮品牌需......
  • CF 随机跳题记录
    \(0\)表示完全没看题解,\(1\)表示看了一点题解,\(2\)表示抄的题解。12001245B-RestrictedRPS【1】指令:/duelproblem1200constructive_algorithms标签:构造,贪心\(4\)发。aclink。第一眼看题感觉和构造完全没有关系。当可以使用的时候尽量使用,填上对应的字符串。如......
  • 推式子的做题记录
    「LOJ#3399」CommunicationNetwork首先列出式子,\(ans=\sum\limits_{T_2}|T_1\capT_2|2^{T_1\capT_2}\)注意到有\(f(S)=\sum\limits_{T\subseteqS}\sum\limits_{T'\subseteqT}(-1)^{T-T'}f(T')\)证明可考虑计算每个\(T'\)的贡献,由于\(T'\subse......
  • 不同厂商SOC芯片在视频记录仪领域的应用
    不同SoC公司芯片在不同产品上的应用信息:大唐半导体芯片型号:LC1860C(主控)+LC1160(PMU)产品应用:红米2A(399元)大疆晓Spark技术规格:28nm工艺,4个ARMCortex-A7处理器,1.5GHz主频,2核MaliT628GPU,1300万像素摄像处理,1080P@30fps编解码Movidius芯片型号:Myriad2......
  • 力扣刷题记录: 2134. 最少交换次数来组合所有的 1 Ⅱ
        这道题是第275场周赛的Q2,LC竞赛分为1748,主要考察滑动窗口。说实话这道题要想到是滑动窗口就很简单,否则就根本无从下手。方法一.滑动窗口(时间超过62.53%C++用户)        处理环形数组的一个很有效的技巧就是“追加”,把整个nums数组追加到nums数组后面,......
  • MySQL函数查询目录树问题记录
    DELIMITER//CREATEFUNCTION`getChildXzqhList`(rootIdBIGINT)RETURNSVARCHAR(4000)BEGINSETSESSIONgroup_concat_max_len=1000000;--设置为1MB设置GROUP_CONCAT函数输出的最大长度大小,太小的话整体会被截掉RETURN(WITH......
  • 民国漫画杂志《时代漫画》第26期.PDF
    时代漫画26.PDF:https://url03.ctfile.com/f/1779803-1248635183-9832d2?p=9586(访问密码:9586)《时代漫画》的杂志在1934年诞生了,截止1937年6月战争来临被迫停刊共发行了39期。ps:资源来源网络!......
  • 民国漫画杂志《时代漫画》第28期.PDF
    时代漫画28.PDF:https://url03.ctfile.com/f/1779803-1248635321-5c67ad?p=9586(访问密码:9586)《时代漫画》的杂志在1934年诞生了,截止1937年6月战争来临被迫停刊共发行了39期。ps:资源来源网络!......
  • 扫描的PDF图纸怎么转换为CAD文件?
    在工程项目中,我们经常需要将扫描的PDF图纸转换为CAD文件,以便进行更精确的编辑和修改。那么扫描的图纸怎么转CAD呢?以下将详细介绍三种将扫描的PDF图纸转换为CAD文件的方法,供您参考。方法一:使用专业的PDF转CAD软件这是最常见也最便捷的方法之一。市面上有许多专业的PDF转CAD软件,如......
  • AutoCAD中图形打印成PDF后尺寸为什么比实际绘图尺寸小几毫米?
    最近有小伙伴提问,将CAD打印成PDF后,再将PDF文件重新导入到CAD软件中比对,发现图形比原CAD图形尺寸小了几毫米,如下: 这个主要是打印比例设置导致的,CAD默认打印比例默认勾选的是「布满图纸」,即布满到了实际打印范围,这个实际打印范围如果你没有事先对图纸进行修改到边界为0,那么就会......