首页 > 编程语言 >零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格

零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格

时间:2023-06-03 10:33:04浏览次数:51  
标签:文件 提取 表格 Excel excel PDF ChatGPT

电脑中有几百个PDF文件,文件内容格式一致,每个PDF文件第一页是一个表格。想把这几百个PDF文件里面的表格都提取出来,转为excel表,该怎么办?

零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格_Python

打开ChatGPT(一定要用GPT4,编程能力很强。相比之下,gpt3.5弱太多了),输入提示词如下:

d盘有一个文件夹:guanlianjiaoyi,里面有很多pdf文件;你的任务是写一个Python程序,批量提取PDF文件中表格信息到excel文件,具体步骤:

1、打开一个PDF文件;

2、用pdfplumber提取第一页的表格信息;

3、以原有的PDF文件名作为excel表格文件标题,保存刚才提取的表格信息到excel文件,放到电脑d盘文件夹excel中

然后在命令行提示符里面安装pdfplumber:pip install pdfplumber

零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格_excel表格_02

pdfplumber是一个Python库,用来读取和写入PDF文件。ChatGPT一会就生成了代码,复制到Visual Studio Code中,运行,很快就完成了。

零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格_文件名_03

打开其中的excel表检查看看,内容提取正确,完美!

零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格_文件名_04

标签:文件,提取,表格,Excel,excel,PDF,ChatGPT
From: https://blog.51cto.com/fancyar/6407548

相关文章

  • 在python中对Excel进行简单的操作
    #表格的操作 #创建表格 wb=Workbook() #打开第一个工作表 wb.active #保存 wb.save("路径+文件名或文件名") #关闭 wb.close() #读取Excel中所有的工作表 wb.get_sheet_names() #访问第一个工作表 wb.worksheets[0] wb.get_sheet_names()[0] #编辑第一个工作表......
  • 高级Excel功能教程_编程入门自学教程_菜鸟教程-免费教程分享
    教程简介Excel是办公室自动化中非常重要的一款软件,Excel函数则是Excel中的内置函数。Excel函数共包含11类,分别是数据库函数、日期与时间函数、工程函数、财务函数、信息函数、逻辑函数、查询和引用函数、数学和三角函数、统计函数、文本函数以及用户自定义函数。熟练且高效的使用......
  • 近8万条中国历史野史秘闻ACCESS\EXCEL数据库
    有很多朋友对中国文化历史相关的数据感兴趣,现有的中华上下五千年、世界五千年这类的数据记录数还太少太少,于是今天就采集了一个中华历史网站,共有效采集到近8万条记录。分类汇总情况:野史秘闻(12273)、历史人物(8840)、历史杂谈(7928)、文史百科(5635)、历史趣闻(5282)、杂说历史(4934)、三国......
  • 二十四史中国历史中国正史ACCESS\EXCEL数据库
    普通人对中国历史的兴趣一般都是电视剧里的野史秘闻,可以用《近8万条中国历史野史秘闻ACCESS数据库》,而对于需要谨严学习的,莫过于中国正史也就是所谓的二十四史,二十四史的数据其实找了有一段时间,网络上流行的一般都是一史一个txt文件,并不利于产品开发,整理起来也挺烦人的。而今天破......
  • 2万多条初中历史题库ACCESS\EXCEL数据库
    这段时间破解了中高学生知识题库,包含高中英语题库、小学英语题库、初中地理题库、初中历史题库、高中历史题库、初中生物题库,数据表结构都一样,今天发的这份是上万条的初中历史题库,截图包含所有字段,截图下方有显示共有记录数。参考项有:步入近代(1484)、国家的产生和社会的变革(12......
  • 操作MS Execl电子表格的常用JAR包
    在做报表开发时,免不了要导出数据。除了简单的循环列表数据导出外,还有基于模板的数据导出。比如生成运营周报或者月报之类的,甚是符合使用模板导出方式。今天总结一些常用的Execl导出JAR包。0x01:jxl支持Excel95-2000的所有版本;生成Excel2000标准格式;支持字体、数字、日期操作;能够修......
  • 《游戏运营:高手进阶之路》pdf电子书免费下载
    《游戏运营:高手进阶之路》是一本系统的、成体系的、注重运营效能、强化系统思维、提升专业认知的书籍。《游戏运营:高手进阶之路》几乎完整覆盖了一个游戏运营人员日常工作中的方方面面,并从工作中具体的业务场景出发,归纳整理出各种解决问题的方法论。《游戏运营:高手进阶之路》为广......
  • [SDOI2017]数字表格
    题意求如下表达式的值\[\prod_{i=1}^{n}\prod_{j=1}^{m}f_{gcd(i,j)}\pmod{10^9+7}\]其中,\(f_i\)为fibonacci数列的第\(i\)项,\(n,m\leqslant10^6\)Solution\[\prod_{i=1}^{n}\prod_{j=1}^{m}f_{gcd(i,j)}\]改变枚举顺序,优先枚举\(d=gcd(i,j)\),\[=\prod_{d=1}......
  • Qt读写Excel,使用第三方QXlsx
    推荐第三方的QXlsx(是对QtXlsxWriter的进一步发展,QtXlsxWriter不再更新)QtExcel/QXlsx:Excelfile(*.xlsx)reader/writerlibraryusingQt5or6.DescendantofQtXlsx.(github.com)使用方法 【参考】(9条消息)Qt读写Excel--QXlsx基本使用1_qtxlsx_mahuifa的博客-CSDN......
  • 使用 wkhtmltopdf python html转pdf
    使用wkhtmltopdfpythonhtml转pdf文章目录使用wkhtmltopdfpythonhtml转pdf前言一、环境二、安装与配置1.首先安装pdfkit0.612.pythonhtml转pdf3.url转pdf遇到的问题总结前言使用wkhtmltopdfpythonhtml转pdf。一、环境pdfkit0.61python3.7二、安装与配置1.首先安装pdfk......