首页 > 编程语言 >【Amadeus原创】python读取pdf

【Amadeus原创】python读取pdf

时间:2022-11-26 16:04:53浏览次数:38  
标签:python Amadeus pdfplumber print pdf page first

1. vscode 安装python插件

2. vscode 终端安装pdfminer.six , pdfplumber

​python -m pip install pdfminer.six​​​​python -m pip install pdfplumber​

3. 在代码目录,放一个pdf文件,命名为1.pdf

4. 新建python文件,代码:

import pdfplumber

# 加载pdf
path = "1.pdf"
with pdfplumber.open(path) as pdf:
print(pdf)
print(type(pdf))

# 读取pdf文档信息
print("pdf文档信息:", pdf.metadata)

# 输出总页数
print("pdf文档总页数:", len(pdf.pages))

# 1.读取第一页宽度、高度等信息
first_page = pdf.pages[0] # pdfplumber.Page对象第一页
# 查看页码
print('pdf页码:', first_page.page_number)
# 查看页宽
print('pdf页宽:', first_page.width)
# 查看页高
print('pdf页高:', first_page.height)

# 2.读取文本第一页
first_page = pdf.pages[0] # pdfplumber.Page对象第一页
text = first_page.extract_text()
print(text)

5. vscode run in terminal,试试。


标签:python,Amadeus,pdfplumber,print,pdf,page,first
From: https://blog.51cto.com/amadeus/5889028

相关文章

  • 【Amadeus原创】vmware ESXi快速创建新的虚拟机
    准备工作:新虚拟机Win10安装后,需要windowsupdate,更新补丁到最新,关机。(本文案例win10-Amadeus)在数据盘新建Win10-Users文件夹(可自定义)复制win10-Amadeus的vmx、vmdk文件到wi......
  • 【Amadeus原创】使用vscode+Markdow章
    1.打开台,点击vscode插件,下载安装,会自动跳到vscode安装插件哦2.插件安装好后,登录3.vscode新建md文件,记得文件名就的标题图例解释:不要乱写哦,否则后续上传后,标题你后台改,vsc......
  • 【Amadeus原创】使用vscode+evernote印象笔记+markdown写在线笔记
    1.vscode安装evermonkey插件2.vscode快捷键:Ctrl+Shift+P,输入ever按提示进行操作EverNew:创建新evernote笔记;愉快地玩耍点击下列图片标红位置,可以实时预览markdowntitl......
  • 力扣153(java&python)-寻找旋转排序数组中的最小值(中等)
    题目:已知一个长度为n的数组,预先按照升序排列,经由1到n次旋转后,得到输入数组。例如,原数组nums=[0,1,2,4,5,6,7]在变化后可能得到:若旋转4次,则可以得到[4,5,6,......
  • Chrome 103支持使用本地字体,纯前端导出PDF优化
    Chrome103支持使用本地字体,纯前端导出PDF优化 在前端导出PDF,解决中文乱码一直是一个头疼的问题。要解决这个问题,需要将ttf等字体文件内容注册到页面PDF生成器中。但......
  • python(牛客)试题解析3 - 困难
    导航一、找到已经最大承重的背包内如何放入最大价值的物品的最优解二、查找一个字符串中包含另外一个字符串(可打乱顺序)的次数三、计算正整数数组从头走到最后一个成员......
  • Python基础(三)
    Python基础(三)正则表达式import re#match 从开头位置匹配,失败返回NULLresult = re.match("^[a-z0-9]*@(sina|qq|126|136)\.com$","[email protected]")print("true","matc......
  • Python数据分析与科学计算之NumPy超细教程之第1部分 NumPy简介
    1.学习NumPy前置知识点1、Python基础语言2、重点Python内置数据结构:列表(list)、字符串(str)、元组(tuple)、集合(set)和字典(dict)。3、序列的索引和切片操作。4、列表推导式、集合推......
  • Python中创建类的六重境界
    1.引言大家首先需要记住一句话:类是模板,而实例则是根据类创建的对象。在面向对象编程语言中,类class最为常见。为此,本文重点来介绍在Python中创建类的六重境界。闲话少说,我......
  • python实现输出文件夹的目录树结构
    最近清理QQ文件夹的时候,发现群聊图片巨TM大,就想看看群友们都发了什么怪图片但是QQ群聊图片文件夹里面的文件夹是一个套一个,靠手工copy肯定是不太行的,就写了个简单......