首页 > 编程语言 >python的应用 | 提取指定文件夹下所有PDF文件的页数

python的应用 | 提取指定文件夹下所有PDF文件的页数

时间:2024-03-27 10:04:20浏览次数:25  
标签:python 页数 path PDF folder pdf pages

需求背景:

由于要打印几十页pdf,跟打印店对接的时候,为了防止被坑,提前了解一下,所有文档一共有多少页,于是想到了用python来提取pdf文件的页数

完整代码:

import os
from PyPDF2 import PdfReader

def get_pdf_page_count(folder_path):
    # 初始化总页数变量
    total_pages = 0
    
    # 获取文件夹中所有PDF文件的路径
    pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]

    # 遍历每个PDF文件并获取页数
    for pdf_file in pdf_files:
        file_path = os.path.join(folder_path, pdf_file)
        with open(file_path, 'rb') as f:
            pdf_reader = PdfReader(f)
            page_count = len(pdf_reader.pages)
            total_pages += page_count  # 累加页数
            print(f"{pdf_file}: {page_count} 页")

    # 返回总页数
    return total_pages

# 指定文件夹路径
folder_path = "E:\\xxx\\可打印版本-PPT-黑白版"  # 替换为您的PDF文件夹路径

# 获取PDF文件的页数
total_pages_in_folder = get_pdf_page_count(folder_path)
print(f"文件夹中所有PDF文件的总页数为: {total_pages_in_folder} 页")

 

标签:python,页数,path,PDF,folder,pdf,pages
From: https://www.cnblogs.com/lxhui/p/18098232

相关文章

  • Python-VBA编程500例-020-02(入门级)
    第k个组合(ThekthCombination)的问题在实际应用中具有广泛的用途,它涉及从n个不同元素中选出k个元素的所有可能组合。这种组合的概念在许多领域都有重要的应用,常见的一些具体应用有:1、彩票与赌博:在某些彩票或赌博游戏中,参与者需要选择特定数量的号码或符号。这些号码或符号的......
  • [Python]细节与使用经验
    【版权声明】未经博主同意,谢绝转载!(请尊重原创,博主保留追究权)https://www.cnblogs.com/cnb-yuchen/p/18031983出自【进步*于辰的博客】纯文字阐述,内容比较干。并且,由于考虑到时间长了恐有所遗漏,便即兴记录,并没有对内容进行筛选、排序。因此,大家在阅读时可以直接Ctrl+F进行......
  • 肖sir__python之模块7.1
    ython之模块一、模块的介绍(1)python模块,是一个python文件,以一个.py文件,包含了python对象定义和pyhton语句(2)python对象定义和python语句(3)模块让你能够有逻辑地组织你的python代码段。(4)把相关的代码分配到一个模块里能让你的代码更好用,更易懂(5)模块能定义函数,类和变量,模块里也能包含可......
  • 深入在线文档系统的 MarkDown/Word/PDF 导出能力设计
    深入在线文档系统的MarkDown/Word/PDF导出能力设计当我们实现在线文档的系统时,通常需要考虑到文档的导出能力,特别是对于私有化部署的复杂ToB产品来说,文档的私有化版本交付能力就显得非常重要,此外成熟的在线文档系统还有很多复杂的场景,都需要我们提供文档导出的能力。那么本文就......
  • Excel表格怎么免费转换pdf?方法汇总分享
    Excel文件是一种非常常见的电子表格文件格式,可以转换成多种样式,那么应该怎么转换成表格呢?下面一起来看看吧!MicrosoftOffice套件(Word、Excel等)如果您使用的是MicrosoftOfficeExcel,只需打开Excel表格,然后点击左上角的“文件”菜单,选择“另存为”(或“SaveAs”),在弹出的保存......
  • python 常用包
    python对于从git下载的内容,进入包内使用以下命令: pythonsetup.pybuildinstall 对于whl包,可省去后面的whl直接安装,假如有whl包是test123.whlpipinstalltest123 pip: 是Python包管理工具,python的其它包安装一般都是通过pip操作。python3.4+自带有此包。下载......
  • 市场数据和金融数据API的获取步骤,支持Python、Java、Go等接入方式,轻松实现量化数据交
    今天我想分享一个非常实用的技术内容,即如何通过接口API来实现订阅并接入实时行情数据源的报价信息。这个技术可以帮助你获取最新的市场数据,为你的应用程序或交易策略提供及时的信息支持。接入实时行情数据源可以让你了解市场动态并快速作出决策,非常有助于优化你的交易策略和投资决......
  • Python中Keras微调Google Gemma:定制化指令增强大型语言模型LLM
    全文链接:https://tecdat.cn/?p=35476原文出处:拓端数据部落公众号像谷歌、Meta和Twitter这样的大公司正大力推动其大型语言模型(LLM)的开源。最近,谷歌DeepMind团队推出了Gemma——一个由与创建谷歌Gemini模型相同的研究和技术构建的轻量级、开源LLM系列。本文,我们将帮助客户了解Ge......
  • 【python】服务端和客户端 RESTful 接口上传 E
    哈喽,大家好,我是木头左,物联网搬砖工一名,致力于为大家淘出更多好用的AI工具!服务端代码1.安装Flask和Flask-RESTful需要安装Flask和Flask-RESTful这两个库。Flask是一个轻量级的Web框架,而Flask-RESTful则是一个为Flask添加了RESTfulAPI支持的扩展。pipinstall......
  • 使用python读取Excel文件
    在VBA里使用SAPGUIScripts执行批量操作很方便,如果不熟悉VBA,写起VBA代码感觉挺不方便的。下面是Python代码用来读取Excel文件里的内容,代码挺简单的。importopenpyxl#指定Excel文件路径excel_file='D:\data\11.xlsx'#打开Excel文件workbook=openpyxl.load_workbo......