首页 > 编程语言 >python拆分PDF文件

python拆分PDF文件

时间:2024-08-08 10:29:50浏览次数:15  
标签:文件 end output python 拆分 pdf PDF page

先占个空,后面在慢慢更新

下面这个代码实现讲一个PDF文件拆分成多个文件

import PyPDF2
 
def split_pdf(input_pdf_path, output_prefix, start_page, end_page):
    """
    分割PDF文件为多个小的PDF文件,每个文件包含原始文档的一部分页面。
    :param input_pdf_path: 输入PDF文件的路径。
    :param output_prefix: 输出PDF文件的前缀。
    :param start_page: 开始分割的页面号(从1开始)。
    :param end_page: 结束分割的页面号(从1开始)。
    """
    with open(input_pdf_path, 'rb') as file:
        reader = PyPDF2.PdfReader(file)
        
        # 确保页数有效
        if start_page > end_page or end_page > len(reader.pages):
            print(f"页数无效,分割失败。总页数为:{reader.numPages}")
            return
        
        for page_number in range(start_page, end_page + 1):
            writer = PyPDF2.PdfWriter()
            writer.add_page(reader.pages[page_number-1])
            
            # 创建输出文件名
            output_filename = f"{output_prefix}-page_{page_number}.pdf"
            
            with open(output_filename, 'wb') as output_file:
                writer.write(output_file)
                print(f"已分割页面 {page_number} 到文件 {output_filename}")
 
# 使用示例
split_pdf('/Users/gaochengcheng/Desktop/test/phythic-u3.pdf', '/Users/gaochengcheng/Desktop/test/u3', 1, 37)  # 分割前三页

 

标签:文件,end,output,python,拆分,pdf,PDF,page
From: https://www.cnblogs.com/wangbin2188/p/18348440

相关文章

  • Python动态执行代码
    在Python中,动态执行代码是一个强大的特性,它允许程序在运行时编译和执行字符串或存储在文件、数据库等中的代码。这种能力使得Python在需要高度灵活性和动态性的应用中特别有用,比如科学计算、数据分析、Web开发以及自动化脚本等。下面,我将详细介绍Python中动态执行代码的几种......
  • 在Python中,模块(Module)和包(Package)
    在Python中,模块(Module)和包(Package)是组织代码、提高代码复用性、促进代码维护的两种重要机制。它们各自扮演着不同的角色,但又紧密相连,共同构成了Python程序架构的基础。以下将详细阐述Python中模块和包的概念及其区别。一、模块(Module)的概念在Python中,模块是一个包含了Pyth......
  • 工地安全帽智能识别系统 Python
    工地安全帽智能识别系统通过AI深度学习技术,工地安全帽智能识别系统实现对工地人员的安全帽反光衣穿戴进行自动实时识别和检测,当工地安全帽智能识别系统发现现场人员违规未按要求戴安全帽反光衣及不安全行为时,不需人为干预,工地安全帽智能识别系统自动抓拍触发告警,提醒安全管理人......
  • 下载量10w+!LLM新书《大型语言模型:语言理解和生成》pdf免费分享
    下载量10w+!LLM新书《大型语言模型:语言理解和生成》pdf免费分享近年来,人工智能在新语言能力方面取得了显著进展,深度学习技术的快速发展推动了语言AI系统在文本编写和理解方面的表现。这一趋势催生了许多新功能、产品和整个行业的兴起。书旨在为Python开发者提供实用......
  • 20.python变量
    python之局部变量和全局变量一、python中的变量(1)局部变量定义:在函数内定义的变量就局部变量(2)全局变量定义:在函数内外都可以引用定义的变量就全局变量(3)备注:当局部变量和全局变量在一起时,局部变量要比全局变量优先级级高案例:a=200#全局变量defhs():a=100#局部变量......
  • 深入Scikit-learn:掌握Python最强大的机器学习库
    Scikit-learn(通常缩写为sklearn)是一个强大的Python库,专门用于机器学习和数据挖掘。该库提供了丰富的功能,包括分类、回归、聚类、降维、模型选择和预处理等。本文将通过一个详细的示例来展示如何使用Scikit-learn进行基本的机器学习任务。1.安装Scikit-learn在开始使用......
  • 计算机毕业设计项目推荐,院系资料分类管理平台 84184(开题答辩+程序定制+全套文案 )上万
    目 录摘要1绪论1.1研究背景1.2研究意义1.3论文结构与章节安排2 院系资料分类管理平台系统分析2.1可行性分析2.2系统流程分析2.2.1数据增加流程2.2.2数据修改流程2.2.3数据删除流程2.3系统功能分析2.3.1功能性分析2.3.2非功能性分析......
  • 计算机毕业设计项目推荐,红色旅游网站设计与开发 99214(开题答辩+程序定制+全套文案 )上
    摘 要21世纪时信息化的时代,几乎任何一个行业都离不开计算机,将计算机运用于旅游服务管理也是十分常见的。过去使用手工的管理方式对旅游服务进行管理,造成了管理繁琐、难以维护等问题,如今使用计算机对旅游服务的各项基本信息进行管理,比起手工管理来说既方便又简单,而且具有易......
  • 《最新出炉》系列小成篇-Python+Playwright自动化测试-66 - 等待元素至指定状态(出现
    1.简介在我们日常工作中进行UI自动化测试时,保证测试的稳定性至关重要。其中一个关键方面是正确地定位和操作网页中的元素。在网页中,元素可能处于不同的状态,有些可能在页面加载完成之前不在DOM中,需要某些操作后才会出现,而其他元素可能一直存在于DOM中,但最初处于隐藏状态,需要通过操......
  • 为什么 Python NewType 与 isinstance 和 type 不兼容?
    这似乎不起作用:fromtypingimportNewTypeMyStr=NewType("MyStr",str)x=MyStr("HelloWorld")isinstance(x,MyStr)我什至没有得到False,但是TypeError:isinstance()arg2mustbeatypeortupleoftypes因为MyStr是一个函数......