首页 > 编程语言 >python-docx删除文档部分内容

python-docx删除文档部分内容

时间:2023-12-20 14:24:06浏览次数:26  
标签:docx parent python 文档 child import isinstance block

 1 from docx.document import Document as _Document
 2 from docx.oxml.text.paragraph import CT_P
 3 from docx.oxml.table import CT_Tbl
 4 from docx.table import _Cell, Table
 5 from docx.text.paragraph import Paragraph
 6 
 7 
 8 def word_cut(document):
 9     def iter_block_items(parent):
10         if isinstance(parent, _Document):
11             parent_elm = parent.element.body
12         elif isinstance(parent, _Cell):
13             parent_elm = parent._tc
14         else:
15             raise ValueError("something's not right")
16         for child in parent_elm.iterchildren():
17             if isinstance(child, CT_P):
18                 yield Paragraph(child, parent)
19             elif isinstance(child, CT_Tbl):
20                 yield Table(child, parent)
21     count = 0
22     flag = True
23     for block in iter_block_items(document):
24         count += 1
25         if isinstance(block, Paragraph):
26             if flag:
27                 if count == 84:
28                     flag = False
29             else:
30                 p = block._element
31                 p.getparent().remove(p)
32 
33         elif isinstance(block, Table):
34             if not flag:
35                 p = block._element
36                 # 删除表格
37                 p.getparent().remove(p)
38 
39     return document

 

标签:docx,parent,python,文档,child,import,isinstance,block
From: https://www.cnblogs.com/Swlymbcty/p/17916423.html

相关文章

  • python 数据结构与算法知识图
    1.算法思想:递归、分治(归并排序、二分查找、快速排序)、贪心(贪心策略排序+当前最优)、动态规划(最优子结构+递推式)、回溯(解空间:排列树+子集树、深度搜索+剪枝)、分支限界(解空间:排列树+子集树、广度搜索+剪枝))2.排序算法:(low:冒泡、插入、选择;mid:快排、归并、堆排(完全二叉树),其他:桶排序、基......
  • schedule 定时运行 Python 函数
    安装pipinstallschedule例子每x分钟运行一次importscheduleimporttimedefjob():print("I'mworking...")#每3秒/分钟/小时/天/周运行一次任务、#从现在开始每3秒/分钟/小时/天/周运行一次作业schedule.every(3).seconds.do(job)schedule.every(3).mi......
  • Python实现软件设计模式6:单例模式 Singleton Pattern
    动机针对某个类,为了保证系统中只创建一个示例,并且易于被访问(例如操作系统的任务管理器,软件的登陆注册界面)自行创建这个实例,无法从外部创建这个实例,向系统提供这个实例饿汉式单例Java版本在类加载的时候,就创建对象,如果后续得不到使用,可能会造成内存资源浪费懒汉式单......
  • 《Python网络爬虫:从入门到实战》
    ......
  • Python实现软件设计模式5:原型模式 Prototype Pattern
    动机对象的克隆问题,想要复制出本对象的一个副本,属性方法一模一样从需求上来说,先快速克隆对象,后续根据需求再进行对象局部属性的修改区分为深克隆和浅克隆两个版本,默认为浅克隆角色Prototype抽象原型类ConcretePrototype具体原型类Client客户类浅克隆与深克隆......
  • 如何将 Python 项目打包成 exe,另带卸载功能!
    前言虽然我是做web的,但是对Python的众多开源项目一直都很关注。像之前的stablediffusion的AI绘画,和so-vits-svc音色替换等源码的部署文档都很完善了。尽管如此,对于刚入门的和本地环境搭建各种踩坑的同学,又急于一试就显得不太友好了。针对这一现象,网上早有了各种大佬做......
  • 手把手教你用python做一个年会抽奖系统
    引言马上就要举行年会抽奖了,我们都不知道是否有人能够中奖。我觉得无聊的时候可以尝试自己写一个抽奖系统,主要是为了娱乐。现在人工智能这么方便,写一个简单的代码不是一件困难的事情。今天我想和大家一起构建一个简易的抽奖系统,这样也能够巩固一下我自己对Python语法和框架的理解......
  • python xattr库
    因:ceph有一条设置文件/目录配额的命令ceph.quota.max_bytes,想在Python代码中调用它,最直接的方法是使用popen/subprocess等库直接执行这条命令,但如果频繁调用担心会影响系统性能,查阅资料发现xattr库也可以实现且更加方便。开始吧首先需要安装xattr库pip3installxattr......
  • 12.19---python
    seek()方法语法如下:file.seek(offset[,whece])offset--开始的偏移量,也就是代表需要移动偏移的字节数,如果是负数表示从倒数第几位开始。whence:可选,默认值为0。给offset定义一个参数,表示要从那个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾......
  • 【Python微信机器人】第六篇:优化使用方式,可pip安装
    优化内容这篇不聊技术点,说一下优化后的Python机器人代码怎么使用,优化内容如下:将hook库独立成一个库,发布到pypi,可使用pip安装将微信相关的代码发布成另一个库,也可以pip安装git仓库统一,以后都在这个仓库更新,不再一篇文章一个仓库开始建群,根据群里反馈增加功能和修复bug使用......