首页 > 编程语言 >python批量调整docx段落格式

python批量调整docx段落格式

时间:2023-06-23 19:45:20浏览次数:43  
标签:段落 docx indent para Cm format python paragraph

平时使用WechatDownload保存了很多技术文章,格式比较乱。

比如很多空白行、英文乱码、页面左右缩进太多等问题,今天一并解决一下

安装python-docx

from docx import Document
from docx.shared import Cm
import os

rootdir=r'E:\vxWEB\GIS'
for files in os.listdir(rootdir):
    filename=os.path.join(rootdir,files)
    print(filename)

    doc=Document(filename)
    for para in doc.paragraphs:
        para.paragraph_format.left_indent=Cm(0)#前后缩进
        para.paragraph_format.right_indent=Cm(0)
        # para.paragraph_format.first_line_indent = Cm(1)#首行缩进
        para.paragraph_format.line_spacing = 1.0#行间距
        if len(para.text)<= 1 and len(para.runs) < 1:#删除空行
            p = para._element
            p.getparent().remove(p)
            p._p = p._element = None
        for run in para.runs:#设置英文字体
            run.font.name = 'Times New Roman'
    doc.save(filename)
print('ok')

  空行的删除需要注意,仅判断没有文字会导致图片被删除,这里通过len(para.runs) < 1判断没有图片

标签:段落,docx,indent,para,Cm,format,python,paragraph
From: https://www.cnblogs.com/yifeimiao/p/17500058.html

相关文章

  • 使用python简单的爬取图片
    importrefrombs4importBeautifulSoupimportrequestsheaders={'User-agent':'Mozilla/5.0(Linux:Android6.0;Nexus5Build/MRA58M)''ApplewebKit/537.36(KHTML,likeGecko)''Chrome/104.0.5112.81'}url=''#......
  • python+音频数字信号处理
    一、在网上下载了一个wav文件,周杰伦的《告白气球》网址:https://www.xmwav.com/ 二、一些参数说明针对一个音频信号:2.1、通道数是在采集声音时用几个通道去录制声音,单声道和双声道的音频文件较为常见。例如在声源的不同位置放置通道去录制,则可以获得多通道的音频数据。以双......
  • 用python写一个保存文本到文件的函数
    用python写一个保存文本到文件的函数━━━━━━━━━━━━━━━━━━━━━━━━━可以通过Python的文件操作来实现保存文本到文件的功能。下面是一个保存文本到文件的函数的示例:defsave_text_to_file(text,file_path):try:withopen(file_path,'w')a......
  • Python播放GIF图片(ChatGPT代码参考)
    在网上找了好几个方法,最后还是出现各种问题,解决不了播放GIF的功能。最后,通过ChatGPT给出了简单明了的方案(使用第三方库imageio和matplotlib.animation来实现),调试直接通过。但有小瑕疵,就是显示gif时隐藏掉坐标轴的功能无效,于是再做了一下优化。 [最终代码]显示GIF动画:imp......
  • 基于Python+QT5+Dialog开发的舆情可视化分析系统
    基于Python+QT5开发的舆情可视化分析系统项目介绍......
  • 花朵识别系统Python+TensorFlow+Django+卷积神经网络算法实现
    一、背景花朵识别系统,基于Python实现,深度学习卷积神经网络,通过TensorFlow搭建卷积神经网络算法模型,并对数据集进行训练最后得到训练好的模型文件,并基于Django搭建可视化操作平台。在当今信息化社会,图像识别技术在各种领域都展现出了重要的应用价值,包括医学影像分析、自动驾驶、......
  • 文本识别分类系统python,基于深度学习的CNN卷积神经网络算法
    一、介绍文本分类系统,使用Python作为主要开发语言,通过TensorFlow搭建CNN卷积神经网络对十余种不同种类的文本数据集进行训练,最后得到一个h5格式的本地模型文件,然后采用Django开发网页界面,实现用户在界面中输入一段文字,识别其所属的文本种类。在我们的日常生活和工作中,文本数据无......
  • 解放计算力:使用并行处理提升python for循环速度
    Python是一门功能强大的编程语言,但在处理大规模数据或复杂计算任务时,性能可能成为一个瓶颈。幸运的是,Python提供了多种方法来提升性能,其中之一是利用并行处理来加速循环操作。本文将介绍如何使用并行处理技术来优化for循环,从而提高Python程序的执行速度。我们将讨论并行处......
  • Python基于Socket编写TcpServer通信基本框架
    如下主要是实现单客户端连接通信,如下为Socket模块的常用属性和方法介绍。如要实现多客户端连接,请使用threading模块的多线程技术实现。属性:•socket.AF_INET:IPv4地址族。•socket.AF_INET6:IPv6地址族。•socket.SOCK_STREAM:TCP协议类型。•socket.SOCK_DGRAM:UDP协议类......
  • gRPC学习记录--python
    gRPC学习记录基于:gRPC官方文档中文版v1.0目录gRPC学习记录gRPC是什么?应用在准备:安装安装Git安装gRPCPython使用protocolbuffersProtocolbuffers版本HelloWorfgRPC!定义服务生成gRPC代码写一个服务器服务实现服务端实现写一个客户端连接服务调用RPC试一下!gRPC......