首页 > 编程语言 >python 获取word页数

python 获取word页数

时间:2023-10-11 17:02:06浏览次数:194  
标签:docx word temp python 页数 path document

没想到获取个word页数这么简单的需求,实现起来还挺难。

1.根据网上说法:word文档中不保存总页数,只是在渲染时才根据文字和表格等去摆放到一页上,摆放不下时才展现下一页。所以从docx中取不到总页数

2.因此,仅用docx库不行,还需要用win32com。而win32com实际是:pip install pypiwin32   并且一定记得要重启python(重启仍不行可以试试https://blog.csdn.net/weixin_43149311/article/details/120806116  ,我重启IDLE就行了)

要获取Word文档的页数,我们可以使用以下步骤:

首先,将Word文档保存为临时文件。
然后,使用win32com.client模块打开该临时文件。
接下来,获取打开的Word应用程序的ActiveDocument。
最后,通过BuiltInDocumentProperties属性获取文档的页数。

3 代码:

import docx
import os
import win32com.client as win32

def get_word_page_count(document_path):
    document = docx.Document(document_path)
    abs_path = os.path.abspath(document_path)

    # 保存文档为临时文件
    temp_path = os.path.join(os.path.dirname(abs_path), "~temp.docx")
    document.save(temp_path)

    # 打开临时文件并获取页数
    word = win32.gencache.EnsureDispatch("Word.Application")
    word.Visible = False
    doc = word.Documents.Open(temp_path)
    pages = doc.BuiltInDocumentProperties(14).Value
    doc.Close()
    word.Quit()

    # 删除临时文件
    os.remove(temp_path)

    return pages

document_path = "1.docx"
page_count = get_word_page_count(document_path)
print("Word文档的页数:", page_count)

 

 

参考:https://blog.51cto.com/u_16175516/6850938

https://blog.csdn.net/u011840075/article/details/124696371

https://blog.csdn.net/weixin_43149311/article/details/120806116

https://blog.51cto.com/mouday/5018378

标签:docx,word,temp,python,页数,path,document
From: https://www.cnblogs.com/pu369/p/17757633.html

相关文章

  • word如何标题编号不乱
    一问题每回标题编号都乱的一批,得手动调整,这次学习视频中,留意一下里面的操作,恍然大悟,还是三人行,有我师哇,关门造车,造个寂寞 二解决先写字,再选择样式,让系统自己生成标题 ......
  • Python selenium chrome版本查询和对应驱动下载
    elenium爬虫需要安装Chrome驱动chrome版本查询和对应驱动下载,超详细方法/步骤1查看谷歌的版本,第一步在地址栏输入图中网址第二步查看版本号2复制版本号,只需复制版本号最后一位小数点之前的数字。(例:版本号:111.0.5563.65,复制111.0.5563即可)将复制的版本号......
  • 终于实现python的词云啦~~~
    1、准备好一个txt文件(我是直接在python项目里面创建了一个txt文件)2、编写代码分词,并连接到Navicat的mysql数据库,将分词之后的数据导入进去:importjiebaimportnumpyasnpimportpymysqltxt=open("hlm.txt","r",encoding='utf-8').read()words=jieba.lcut(txt)#进行......
  • 【20230613】【Python基础教程】第一章 基础知识
    第一章基础知识I1.4数字与表达python3.x会进行一些浮点数的计算点击查看代码print(1/2)#浮点计算print(1//2)#整除实现结果只保留整数部分print(1%2)#取余保留余数print(2**3)#幂函数结果如下:点击查看代码0.50181.4.1长整型数python3.x......
  • python xmind生成
    importxmindclassAddXmind:def__init__(self,topic_name:str,path:str):self.topic_name=topic_name#主题名称self.path=path#绝对路径defadd(self,child:list):workbook=xmind.load(self.path)first_sh......
  • python32days
    异常元类—————————————————————————————————————————————异常就是错误发生的信号,我们需要对该信号做处理,如果不处理,往后的代码就不能执行了异常的分类 逻辑错误#是允许出现的,但是呢,编程的时候尽量避免逻辑错误的发生语法错......
  • Python-pip配置国内镜像源
    推荐的国内镜像站[个人推荐清华大学pypi镜像站(https://mirrors.tuna.tsinghua.edu.cn/help/pypi/),每五分钟同步一次,资源丰富,下载速度很快]:清华大学:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/豆瓣:http://pypi.douban.com/simple/......
  • 用Python爬虫实现个性化搜索优化
    在当今信息爆炸的时代,传统的SEO手段已经不再足够。为了更好地满足用户个性化需求,我们需要突破传统SEO的限制,采用更智能、更个性化的优化方法。本文将介绍如何利用Python爬虫实现个性化搜索优化,让您的网站在用户搜索中脱颖而出。通过个性化搜索优化,您将能够更好地了解用户需求、提供......
  • python报错cannot import name ‘compare_ssim‘ from ‘skimage.measure‘
    问题原因: scikit-image版本过高导致 解决办法: 重装,安装低版本 pipuninstallscikit-imagepipinstallscikit-image==0.15.0-U-ihttps://pypi.tuna.tsinghua.edu.cn/simple ......
  • WordPress网站被黑怎么办?【含解决方案】
    在我们的日常WordPress主题售后工作中,经常会有用户反馈网站出现问题,例如:阿里云提示后门木马文件;打开后跳转到其他地址;页面出现乱码;被添加了其他内容等,根据我们的经验,这种一般都是网站被黑导致的。 如何确认网站是否被黑根据以往经验,可以通过以下方式来判断:1、如果是阿里云提......