python 获取word页数

时间：2023-10-11 17:02:06浏览次数：201

标签：docx word temp python 页数 path document

没想到获取个word页数这么简单的需求，实现起来还挺难。

1.根据网上说法：word文档中不保存总页数，只是在渲染时才根据文字和表格等去摆放到一页上，摆放不下时才展现下一页。所以从docx中取不到总页数

2.因此，仅用docx库不行，还需要用win32com。而win32com实际是：pip install pypiwin32 并且一定记得要重启python（重启仍不行可以试试https://blog.csdn.net/weixin_43149311/article/details/120806116 ，我重启IDLE就行了）

要获取Word文档的页数，我们可以使用以下步骤：

首先，将Word文档保存为临时文件。
然后，使用win32com.client模块打开该临时文件。
接下来，获取打开的Word应用程序的ActiveDocument。
最后，通过BuiltInDocumentProperties属性获取文档的页数。

3 代码：

import docx
import os
import win32com.client as win32

def get_word_page_count(document_path):
    document = docx.Document(document_path)
    abs_path = os.path.abspath(document_path)

    # 保存文档为临时文件
    temp_path = os.path.join(os.path.dirname(abs_path), "~temp.docx")
    document.save(temp_path)

    # 打开临时文件并获取页数
    word = win32.gencache.EnsureDispatch("Word.Application")
    word.Visible = False
    doc = word.Documents.Open(temp_path)
    pages = doc.BuiltInDocumentProperties(14).Value
    doc.Close()
    word.Quit()

    # 删除临时文件
    os.remove(temp_path)

    return pages

document_path = "1.docx"
page_count = get_word_page_count(document_path)
print("Word文档的页数：", page_count)

参考：https://blog.51cto.com/u_16175516/6850938

https://blog.csdn.net/u011840075/article/details/124696371

https://blog.csdn.net/weixin_43149311/article/details/120806116

https://blog.51cto.com/mouday/5018378

标签：docx,word,temp,python,页数,path,document
From： https://www.cnblogs.com/pu369/p/17757633.html

word如何标题编号不乱
一问题每回标题编号都乱的一批，得手动调整，这次学习视频中，留意一下里面的操作，恍然大悟，还是三人行，有我师哇，关门造车，造个寂寞二解决先写字，再选择样式，让系统自己生成标题 ......
Python selenium chrome版本查询和对应驱动下载
elenium爬虫需要安装Chrome驱动chrome版本查询和对应驱动下载，超详细方法/步骤1查看谷歌的版本，第一步在地址栏输入图中网址第二步查看版本号2复制版本号，只需复制版本号最后一位小数点之前的数字。（例：版本号：111.0.5563.65，复制111.0.5563即可）将复制的版本号......
终于实现python的词云啦~~~
1、准备好一个txt文件（我是直接在python项目里面创建了一个txt文件）2、编写代码分词，并连接到Navicat的mysql数据库，将分词之后的数据导入进去：importjiebaimportnumpyasnpimportpymysqltxt=open("hlm.txt","r",encoding='utf-8').read()words=jieba.lcut(txt)#进行......
【20230613】【Python基础教程】第一章基础知识
第一章基础知识I1.4数字与表达python3.x会进行一些浮点数的计算点击查看代码print(1/2)#浮点计算print(1//2)#整除实现结果只保留整数部分print(1%2)#取余保留余数print(2**3)#幂函数结果如下：点击查看代码0.50181.4.1长整型数python3.x......
python xmind生成
importxmindclassAddXmind:def__init__(self,topic_name:str,path:str):self.topic_name=topic_name#主题名称self.path=path#绝对路径defadd(self,child:list):workbook=xmind.load(self.path)first_sh......
python32days
异常元类—————————————————————————————————————————————异常就是错误发生的信号，我们需要对该信号做处理，如果不处理，往后的代码就不能执行了异常的分类逻辑错误#是允许出现的，但是呢，编程的时候尽量避免逻辑错误的发生语法错......
Python-pip配置国内镜像源
推荐的国内镜像站[个人推荐清华大学pypi镜像站(https://mirrors.tuna.tsinghua.edu.cn/help/pypi/)，每五分钟同步一次，资源丰富，下载速度很快]:清华大学：https://pypi.tuna.tsinghua.edu.cn/simple阿里云：http://mirrors.aliyun.com/pypi/simple/豆瓣：http://pypi.douban.com/simple/......
用Python爬虫实现个性化搜索优化
在当今信息爆炸的时代，传统的SEO手段已经不再足够。为了更好地满足用户个性化需求，我们需要突破传统SEO的限制，采用更智能、更个性化的优化方法。本文将介绍如何利用Python爬虫实现个性化搜索优化，让您的网站在用户搜索中脱颖而出。通过个性化搜索优化，您将能够更好地了解用户需求、提供......
python报错cannot import name ‘compare_ssim‘ from ‘skimage.measure‘
问题原因： scikit-image版本过高导致解决办法：重装，安装低版本 pipuninstallscikit-imagepipinstallscikit-image==0.15.0-U-ihttps://pypi.tuna.tsinghua.edu.cn/simple ......
WordPress网站被黑怎么办？【含解决方案】
在我们的日常WordPress主题售后工作中，经常会有用户反馈网站出现问题，例如：阿里云提示后门木马文件；打开后跳转到其他地址；页面出现乱码；被添加了其他内容等，根据我们的经验，这种一般都是网站被黑导致的。如何确认网站是否被黑根据以往经验，可以通过以下方式来判断：1、如果是阿里云提......

python 获取word页数

相关文章

赞助商

阅读排行