首页 > 编程语言 >用C#实现在Word文档中搜索文本

用C#实现在Word文档中搜索文本

时间:2023-06-30 21:05:22浏览次数:39  
标签:wd Word MissingValue C# 文档 搜索 ref Find

在word应用程序中搜索和替换文本是举手之劳的事情,通过word的对象模型,我们也可以使用编程方式来实现。

   Word的对象模型有比较详细的帮助文档,放在 Office 安装程序目录,office 2003是在Program Files\Microsoft Office\OFFICE11\2052下,文档本身是为VBA提供的,在这个目录下还可以看到所有的office应用程序的VBA帮助。

   打开VBAWD10.CHM,看到word的对象模型,根据以往的使用经验,很容易在Document对象下找到Content属性,该属性会返回一个文档文字部分的Range对象,从这个对象中不难取到所有的文档内容,再用string的IndexOf()方法很容易达到目标。

object filename=""; //要打开的文档路径 
string strKey=""; //要搜索的文本 
object MissingValue=Type.Missing; 

Word.Application wp=new Word.ApplicationClass(); 
Word.Document wd=wp.Documents.Open(ref filename,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue); 

if (wd.Content.Text.IndexOf(strKey)>=0) 
{ 
MessageBox.Show("文档中包含指定的关键字!","搜索结果",MessageBoxButtons.OK); 
} 
else 
{ 
MessageBox.Show("文档中没有指定的关键字!","搜索结果",MessageBoxButtons.OK); 
}


   不过,这种做法是很勉强的,对小文档来说,不存在问题,对超长超大的文档来说,这样的实现方法已经暗埋bug了,而且是程序级的bug,因为正常的测试会很难发现问题,在使用中导致程序出现什么样的结果也很难量化描述。

   其实,在word中已经提供了可以用作搜索的对象Find,在对象模型上也比较容易找到,对应的说明是这样的:该对象代表查找操作的执行条件。Find 对象的属性和方法与“替换”对话框中的选项一致。从模型上看,Find对象是Selection的成员,从示例代码来看似乎也是Range的成员,查找Range的属性,果然如此。于是修改上面的代码:

wd.Content.Find.Text=strKey; 
if (wd.Content.Find.Execute(ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue)) 
{ 
MessageBox.Show("文档中包含指定的关键字!","搜索结果",MessageBoxButtons.OK); 
} 
else 
{ 
MessageBox.Show("文档中没有指定的关键字!","搜索结果",MessageBoxButtons.OK); 
}


   这样似乎也不是最好,因为我只要判断指定的文本是不是在文档中,而不需要知道它出现了几次,如果有多个要搜索的文本,难道每次都进行全文档搜索?假设我要搜索的文本包含在文档中,最好的情况是在文档开头就包含我要查找的文本,最坏的情况是在文档的最后包含要查找的文本,如果每次取一部分文档进行判断,符合条件就结束本次搜索,就可以避免每次搜索整个文档了。模型中的Paragraphs对象现在派上用场了,再修改一下代码:


int i=0,iCount=0; 
Word.Find wfnd; 

if (wd.Paragraphs!=null && wd.Paragraphs.Count>0) 
{ 
iCount=wd.Paragraphs.Count; 
for(i=1;i<=iCount;i++) 
{ 
wfnd=wd.Paragraphs[i].Range.Find; 
wfnd.ClearFormatting(); 
wfnd.Text=strKey; 
if (wfnd.Execute(ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue,ref MissingValue, 
ref MissingValue)) 
{ 
MessageBox.Show("文档中包含指定的关键字!","搜索结果",MessageBoxButtons.OK); 
break; 
} 
} 
}

作者:古道轻风

标签:wd,Word,MissingValue,C#,文档,搜索,ref,Find
From: https://blog.51cto.com/chunyangi/6593633

相关文章

  • React - 13 Hooks组件之useEffect
    1.useEffectimportReact,{useState,useEffect}from"react";import{Button}from'antd';import'./Demo.less';/*useEffect:在函数组件中,使用生命周期函数useEffect(callback):没设置依赖+第一次渲染完毕后,执行callback,等价于componentDidMount......
  • BACnet网关如何采集BACnet设备
    BL103BACnet网关是一款经济型楼宇自动化、暖通控制系统的物联网关,用于实现ModbusRTU、ModbusTCP、DL/T645、BACnetIP、BACnetMS/TP等多种协议转换为ModbusTCP、OPCUA、MQTT、BACnetIP、华为云IoT、亚马逊云IoT、阿里云IoT、ThingsBoard、金鸽云等协议的网关。BL103下行支......
  • socket网络编程(三)——select多路复用问题
    1、select诞生的原因在上文我们提到了多客户端的时候,多台客户端发送数据到服务端的话,只能有一台客户端可以正常发送和接受数据,另外一台完全没有反应,那这个问题怎么解决呢?很多人可能第一反应想到利用多线程技术,线程多的话用线程池来维护。的确,多线程确实可以实现这个效果,但是,可能很......
  • Environment Perception and Motion Strategy for Transformable Legged Wheel Robot
    论文发表于2018年。这篇论文介绍了三模式机器人在野外环境下的环境感知和模式切换策略。机器人拥有arcmode、roundmode、clawmode三种模式。图a表示由roundmode变换至arcmode,图b表示由arcmode变换为clawmode。 1.感知1.1 周围环境感知。分为环境建模和障碍物感......
  • ASCII 码表
    ASCII码表本质上就是二进制数据与字符的编码映射。......
  • Oracle CONNECT BY根据特定字符拆分字符串
    1、一行SELECTT.ID,REGEXP_SUBSTR(T.VALS,'[^,]+',1,LEVEL)ASVALFROM(SELECT'101'ID,'A,B'VALSFROMDUAL)TCONNECTBYLEVEL<=REGEXP_COUNT(T.VALS,'[^,]+');2、多行2-1、如果ID唯一不重复:SELECTT.ID,REGEXP_SUBSTR......
  • oracle regexp_replace 去空白符
    1、去空白符SQL:SELECTregexp_replace(STR,'^\s*','*')AS"去掉左边空白符",regexp_replace(STR,'\s*$','*')AS"去掉右边空白符",regexp_replace(STR,'(^\s*)|(\s*$)','*')AS"去掉......
  • C#并发锁
    在C#中,可以使用并发锁来确保多个线程在访问共享资源时的互斥性。C#提供了几种实现并发锁的方式,其中最常用的是 lock 语句和 Monitor 类。lock 语句:lock 语句是C#中用于实现互斥访问的最简单方式。它使用一个对象作为锁来保护临界区代码块,确保同一时间只能有一个线程......
  • 2023年北京大学强基计划数学试题Mathematica解答
    目录试题地址123571011141617试题地址全网首发!2023年北京大学强基计划笔试数学试题(全!)-ADU的小窝的文章-知乎https://zhuanlan.zhihu.com/p/6404156211emmm比如说三个点的实部,虚部分别是:有理数,无理数无理数,有理数有理数,无理数有理数+无理数+有理数可以是有理数......
  • 大数据面试题集锦-Hadoop面试题(三)-MapReduce
    你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题,关注一下"张飞的猪大数据分享"吧,公众号会不定时的分享相关的知识和资料。目录1、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?2、FileInputFormat切片机制3、......