在日常办公中,多份文件间的检查、纠错、复核工作不可避免,这类工作往往具有很强的重复性,占用了大量的工作时间。鸿翼InWise平台文档比对能够赋能企业极速完成海量文档、图片的高精度比对,以人工智能撬动企业生产力提升。
随着数字化进度的深入,企业的数据量也与日俱增。科技以人为本,为了避免重复工作,文档比对的技术始终在发展与进步的路上,力图为用户提供更高效、更精准的使用体验。
初阶——通过算法实现文档比对
在之前版本的鸿翼ECM中,就已经配备了针对文本类文件的版本比对功能,这项功能是通过diffjs实现的,是一个基于javascript的文本内容库。diffjs功能强大,不仅能够简洁地输出比对的结果,也能够输出规范化的数据结构,方便二次开发。
通过配置,diffjs能够实现以单词、行或句子等为单位的对比,输出单位中的差异点,方便使用者查看与纠错。在ECM中,可以通过勾选单个文件的两个版本,进行全文的按行比对,单屏即可同步查看两个版本的文档,快捷、精准地高亮文档版本中修改过的段落、字词,提升使用者的工作效率。
diffjs的文档对比查看界面
虽然能够基本满足文档内文字比对的需求,但是通过这种方式也存在着一定的局限性,它只能应用于文本类内容,结果界面也比较杂乱,整体用户体验有待提升。
进阶——基于AI的InWise文档比对
为了全面优化用户的使用体验,鸿翼基于自研智能平台InWise,利用NLP、OCR技术,以智能化手段解决文档比对中的核心痛点。使用InWise文档比对,能够在5分钟内进行900页内容的比对,并且能够与第三方平台OA、系统对接,提供应用服务,从而摆脱重复工作,加速业务流转,解放企业生产力。
只需5分钟,InWise就能完成900页内容的比对
鸿翼InWise文档比对是一款面向文字的、基于PDF文档web展现的高保真文本比对应用。文档比对可以控制是否忽略空格、换行、以及页眉页脚带来的差异,运用格式塔序列匹配算法、文本指纹算法、或其他优化的算法提供字符级精度的文本差异比对结果。
在InWise的文档比对中,差异细节使用左右排列一旧一新的双页版面,以所见即所得的方式展现删除、新增、或修改差异。它能够针对一切可提取文字信息的文档格式进行比对,必要时可调用OCR能力进行文字的提取。
同步滚屏,轻松掌握文档差异
后续,InWise文档比对还可以生成包含批注的Word/WPS可编辑文档,让用户可以在生成差异批注的文档上进一步人工修改编辑。
应用——全面赋能,引爆效率
鸿翼ECM的最新版本将会集成文档比对的功能,代替之前的版本比对,带给用户更好的使用体验,对比结果中会对新增内容标蓝,修改内容标黄,删除内容标红,一眼轻松分辨修改类型;右侧面板可以显示差异点,点击即可跳转,方便快速开展检查工作。
差异处标色,一目了然
InWise文档对比能力还能够作为应用,集成输出到第三方平台和系统之中,如OA、合同系统,针对企业内的实际场景,实现高精度、高速度、高效率的文档对比。
鸿翼已经成功赋能客户现有OA,输出合同对比能力,助力客户快速完成篇幅长、文字量大、时效性强的合同的比对工作。能够精确定位到单个标点、字母、数字,并且可以选择批量忽略换行、空格、页眉页脚,样本文件和对比文件能够同屏显示、同步滚动,方便用户进行内容的比对。
能够与模板进行高精度的合同比对
通过使用合同比对,能够提升企业的风险控制能力,降低业务出错率和企业风险,解放员工生产力,避免重复劳动,从而加速业务成交,促成快速签单。
根据企业的需要,InWise还能够提供档案比对、表格比对等多样的具体应用,支持doc, docx, wps, xls, xlsx, csv, ppt, pptx, pdf, jpg, png, tiff, txt, html等格式的文档文字内容的比对,提供对外开放的标准API接口和技术文档,帮助企业开发人员快速使用API或SDK赋能业务产品。
此外,InWise文档比对还能够结合OCR与文档抽取的能力,对图片、PDF等文件内容进行比对和信息抽取,从而达到数据资产留存和管理的目的。
通过OCR提取图像中的文字后再进行比对
作为鸿翼“一核三平台”中的智能能力枢纽,鸿翼InWise智能平台不仅能够为鸿翼各类业务产品提供多样的智能手段,更能够为第三方系统、平台输出智能应用,助力企业系统的智能化转型战略落地,以人工智能撬动办公效率的杠杆,实现降本增效的目的。