首页 > 其他分享 >使用Umi-OCR进行本地OCR文字识别

使用Umi-OCR进行本地OCR文字识别

时间:2024-02-29 22:47:55浏览次数:25  
标签:识别 引擎 文档 本地 OCR Umi

在GitHub上看到了一个好用的OCR工具Umi-OCR,不仅支持批量导入图片、PDF文档识别而且开源免费,还能够在本地离线运行。可以说是为某些不适宜导入在线OCR应用的文档以及大体量本地OCR需求量身定做的软件。(顿时感觉自己的白描白买了)

软件在线提供两种版本下载,区别在于一种内置的识别引擎是Paddle引擎,一种内置的是Rapid引擎,前者性能更强,后者对老旧处理器兼容性更好。推荐下载前者,效果非常出色

性能方面,在仅支持CPU加速的V2.1.0版本下,调用Paddle作为识别引擎,勾选强制整页OCR选项,十年前的i5-4210M处理器(2C4T)大约3-4秒完成1页识别,四年前的R7-4700U处理器(8C8T)大约1秒完成1页识别。只要电脑的硬件能够流畅刷B站,用它应付一般学习研究用PDF的转录需求完全没有问题。

软件的使用方法不复杂,解压缩后双击EXE运行,选择处理任务后将预备处理的图片或文档拖入左侧界面,然后在右侧界面里根据自己的需求选择对应选项。

在默认选项的基础上,推荐作两个变更:

  1. “OCR文本后处理”选择“单栏-按自然段换行”模式,这样对于单页布局的书籍、文件的识别效果更佳;
  2. “文档处理”一览选择“整页强制OCR”,这样可以确保识别结果里不会出现莫名其妙的空格或错误符号

标签:识别,引擎,文档,本地,OCR,Umi
From: https://www.cnblogs.com/misaka10212/p/18045737

相关文章

  • UUID(Universally Unique Identifier,通用唯一识别码)起源 发展阶段 作用 功能 价值 组
    UUID(UniversallyUniqueIdentifier,通用唯一识别码)UUID(通用唯一识别码)的起源可以追溯到计算机科学领域。它最初由开放软件基金会(OpenSoftwareFoundation,OSF)制定,并在分布式计算环境中广泛使用。UUID的目的是确保在分布式系统中生成唯一的标识符,以避免不同节点或应用程序生成相......
  • APicloud 使用dwzBaiduFaceLive模块实现人脸识别
    1、先获取APP的签名MD5, 2、进入ApiCloud官网,找到自已APP证书,点击android证书右上角的自动创建证书,然后弹出窗口点下载证书 3、下载完的证书4、keytool–list–v–keystore<签名文件路径>,获取MD55、在百度云人脸采集SDK下创建应用,应用名有用;BaiAnDrugApp4License......
  • 文字识别
    下载tesseract-ocr双击安装同意为所有人安装下一步指定安装目录开始安装完成......
  • 视频汇聚平台智能边缘分析一体机视频监控汇聚平台算法识别检测区域入侵检测算法
    随着社会的不断发展,安全问题日益受到人们的关注。在各种公共场所,保障人员和财产安全成为当务之急。为了更好地应对安全挑战,视频监控技术发挥着越来越重要的作用。而今,视频汇聚平台智能边缘分析一体机区域入侵检测技术的问世,为安全防范带来了全新的可能性。视频汇聚平......
  • SpringBoot/Java中OCR实现,集成Tess4J实现图片文字识别
    场景TesseractTesseract是一个开源的光学字符识别(OCR)引擎,它可以将图像中的文字转换为计算机可读的文本。支持多种语言和书面语言,并且可以在命令行中执行。它是一个流行的开源OCR工具,可以在许多不同的操作系统上运行。https://github.com/tesseract-ocr/tesseractTess4JTess4......
  • umijs 项目配置问题汇总
    umi配置问题汇总umi或@umijs/max集成tailwindcss正常umi内置了tailwindcss插件,详情可参考官方文档TailwindCSS配置生成器但是由于内置的tailwindcss插件过老,umi官方已不推荐使用内置,建议使用tailwindcss官方的配置。详情可见issue同时,umi官方也不推荐使用p......
  • 图像识别算法--VGG16
    前言:人类科技就是不断烧开水(发电)、丢石头(航天等)。深度学习就是一个不断解方程的过程(参数量格外大的方程)本文内容:1、介绍VGG16基本原理2、VGG16pytorch复现图像识别算法--VGG16目录图像识别算法--VGG161、参考文献2、VGG16理论2.1VGG16优点2.2VGG16网络结构图2.2.1复现代......
  • m基于深度学习网络的活体人脸和视频人脸识别系统matlab仿真,带GUI界面
    1.算法仿真效果matlab2022a仿真结果如下:  2.算法涉及理论知识概要        随着人工智能技术的快速发展,人脸识别技术已经广泛应用于身份验证、安全监控、智能支付等领域。活体人脸和视频人脸识别系统是其中的重要分支,旨在通过深度学习网络对人脸进行高效、准确......
  • stm32单片机扫码设计方案,ESP32蓝牙无线扫码器设计项目硬件套件的实现,一维码二维码识别
    stm32/ESP32(或ESP32C3,ESP32S3)/ESP8266单片机扫码识别设计方案二维码一维码扫描模块开发项目资料程序,轻松实现蓝牙扫码器WiFi无线串口,二维码识别显示器串口输出条码扫描枪扫码枪开发项目套件设计,很适合DIY无需焊接,到手即可开发调试。ESP32,ESP8266等基于arduino库实现,stm32基于......
  • LSTM使用MNIST手写数字识别实战的代码和心得
    RNN的架构除了RNN类中的模型不同,其他的构架与CNN类似,如果还没有阅读过CNN文章的可以点击下方链接进入:CNN使用MNIST手写数字识别实战的代码和心得LSTM(LongShort-TermMemory长短时记忆网络)虽然在MNIST手写数字识别方面不擅长,但是也可以进行使用,效果比CNN略显逊色对LSTM使用......