首页 > 其他分享 >文本识别 OCR 解决方案

文本识别 OCR 解决方案

时间:2024-04-06 16:34:08浏览次数:21  
标签:识别 Tesseract 解决方案 支持 文本 开源 OCR

Capture2Text 便携式 OCR 工具

Capture2Text 能够使用键盘快捷键快速对屏幕的一部分进行 OCR。 默认情况下,生成的文本将保存到剪贴板。支持中文、英文、法文、德文、日文、韩文、俄文、西班牙文等 90 多种语言。 Capture2Text 是便携式工具,不需要安装。

5fe7ba63177f34c22b21813d4291d186.png

Tesseract.js 识别图片语言的 JS 库

Tesseract.js 是一个几乎能识别出图片中所有语言文本的 JS 库。

acd28c93c08a91eceac46765a92a629d.png

Tesseract OCR 图像识别类库

Tesseract 是一款由 HP 实验室开发,后续由 Google 维护的开源 OCR 引擎,特点是开源、免费、支持多语言、多平台。

 

chineseocr_lite 轻量级中文 OCR

chineseocr_lite 是一个轻量级中文 OCR 项目,提供将图片上的中文转成字符串的功能。支持竖排文字,识别支持 ncnn、mnn、tnn 推理 (dbnet (1.8M) + crnn (2.5M) + anglenet (378KB)),总模型仅 4.7M。

Textinator macOS OCR 工具

Textinator 是一款简单的 macOS 状态栏 / 菜单栏应用程序,用于对屏幕截图执行自动文本检测。

MathOCR 数学公式识别系统

MathOCR 是用 Java 语言编写的一个印刷体数学公式识别系统,可以识别图片中数学公式并转换为相应的 LaTeX 代码。

树洞 OCR 文字识别 跨平台的 OCR 小工具

树洞 OCR 文字识别是一款跨平台的 OCR 小工具。xxx-with-jre.xx 是完整版,带运行环境;如果精简版不能正常工作,请下载完整版使用; 文字识别使用了各云平台开发的识别接口,因此需要联网才能正常使用;

MMOCR 基于 PyTorch 的文本检测工具

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱,专注于文本检测,文本识别以及相应的下游任务,如关键信息提取。 该工具箱不仅支持文本检测和文本识别,还支持其下游任务,例如关键信息提取。

639a06de4d2b670fe27c4f12be2d1d41.png

PaddleOCR 基于飞桨的 OCR 工具库

PaddleOCR 是基于飞桨的 OCR 工具库,包含总模型仅 8.6M 的超轻量级中文 OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

Umi-OCR 离线文字识别工具

Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台。Umi-OCR可批量导入处理图片,结果保存到本地 txt /md/jsonl 多种格式文件。同时也可以即时截屏识别。

 

d21538ce0665669e268ea3f070630966.png

C-OCR 携程 OCR 项目

C-OCR 是携程自研的 OCR 项目,主要包括身份证、护照、火车票、签证等旅游相关证件、材料的识别。 项目包含 4 个部分,拒识、检测、识别、后处理。

MindOCR OCR 开发及应用工具箱

MindOCR 是一个基于 MindSpore 框架的 OCR 开发及应用的开源工具箱,可以帮助用户训练、应用业界最有优的文本检测、文本识别模型,例如 DBNet/DBNet++ 和 CRNN/SVTR,以实现图像文本理解的需求。

dpScreenOCR 轻量级 OCR 工具

dpScreenOCR 是一个自由的开源程序,用于识别屏幕上的文本。由 Tesseract 提供支持,它支持 100 多种语言,并且可以拆分独立的文本块,例如列。

5f000d8412908f6e1dbb93419d5fda61.png

RapidOCR 跨平台 OCR 库

RapidOCR 是一款基于 PaddleOCR & OnnxRuntime & OpenVINO 的跨平台 OCR 库。完全开源免费并支持离线快速部署,支持多平台, 默认是中英文,其他语言识别需要自助转换。

标签:识别,Tesseract,解决方案,支持,文本,开源,OCR
From: https://blog.csdn.net/m0_66995023/article/details/137346731

相关文章

  • 为全国校园BOT投资商提供洗衣项目解决方案
    近年来,学校BOT项目投资发展非常的迅猛,学校通过引入BOT校园投资项目,能够快速而稳健有序的解决学校基础设施升级方面的向上审批难,扣压拨款等头痛问题,又能够通过学校BOT项目投资在落地后获得相应的收益。随着社会经济水平的不断提高,初高中学生的学习日益紧张,家长、孩子甚至是学校......
  • 将 shell 的行编辑模式设置为Vi 文本编辑器的模式
    set-ovi在Bashshell中,使用set-ovi语句可以将shell的行编辑模式设置为类似于Vi文本编辑器的模式。这意味着当你在命令行中输入命令时,你可以使用Vi或Vim编辑器的按键和命令来编辑和操纵命令行。当设置为Vi模式时,你可以使用以下常用的Vi编辑命令:Esc:进入命......
  • Ueditor富文本回显word文档(doc和docx格式都支持)进行二次编辑,springboot后端
    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档vue+ueditor+springboot,实现word文档上传编辑前言`前端导入word文档(doc和docx格式都支持),Ueditor富文本回显进行二次编辑,目前ueditor项目archived了,实现两种格式的相关材料相对稀缺。解决思路:1.上传word......
  • “头痛医头、脚痛医脚”的SAP解决方案
    作为SAP顾问是否遇到过如下场景:sap用户着急的跟你说需要系统里实现什么功能,比如要增加一个库位地点,明天就要,很急。你全力配合他做好了,刚传到正式系统,用户说不需要了或者用了段时间发现不合适,能不能把功能退回去。你是不是很无语?从这里我就要引出今天的主题,什么叫“头痛医头、......
  • mysql 报错 ERROR 1396 (HY000): Operation ALTER USER failed for root@localhost 解
    mysql修改密码ALTERUSER‘root’@‘localhost’IDENTIFIEDBY‘123’;时,报错ERROR1396(HY000):OperationALTERUSERfailedforroot@localhost解决方案:2024-4-3段子手1681、首先连接权限数据库:mysql>usemysql;2、查看user主机名:mysql>selectuse......
  • HTML 文本格式化
    ​ HTML文本格式化通常使用一系列特定的标签来改变文本的外观或结构。这些标签可以控制文本的字体、大小、颜色、对齐方式等,也可以用来标记文本的逻辑结构(如段落、标题、列表等)。除了这些基本的格式化标签,HTML还支持通过CSS(级联样式表)来更精细和灵活地控制文本的格式和样式。......
  • 基于开源软件构建存储解决方案思考
    近来看了一些IBM的存储产品的资料,有一些收获。依据存储软件和搭配硬件,IBM存储产品的组合,大致分类如下:自研存储软件,搭配自研专有硬件自研存储软件,搭配通用服务器硬件,比如IBMStorageScale自研存储软件,开放云服务,比如IBMCloudstorage开源软件,搭配通用服务器,比如IBMStorage......
  • Docker内Chrome中文乱码的解决方案以及部署360奇安信失败案例
    Docker内Chrome中文乱码的解决方案以及部署360奇安信失败案例背景搞了一个清明假期,把chrome安装上去了可以实现简单的的版本确认然后想着搞一下国产化的浏览器突然发现国产化的浏览器的坑是无与伦比的深.记录一下过程.下载https://www.qianxin.com/ctp/gmbrowser.......
  • ​智慧校园平台整体解决方案
    第一章 项目概述一国内信息化现状1校园信息化发展现状高等教育信息化是促进高等教育改革创新和提高质量的有效途径,是教育信息化发展的创新前沿。进一步加强基础设施和信息资源建设,重点推进信息技术与高等教育的深度融合,能促进教育内容、教学手段和方法现代化,创新人才培......
  • File '*.cls' not found.LaTeX问题原因和解决方案
    关于.cls文件.cls文件是latex用于定义文档总体样式的文件,通常在\documentclass[]{*.cls}中使用,例如常用的artical.csl,使用方式是\documentclass[]{artical}错误原因很显然是找不到“XXX.cls”文件导致的,原因是latex包的供应方没有提供相应的.cls文件。可以通过搜索.cls文件知......