首页 > 其他分享 >github开源ocr神器

github开源ocr神器

时间:2023-12-07 12:06:13浏览次数:31  
标签:截图 ocr OCR 批量 开源 github 软件 识别 Umi

这篇文章给大家推荐一款免费,开源,可批量的离线OCR软件。

github开源ocr神器_json

1 Umi-OCR 简介

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
  • 高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
  • 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

github开源ocr神器_json_02

github开源ocr神器_命令行_03

2 支持功能

  • 简单上手 截图、批量识别~
  • 排版优化 如何合并一个自然段内的文字?
  • 忽略区域 如何排除截图水印处的文字?
  • 多国语言 添加更多PP-OCR支持的语言模型库!
  • 命令行调用 用命令行或第三方工具来调用Umi-OCR!
  • 联动翻译软件 截图OCR后发送指定按键,触发翻译软件进行翻译
  • 更多小技巧
  • 问题排除 无法启动引擎 / 多屏幕截图异常 ?

3、安装

访问如下链接去安装

https://github.com/hiroi-sora/Umi-OCR/releases/tag/v1.3.5

4、实践使用

  • 截图识别 点击截图按钮或自定义快捷键,唤起截图识别。

github开源ocr神器_翻译软件_04

v1.3.4 还可以设置截图后生成一个预览窗口。预览窗口可以被钉在屏幕顶层,或调为半透明,方便对比查看。

  • 粘贴图片到软件在任何地方(如文件管理器,网页,微信)复制图片,软件上点击粘贴按钮或快捷键,自动识别
  • 批量识别本地图片文件将图片或文件夹拖进软件,批量转换文字。也可以点击按钮打开浏览窗口导入。

识别结果将保存到本地。可选生成纯文本txt文件、带链接Markdown文件、原始信息jsonl文件等不同格式。可配置任务完成后执行关机/待机。

github开源ocr神器_翻译软件_05

标签:截图,ocr,OCR,批量,开源,github,软件,识别,Umi
From: https://blog.51cto.com/u_15403883/8719685

相关文章

  • 华为云开源 | 线下meetup · 中国人民大学站顺利收官
    北京,11月29日下午,华为云开源团队受邀在中国人民大学成功举办了一场以开源为主题的线下meetup。华为云多个技术领域的技术专家一同出席,为高校学子带来了一场备受期待的演讲。值得一提的是,本次议题的确定方式跟以往有所不同,为了让演讲内容与参会者需求适配性更强,华为云开源策划团队在......
  • 开源安全与合规防范指南
     业界流传这样一句话,“软件吞噬世界,开源吞噬软件”。开源软件在促进全球的软件创新方面发挥着越来越重要的作用。但同时,其安全与合规风险问题也在日益显现。一、开源组件安全与合规风险1、开源组件安全漏洞增加根据Synopsys发布的《2023开源安全和风险分析》报告显示:84%的代......
  • 阿里开源的Chat2DB使用
    阿里推出了一款集成了AI功能的免费的多数据库客户端工具——Chat2DB。可以彻底抛弃navicat和dbeaver了。而且还开源了,目前已经有9.7KStar数了!它是基于Electron+js+Java开发的,目前提供了Windows、macOS以及网页版。该工具主要由以下特性:Chat2DB整体的设计简单易用,没有任何花里胡哨的......
  • 开发者热议GitHub代码搜索政策,最佳搜索解决方案探索
    近日,名为koepnick的开发者因在一台老式电脑上使用GitHub搜索自己的存储库代码,却没有手机等设备协助验证,导致无法登录GitHub账户,发文怒斥GitHub:如若没有登录,就无法使用搜索代码服务,与其这样不如弃用。 其实,早在今年6月,GitHub官方便发布了一封《代码搜索现在需要登录》的公告......
  • git~为github三方仓库添加贡献的正确方式
    为github三方仓库添加贡献如果希望成为某些开源框架的贡献者,例如如希望加入higress、keycloak、ruoyi这些框架的开发者行列,那么今天的文章应该可以帮到您。克隆和拉取项目FORKHigress到您的存储库。要完成这项工作,您只需单击alibaba/higress主页右侧的Fork按钮。然后你......
  • 从ocr磁盘里获取asm spfile和voting file
    环境:OS:Centos7DB:12.2.0.1 当OracleASM实例查找初始化参数文件时,会从GPnPprofile文件中查找获取spfile文件[grid@rac01~]$cd$ORACLE_HOME/gpnp/rac01/profiles/peer[grid@rac01peer]$gpnptoolgetpval-asm_spfWarning:somecommandlineparameterswerede......
  • 我最喜欢的白版应用,AI加持的新功能开源!强烈推荐
    Excalidraw把他们的文本到图表的功能开源了Excalidraw是一个虚拟白板应用,专门用于绘制类似手绘的图表。它提供了一个无限的、基于画布的白板,具有手绘风格,支持多种功能。之前我分享的:72张PNG,图解机器学习里面的插图都是用Excalidraw绘制的。6月份我翻译这个图解机器学习时,......
  • sensitive-word 敏感词/脏词开源工具-v.0.10.0-脏词分类标签支持
    sensitive-wordsensitive-word基于DFA算法实现的高性能敏感词工具。创作目的实现一款好用敏感词工具。基于DFA算法实现,目前敏感词库内容收录6W+(源文件18W+,经过一次删减)。后期将进行持续优化和补充敏感词库,并进一步提升算法的性能。希望可以细化敏感词的分类,感觉工作......
  • 见证雷池成为 GitHub 全球第一的 WAF 项目
    雷池(SafeLine)是长亭科技耗时近10年打造的WAF,由长亭独创的智能语义分析算法驱动。雷池与开源社区早在2016年,长亭就开源了雷池的语义分析算法自动机引擎,后续又陆续开源了雷池相关风控插件的和引擎通信协议。雷池的商业版本自发布以后就受到各大咨询机构和诸多头部企业的认......
  • 见证雷池成为 GitHub 全球第一的 WAF 项目 ,(转自雷池微信公众号)
    见证雷池成为GitHub全球第一的WAF项目原创雷池开发者团队[CTStack安全社区](javascript:void(0)......