首页 > 其他分享 >OCR文字识别技术

OCR文字识别技术

时间:2023-01-31 18:00:10浏览次数:34  
标签:文字 字符 识别 图像 OCR 进行

OCR全称是optical character recognition,中文光学字符识别。

主要技术是:把图像形状转变为文本字符。

​简单来说,OCR技术就是通过图像处理和模式识别技术对光学的字符进行识别,即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。

OCR 支持各类纸质文件、证件识别、名片识别、车牌识别、票据类等印刷体识别,可以有效解决人工手动录入信息。​​

文档文字识别:可以将图书馆、报社、博物馆、档案馆等的纸质版图书、报纸、杂志、历史文献档案资料等进行电子化管理,实现精准地保存文献资料。
自然场景文字识别:识别自然场景图像中的文字信息如车牌、广告干词、路牌等信息。对车辆进行识别可以实现停车场收费管理、交通流量控制指标测量、车辆定位、防盗、高速公路超速自动化监管等功能。
票据文字识别:可以对增值税发票、报销单、车票等不同格式的票据进行文字识别,可以避免财务人员手动输入大量票据信息,如今已广泛应用于财务管理、银行、金融等众多领域。
证件识别:可以快速识别身份证、银行卡、驾驶证、名片等卡证类信息,将证件文字信息直接转换为可编辑文本,可以大大提高工作效率、减少人工成本、还可以实时进行相关人员的身份核验,以便安全管理。

OCR技术路线图总体上可分为五步:

图像预处理、切割字符、识别字符、恢复版面、后处理文字。

OCR技术需要识别成结构化(图片、文字、公式、表格并形成可独立提取出来的数据),识别结果需要形成Word或Excel文件。

在进行OCR之前,是需要对图像进行预处理(进行彩色图像灰度化、二值化处理、图像变化角度检测、矫正处理等),因为,待识别的图像千奇百怪,来源复杂,各式各样,有拍照、有扫描、有截图。

图像预处理:对包含文字的图像进行处理以便后续进行特征提取、学习。单拿扫描文件来说,扫描文件有的歪的、出现光影、或者皱巴巴等,如果不进行预处理,OCR也会感到很为难,所以需要前期进行预处理。

​切割字符:字符切割则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。为什么要把每个字符都切割出来呢?因为OCR最终是对单个字符进行识别的,并且还需要对每个字符做好标记,因为识别完了,还得还原回去。

识别字符:OCR通过学习一些样本之后,对字符进行正确的识别。

恢复版面:OCR识别出了字符后,在进行有效地连接起来。

后处理文字:OCR识别的最终目的,是要获得一份准确的、结构化的文本内容。比如对汉字的识别,由于汉字中形近字的存在,很容易将一个字识别成其形近字。后处理中可以去解决这个问题,比如通过语言模型来进行校正。或识别完后出现个别文字不正确,到这一步OCR进行智能校正,根据结合语境来帮你纠正。

OCR文字识别技术_预处理

标签:文字,字符,识别,图像,OCR,进行
From: https://blog.51cto.com/u_15375027/6029848

相关文章

  • 解决webstorm不能识别vue的@路径引用
    方式1: webstorm无法识别@符号问题[ctrl+左键无法跳转]解决:创建vue项目,打开项目后,再进入webstorm配置页面[否则没有webpack选项]ctrl+alt+s[进入设置页面]->langua......
  • 实战案例!1行Python代码识别车牌号码,轻松写一个停车场管理系统,YYDS
    大家好,这里是程序员晚枫。你家停车场的摄像头,是怎么识别出你的车牌的?今天我们一起来看一下~识别车牌识别车牌的代码很简单,只需要1行代码,如下所示。......
  • 模式识别笔记
    模式识别吴建鑫,南京大学目录目录模式识别目录第一章诸论1.模式识别流程2.模式识别和机器学习的区别第二章数学背景知识第三章模式识别系统的概述第四章评估1.基本评价......
  • Cesium:文字转图片,图片贴到多边形上
    JS前端文字转图片:link缺点:需要在网页中有一个canvas。canvas.toDataURL("image/png")后端文字转图片:text-to-svgsvg2pnghttps://www.cnblogs.com/duasonir/p/16700591......
  • rpa使用muggle_ocr自动识别验证码
    1.安装包pip3installrpa=1.48.1pip3installmuggle-ocr=1.0.3如果muggle-ocr使用pip3安装不了,只能手动安装。百度网盘:https://pan.baidu.com/s/1K3Tq9Vz-u3oQ8tWU......
  • 深度学习基础课:使用卷积神经网络识别手写数字
    大家好~我开设了“深度学习基础班”的线上课程,带领同学从0开始学习全连接和卷积神经网络,进行数学推导,并且实现可以运行的Demo程序线上课程资料:本节课录像回放加QQ群,获得......
  • 最全车牌识别,支持14种中文车牌类型
    最全车牌识别最全车牌识别算法,支持14种中文车牌类型。项目使用纯Java开发,免去使用Python带来的服务不稳定性。欢迎大家贡献代码,如果你觉得项目还不错,请给个star。......
  • 基于百度智能云的OCR接口进行图文识别
    由于一些客户的内部系统需要提取一些记录信息,如果手工录入会变得比较麻烦,因此考虑使用百度云的OCR进行图片文字的提取处理,综合比较了一下开源免费的Tesseract类库进行处理......
  • python文字转语音
    依赖pyttsx3库pipinstallpyttsx3 yuyin_test1.pyimportpyttsx3engine=pyttsx3.init()engine.say("Fourthlettersoftransitinthespringbreezeasyo......
  • Aforge.net之旅——开篇:从识别验证码开始
    时间过得真快啊,转眼今年就要过去了,大半年都没有写博客了,要说时间嘛,花在泡妹子和搞英语去了,哈哈。。。前几天老大问我怎么这么长时间都没写博客了,好吧,继续坚持,继续分享......