首页 > 其他分享 >利用Paddle开源OCR模型进行字符识别

利用Paddle开源OCR模型进行字符识别

时间:2023-01-19 10:24:13浏览次数:55  
标签:字符识别 OCR python Paddle install pip ocr numpy

在挂机录制视频的时候,需要一个检测进度条是否跑完的功能。但是无奈各大平台ocr的api都很贵,本人不太愿意为了这个小功能掏钱。然后发现了这个OCR模型。

虽然没学过人工智能,但是好在官方给的教程十分简单。按照教程做大致没有问题,但是有一些遇到的问题官方教程没有涉及到。

 

我是使用pycharm的,在pycharm2022版本中,换源比较麻烦,可以手动用命令行进行下载。但是要注意的是pycharm用的是python虚拟环境,直接在本地下载是没用的。需要打开项目目录下的./venv/Scripts文件夹下,用管理员模式下的cmd运行activate.bat文件进入虚拟环境。然后运行。

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install "paddleocr>=2.0.1" -i https://mirror.baidu.com/pypi/simple

 如果你的电脑安装过最新版numpy,那么你在运行代码时会喜提一个报错。原因是python的库中包含了numpy.int属性,但是这个在1.24.0中已经被删除了。用下面命令重新安装numpy:

pip install "numpy<1.24.0" -i https://mirror.baidu.com/pypi/simple

 到python里面运行即可,这里提供一个用ocr识别文本的示例代码:

def ocr(img_path):
    ocr = PaddleOCR(use_angle_cls=True, lang="ch") # 这一句可以写成全局变量,避免重复加载模型(很慢)
    result = ocr.ocr(img_path, cls=True)
    return result[0][0][1][0]

 用这个函数就可以识别图像中文字了,而且用本地开源模型,不用联网/花钱。准确率很高。

标签:字符识别,OCR,python,Paddle,install,pip,ocr,numpy
From: https://www.cnblogs.com/onglublog/p/17061105.html

相关文章

  • 找个好用的ocr不容易
    写帖子的时候想从一本扫描版的书中摘几段,懒得打字,就想找个简单的ocr软件。装了几个,都报告缺这缺那,用不了。想自己写个,看了点subtitleEdit源码里的ocr部分,觉得还是挺麻烦。......
  • Windows 去掉日语里的日语输入法只保留OCR功能
    概要win10输入法设置、美式键盘怎么删除、win10只要ocr不要输入法、win10删掉多余的日语输入法、PowerToysOCR其他语言原文:https://www.cnblogs.com/xaoc/p/1705899......
  • .NET(C#、VB)APP开发——Smobiler平台控件介绍:OCR组件
    本文简述如何在Smobiler中使用OCR组件进行文字识别。Step1.新建一个SmobilerForm窗体,并在窗体中加入OCR和Button,布局如下Button的点击事件代码:privatevoid......
  • ocr备份与恢复
    一、自动备份oracle会每小时备份一次ocr,自动备份的默认路径是:$CRS_HOME/cdata/$CRS_NAME下,可以用ocrconfig查看自动备份的信息。 自动备份只会在一个节点执行。如果用于备......
  • 使用ddddocr识别验证码
    importurllib3importddddocrcode_url="http://www.xxxx.com/code.php"headers="{你的header是内容}"http=urllib3.PoolManager()resq=http.request('GET',cod......
  • centos7.9 安装ddddocr验证码识别模块
    正常安装pipinstallddddocr 但是因为会使用国外源,很慢,所以我们使用国内源 首先先安装opencv-python-headless注意要使用小于4.3版本的,否则按照不上,windows忽略这一......
  • 【table master mmocr】Windows下模型训练的配置
    processed_data就是mmocr_pubtabnet_recognition,注意统一命名由图可以看出,那个processed_data就是mmocr_pubtabnet_recognition,而且后面后缀_0927之类的都是日期,可能是......
  • 端对端OCR算法-PGNet
    端对端OCR算法-PGNet一、简介PGNet算法介绍性能指标二、环境配置三、快速使用inference模型下载单张图像或者图像集合预测可视化结果四、模型训练......
  • Paddle学习(一)
    1、首先学习一些概念   1)机器学习机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。......
  • 超棒的良心工具-OCR工具集
    使用平台:Windows虽然是OCR工具,但多了一个“集”字,原因在于该软件内置了搜狗网络OCR、本地离线OCR,不用key,还原天若OCR操作。一句话:免去申请注册key登录+软件操作和天若oc......