首页 > 其他分享 >搭建自己的OCR服务,第二步:PaddleOCR环境安装

搭建自己的OCR服务,第二步:PaddleOCR环境安装

时间:2023-06-23 11:36:57浏览次数:67  
标签:ocr PaddleOCR paddlepaddle gitee https OCR 安装 第二步

PaddleOCR环境安装,遇到了很多问题,根据系统不同问题也不同,不要盲目看别人的教程,有的教程也过时了,根据实际情况自己调整。

我这边目前是使用windows 10系统+CPU + python 3.7 搭建。

熟悉OCR的人应该知道,最好用GPU,性能差距不是一点点,但是普通人没有那个条件怎么办,只能退而求其次,好在自己学习使用也不需要那么好性能。

 

PaddleOcr环境安装步骤:

第一步:先安装 C++ 开发环境

我在搭建过程中遇到的最大的问题就是,本机电脑没有Microsoft Visual  c++开发环境,毕竟不是从事c++开发的很容易忽略这个问题,后来找了很多技术文章才确定这个大问题。

Visual Studio下载
首先从微软官网( https://visualstudio.microsoft.com/zh-hans/downloads/ )下载 Visual Studio 的安装程序,如下图所示:

选择社区版,免费,如果是企业用户还是另选版本。

 主要安装过程,主要选择c++应用就行,其他不是本次重点

  主要安装过程,主要选择c++的桌面开发就行,其他不是本次重点

 这步完成后,后面相对就容易多了。

 

第二步:按照PaddleOCR官网安装步骤操作就行

进入百度飞浆官网安装地址:

https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html

 

1,选择版本,系统,安装方式和计算机平台。

2,执行安装CPU版本的paddlepaddle命令

python -m pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

注意事项:

pip安装过程中会自动下载相关依赖库,其中就有2个依赖库(lanms-neo和polygon3)跟上面第一步的c++开发环境相关,如果没有安装c++环境的话,一直安装报错。

3,验证安装

安装完成后您可以使用 python 进入 python 解释器,输入 import paddle ,再输入 paddle.utils.run_check()

如果出现PaddlePaddle is installed successfully!,说明您已成功安装。运行检测,还能检测到电脑有几个cpu。

 

也可以参考gitee上的安装教程:

gitee 源码地址 : 

https://gitee.com/paddlepaddle/PaddleOCR

https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/quickstart.md

4,python脚本使用OCR识别图片

测试图片:1.png

 paddleocr_test.py :

from paddleocr import PaddleOCR
'''
测试ocr方法
'''
def test_ocr():
    # paddleocr 目前支持的多语言语种可以通过修改lang参数进行切换
    # 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
    # 使用CPU预加载,不用GPU
    ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=False)
    # 打开图片文件
    result = ocr.ocr("1.png", cls=True)
    # 打印所有结果信息
    print(result)
    for index in range(len(result)):
        rst = result[index]
        for line in rst:
            points = line[0]
            text = line[1][0]
            score = line[1][1]
            print('points : ', points)
            print('text : ', text)
            print('score : ', score)


if __name__ == "__main__":
    test_ocr()

 

第一次运行识别程序,会自动下载3个 中英文超轻量PP-OCRv3 模型(检测模型,方向分类器,识别模型)。

也可以自己主动下载想要的模型。gitee上。

 

也可以取百度飞浆官网下载各种预训练好的模型,拿来就能用。

官网地址: https://aistudio.baidu.com/aistudio/modelsoverview?lang=zh_CN

 

通过python脚本测试使用PaddleOCR可以正常运行,只是识别率没有那么高,这就需要后面自己慢慢训练新的模型了,不断优化识别模型。 

或者选择官网预训练好的模型,简单省事。

 

第三步:下载PaddleOCR源码

github开源地址: https://github.com/PaddlePaddle/PaddleOCR.git

gitee开源地址:  https://gitee.com/paddlepaddle/PaddleOCR

 

下载PaddleOCR源码到本地,而不只是简单安装PaddleOCR库,直接调用他的方法等,目的是学习和研究的话,看源码还是很有用的。

源码目录结构如下:

 其中,pip安装 paddlepaddle 过程中下载的相关依赖库就在 requirements.txt 文件里。

------------------------------到此,安装PaddleOCR基本完成------------------------------

 

标签:ocr,PaddleOCR,paddlepaddle,gitee,https,OCR,安装,第二步
From: https://www.cnblogs.com/xh2023/p/17498892.html

相关文章

  • 搭建自己的OCR服务,第一步:选择合适的开源OCR项目
    一、OCR是什么?光学字符识别(OpticalCharacterRecognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。 二、OCR的基本流程1.图像输入、预处理:不同的图像格式有不同的存储、压缩方式,目......
  • 高精度离线免费 的C#文字识别PaddleOCR库
    随便打开一个MicrosoftVisualStudio,新建一个WinForms项目,从下面列表中随便选择一个NET框架。目标平台要设置成X64,该OCR仅支持64位。 net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;netstandard2.0;netcoreapp3.1;net5.0;net6.0;net7.0......
  • PaddleOCR环境配置踩坑记录
    前言PaddleOCR的效果目前是开源下最好用的,但是配置环境坑很多,虽然已经配好能用,但是再次使用还是会偶尔报bug,故在此记录一些对应的bug便于查阅。bug对应解决方法1、ImportError:libcudart.so.10.2:cannotopensharedobjectfile:Nosuchfileordirectory找到对应conda环......
  • Tesseract-OCR安装及使用
    1、tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/    其中带有dev的为开发版本,作者下载的版本为:tesseract-ocr-setup-3.05.01.exe 2、双击ex进行安装,同意协议并继续。 勾选Additionallanguagedata(download)选项支持识别的语言包。  选择安装目......
  • PaddleOCR 训练工具Win 10下安装步骤
           1、从这里面下载代码包,可能比较慢。     2、进入这个目录:      3、尝试运行E:\>cdE:\paddleOCR\PaddleOCR\PPOCRLabelE:\paddleOCR\PaddleOCR\PPOCRLabel>pythonPPOCRLabel.py--langchTraceback(mostrecentcalllast):......
  • 推荐一个 C#写的 支持OCR的免费通用扫描仪软件
    不管是办公还是家用扫描仪,现在越来越日常化了,人们对扫描仪的使用需求也越来越频繁。NAPS2是一个开源免费软件,体积只有6M不到,支持运行在Windows,Mac和Linux操作系统中,默认就带有简体中文界面,官方默认就提供绿色版,所以解压即可使用,直接可以从官方网站下载:https://www.naps2.co......
  • 推荐一个 C#写的 支持OCR的免费通用扫描仪软件
    NAPS2是一个开源免费软件,体积只有6M不到,支持运行在Windows,Mac和Linux操作系统中,默认就带有简体中文界面,官方默认就提供绿色版,所以解压即可使用,直接可以从官方网站下载:https://www.naps2.com/。NAPS2全名叫做NotAnotherPDFScanner2,中文名叫做【不是另一个PDF扫描仪2】。如......
  • OCR -- 文本识别 -- 实践篇
    OCR--文本识别--理论篇本章将详细介绍如何基于PaddleOCR完成CRNN文本识别模型的搭建、训练、评估和预测。数据集采用icdar2015,其中训练集有4468张,测试集有2077张。CRNN是基于CTC的算法,CRNN是较早被提出也是目前工业界应用较多的方法。主要用于识别规则文本,有效快的预测速......
  • spire.ocr 报错无法加载 DLL"spire_ocrsystem.dll"
    出现这个错误的时候,用以下2个步骤解决:第一,要检查类库的运行平台是否已经改成了x64,因为spire.ocr是基于64位平台的 第二,缺少VC运行库,安装VC运行库即可运行库的下载地址:https://pan.baidu.com/s/1lQwyqaS-Ba2ns0BRT5Z7Eg  提取码:wgja ......
  • OCR -- 文本识别 -- 理论篇
    文本识别的应用场景很多,有文档识别、路标识别、车牌识别、工业编号识别等等,根据实际场景可以把文本识别任务分为两个大类:规则文本识别和不规则文本识别。规则文本识别:主要指印刷字体、扫描文本等,认为文本大致处在水平线位置不规则文本识别:往往出现在自然场景中,且由于文本曲......