首页 > 其他分享 >paddleocr图片文字识别

paddleocr图片文字识别

时间:2025-01-21 20:11:05浏览次数:1  
标签:PP ch paddleocr OCRv4 cls 识别 infer 图片

介绍:PaddleOCR是由百度开发的一个OCR库,基于深度学习框架PaddlePaddle。PaddleOCR支持多语言文本识别,特别适合中文场景,同时它还提供了丰富的预训练模型。

1、安装

pip3 install paddlepaddle
pip3 install paddleocr

2、使用

from paddleocr import PaddleOCR

def paddle_image():
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    # 读取图像
    results = ocr.ocr(image_path, cls=True)
    # for (bbox, text) in results[0]: print(f"{text}")
    # 打印识别结果
    for line in results:
        for word_info in line:
            print(f"Detected text: {word_info[1][0]}, Confidence: {word_info[1][1]:.2f}")

paddle_image()

3、注意事项

3.1、windows使用时报错pyclipper模块init文件中ImpoerError:DLL load failed:找不到指定的模块。

  动态链接库 (DLL), 下载并安装 Microsoft Visual C++ Redistributable。https://learn.microsoft.com/en-us/cpp/windows/latest-supported-vc-redist?view=msvc-170

• 选择与你的 Python 版本匹配的版本(x86 或 x64)。

3.2、未联网环境复制下C:\Users\zhouman02\.paddleocr\whl

联网自动安装:

download https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_infer.tar to C:\Users\zhouman02/.paddleocr/whl\det\ch\ch_PP-OCRv4_det_infer\ch_PP-OCRv4_det_infer.tar
100%|██████████| 4.89M/4.89M [00:06<00:00, 758kiB/s]
download https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_infer.tar to C:\Users\zhouman02/.paddleocr/whl\rec\ch\ch_PP-OCRv4_rec_infer\ch_PP-OCRv4_rec_infer.tar
100%|██████████| 11.0M/11.0M [00:05<00:00, 2.19MiB/s]
download https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar to C:\Users\zhouman02/.paddleocr/whl\cls\ch_ppocr_mobile_v2.0_cls_infer\ch_ppocr_mobile_v2.0_cls_infer.tar
100%|██████████| 2.19M/2.19M [00:03<00:00, 658kiB/s]

标签:PP,ch,paddleocr,OCRv4,cls,识别,infer,图片
From: https://www.cnblogs.com/zmm521/p/18684355

相关文章

  • TensorFlow手写AlexNet识别10-monkey-species
     In [1]:fromtensorflowimportkerasimporttensorflowastfimportnumpyasnpimportpandasaspdimportmatplotlib.pyplotasplt In [9]:defAlexNet(height=224,width=224,classes=10):input_image=keras.layers.Input(sh......
  • 识别两个表格文件,根据手机号进行匹配相同行并按照需要字段输出
    python代码#-*-coding:utf-8-*-#encoding:utf-8fromflaskimportFlask,render_template,request,send_file,jsonifyimportos,requestsimportpandasaspdfromdatetimeimportdatetime,timedeltaimporttime,jsonfromlogimportloggingimportthreadi......
  • 深度学习实战花卉图像识别
      本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的特征提取能力,在多个图像分类任务中展现出卓越性能。本研究针对5种花卉数据集进行训练和优化,该数据集包含丰富的花卉图像样本,为模型的准确性和泛化能力提供了有力保障。通......
  • python 利用探空数据识别整层云
    选用蔡淼的论文:[1]蔡淼,欧建军,周毓荃,等.L波段探空判别云区方法的研究[J].大气科学,2014,38(02):213-222.里面的阈值法: #!/usr/bin/python3#-*-coding:utf-8-*-"""@Time:2025/1/2023:22@Author:Suyue@Email:1493117872@qq.com@File:cloud_area.py@Proj......
  • html img标签的loading属性可用于懒加载图片
    loading属性是HTML<img>标签的一个属性,用于指示浏览器何时加载图像资源。它有助于优化页面加载性能,特别是对于包含大量图片的页面。通过延迟加载(lazyloading)不在视口内的图片,可以显著减少初始页面加载时间,并提高用户体验。loading属性的值loading属性支持以下三个值:laz......
  • 跨境图片翻译工具,轻松玩转外贸电商
    最近做外贸的小伙伴们是不是经常遇到这样的困扰?客户发来的图片看不懂,产品包装上的文字需要翻译,甚至连供应商寄来的样品说明书也是外语。搞不清楚内容,沟通效率直接拉胯。你可能会想,“这点小事用翻译软件不就行了?”但问题是,有些翻译工具只能处理纯文本,遇到图片上的文字就无能为力......
  • 使用 Python 和 Tesseract 进行验证码自动识别
    验证码(CAPTCHA)广泛用于防止自动化程序(例如爬虫)滥用网站。它通过呈现扭曲的字符、图形或其他复杂模式,要求用户确认自己是人类而非机器人。虽然它的目的是为了避免自动化工具进行操作,但我们可以使用Python和TesseractOCR技术来自动化识别这些验证码。在这篇文章中,我们将讲解如......
  • 使用 Python 和 Tesseract 进行验证码识别
    验证码(CAPTCHA)是防止自动化程序(如爬虫、机器人的自动化脚本)的一种安全技术,通常通过图像显示扭曲的字母、数字或者符号,要求用户正确输入。这种技术在网络安全中起着重要作用,但我们也可以通过编程方式来自动化识别这些验证码。本文将通过Python和TesseractOCR(光学字符识别)技术来......
  • (开源)基于Django+Yolov8+Tensorflow的智能鸟类识别平台
    1项目简介(开源地址在文章结尾)系统旨在为了帮助鸟类爱好者、学者、动物保护协会等群体更好的了解和保护鸟类动物。用户群体可以通过平台采集野外鸟类的保护动物照片和视频,甄别分类、实况分析鸟类保护动物,与全世界各地的用户,沟通交流。2启动步骤1.配置开发环境2.python......
  • 人脸识别【java-基于OpenCV】思维导图-java架构
    为了创建一个关于基于OpenCV的Java人脸识别项目的思维导图,可以围绕项目的主要组成部分进行组织:环境搭建、数据准备、人脸检测、特征提取、模型训练、识别与验证、以及优化和部署。以下是一个结构化的建议框架,你可以根据这个框架使用任何思维导图软件来创建具体的图形化版本......