首页 > 编程语言 >python - PaddleOCR

python - PaddleOCR

时间:2023-03-21 20:01:09浏览次数:41  
标签:python PaddleOCR list res ocr 171.0 cls

1. 安装

pip3 install paddleocr -i https://pypi.tuna.tsinghua.edu.cn/simple
pip3 install paddlepaddle -i https://mirror.baidu.com/pypi/simple

2. 使用

from paddleocr import PaddleOCR
ocr = PaddleOCR(use_angle_cls = True, use_gpu = False, lang='ch')
res = ocr.ocr('test.png',cls=True)
for r in res[0]:
    print(r)

结果
image

[[[47.0, 48.0], [128.0, 48.0], [128.0, 90.0], [47.0, 90.0]], ('姓名', 0.9996767044067383)]
[[[152.0, 46.0], [232.0, 46.0], [232.0, 88.0], [152.0, 88.0]], ('性别', 0.8384654521942139)]
[[[390.0, 47.0], [508.0, 47.0], [508.0, 87.0], [390.0, 87.0]], ('身份证', 0.9947993159294128)]
[[[661.0, 44.0], [744.0, 44.0], [744.0, 90.0], [661.0, 90.0]], ('年龄', 0.7915459871292114)]
[[[46.0, 103.0], [129.0, 106.0], [127.0, 152.0], [45.0, 149.0]], ('张三', 0.93336421251297)]
[[[171.0, 106.0], [212.0, 106.0], [212.0, 150.0], [171.0, 150.0]], ('男', 0.9995383024215698)]
[[[280.0, 114.0], [615.0, 117.0], [615.0, 149.0], [279.0, 146.0]], ('12345678901234500', 0.9003013968467712)]
[[[682.0, 113.0], [723.0, 113.0], [723.0, 151.0], [682.0, 151.0]], ('32', 0.9932941794395447)]
[[[48.0, 165.0], [127.0, 165.0], [127.0, 208.0], [48.0, 208.0]], ('李四', 0.997494637966156)]
[[[169.0, 164.0], [216.0, 164.0], [216.0, 210.0], [169.0, 210.0]], ('女', 0.6857110857963562)]
[[[279.0, 176.0], [616.0, 176.0], [616.0, 206.0], [279.0, 206.0]], ('98765432109876543', 0.9408526420593262)]
[[[679.0, 171.0], [722.0, 171.0], [722.0, 212.0], [679.0, 212.0]], ('21', 0.789783239364624)]

3. 简单表格识别

import pandas as pd
from paddleocr import PaddleOCR

ocr = PaddleOCR(use_angle_cls = True, use_gpu = False, lang='ch')
res = ocr.ocr('test.png',cls=True)
name_list = []
sex_list = []
idCard_list = []
age_list = []
for i in range(0,len(res[0]),4):
    name_list.append(res[0][i][1][0])
    sex_list.append(res[0][i+1][1][0])
    idCard_list.append(res[0][i+2][1][0])
    age_list.append(res[0][i+3][1][0])

tmp = pd.DataFrame({name_list[0]:name_list[1:],sex_list[0]:sex_list[1:],idCard_list[0]:idCard_list[1:],age_list[0]:age_list[1:]})
tmp.to_excel('./test.xlsx',index=None)

image

标签:python,PaddleOCR,list,res,ocr,171.0,cls
From: https://www.cnblogs.com/wstong2052/p/17241108.html

相关文章

  • Python相关练习
    我又来练习啦!1、将一个列表的内容复制到另外一个列表里面2、输出九九乘法表3、统计1到100的和4、转战PTA作业(函数篇)--使用函数输出指定范围内Fibonacci数的个数......
  • 检查python代码质量工具
    Pylint是一个非常强大的Python代码静态分析工具,并使用方便。下面是使用Pylint的步骤:安装Pylint你可以使用以下命令通过pip安装Pylint:pipinstallpylint运行Pylin......
  • python程序执行cmd乱码
    背景起源 需要svnlog-limit1获取日志(含中文), 我Python程序运行毫无问题,程序无乱码,中文可以正常解析, 但是有功能需要调用其他程序,调用(客户端)node去做一些事情, 然后莫名其......
  • 基于PaddleOCR的多视角集装箱箱号检测识别
    基于PaddleOCR的多视角集装箱箱号检测识别一、项目介绍集装箱号是指装运出口货物集装箱的箱号,填写托运单时必填此项。标准箱号构成基本概念:采用ISO6346(1995)标准标准集装......
  • python 之lambda表达式
    今天做题的时候发现了lambda表达式,就去网上搜了搜,这么说吧,lambda表达式算是python一种比较方便的语法了,主要作用是代替简单的函数,免去了编写函数的烦恼,语法也更加地简洁。......
  • 【Python】datetime函数用法
    datetime.date表示日期的类日期对象print("日期的类:",datetime.date(2023,11,21))print("当天的年月日:",datetime.date.today())print("当天的年:",......
  • 【Python】Jupyter Notebook:IOPub message rate exceeded. The notebook server will
    ✨报错提示IOPubmessagerateexceeded.Thenotebookserverwilltemporarilystopsendingoutputtotheclientinordertoavoidcrashingit.Tochangethisli......
  • python3.10带openssl
    wgethttps://mirrors.huaweicloud.com/python/3.10.10/Python-3.10.10.tgzwgethttps://www.openssl.org/source/openssl-1.1.1n.tar.gz1.安装openssltar-xfopenssl-1.1.......
  • 【python】多线程并发,rpc接口性能测试
    1、官方文档https://docs.python.org/3/library/concurrent.futures.html 2、安装python3.x中自带了concurrent.futures模块python2.7需要安装futures模块,使用命令......
  • 如何写好Python的Lambda函数?
    当你需要完成一件小工作时,在本地环境中使用这个函数,可以让工作如此得心应手,它就是Lambda函数。Lambda函数是Python中的匿名函数。有些人将它们简称为lambdas,它们的语......