首页 > 编程语言 >Python下3种文字识别工具的源码和效果比较

Python下3种文字识别工具的源码和效果比较

时间:2024-06-14 17:33:25浏览次数:14  
标签:ocr Python image 辉煌灿烂 源码 result import line 识别

1.pytesseract

import pytesseract
from PIL import Image

im = Image.open(r'C:/Users/YBK/Pictures/35005.jpg')
string = pytesseract.image_to_string(im,lang='chi_sim')
print(string)

2.paddleocr

from paddleocr import PaddleOCR, draw_ocr

ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
img_path = r'C:/Users/YBK/Pictures/35005.jpg'
result = ocr.ocr(img_path, cls=True)
# for line in result:
#     print(line)
 
# 显示结果
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [detection[0] for line in result for detection in line] # Nested loop added
txts = [detection[1][0] for line in result for detection in line] # Nested loop added
scores = [detection[1][1] for line in result for detection in line] # Nested loop added
# im_show = draw_ocr(image, boxes, txts, scores)
# im_show = Image.fromarray(im_show)
# im_show.save('test.jpg')
for tt in txts:
    print(tt)

3.某个易语言程序的接口

from urllib import request, parse
import requests
import base64
import json
from urllib.request import urlretrieve
import os
import cv2
import base64
import numpy as np
import time
import pandas as pd
 
 
def image_to_base64(image_mat):
    image = cv2.imencode('.jpg', image_mat)[1]
    image_code = str(base64.b64encode(image), 'utf-8')
    return image_code
 
if __name__ == '__main__':
    url = "http://127.0.0.1:19811/ocr_data_2"
    testImgp = r'C:/Users/YBK/Pictures/35005.jpg'
    img = cv2.imread(testImgp)
    headers = {'content-type': "application/json"}
 
    data = image_to_base64(img)
   
    response = requests.post(url, data = data, headers=headers)
    
    if response:
        result = json.loads(str(response.content, 'utf-8'))
        dic = result['PaddleOCR']
        i = 0
        while i < len(dic):
            tt = dic[i]['ttxt']
            print(tt)
            i = i + 1

小学常用3500字顺口溜 pytesseract

中华历史 岁月五千 文武成康 治乱存亡 渊源流长 古往今来 雪雨风霜

王侯将相 公卿大夫 敢于担当 塞外边疆 秦皇汉武 汉刘曹魏 李唐赵宋

功成名就 三番五次 征战讨伐 改朝换代 睁是瞬间 辉煌灿烂 耳闻目见

记忆忘却 惊险刺激 孤单寂寞 喜怒哀乐 悲欢离合 休福灾咎 胜败输赢

阴晴圆缺 福祸旦夕 和谐融洽 散虑遂遥 烦闷愧恼

大小多少 远近高低 高矮胖瘦 长短粗细 日月水火 山石田士 男女老少

先来后到 黄名其妙 护卫保镖 穿衣戴帽 众多寡少 幼稚孩童 活泼可爱

士农工商 兵学官警 描图绘画 飞黄腾达 飞鸟走兽 游鱼耻虫 江河湖海

之乎者也 和爷娘姑舅 端庄秀丽 撑持维系 操持把握 落花流水 刮风下雨

东南西北 年月日时 钟表铃匀 宾客朋友 善始令终 紧迫缓冲 队伍军团

迅速疾快 挑担打抬 酒圳饭袋 熬汤问饭 张灯结彩 观望视看 佛道神仙

魔鬼妖塌 弃恶从善 岁时季节 刚强猛烈 夫妻双对 哑泣涕泪 前进后退

成双结对 率部突围 治乱安危 权势名位 阅历趣味 开花结果 春华秋实

跨山涉水 翻山越岭 千山万水 思想意念 举步维艰 济世度人 出生入死

树木森林 困难容易 前后左右 孔很太甚 暂且俄而 蒙蔽奉瞒 奏塞堵截

斩钉截铁 是妃其也 君王霸主 奔奋猛突 铺盖被福 辉煌灿烂 辞昌迎新

言谈论说 舰艇船舶 辞别再见 战士格斗 跨越冲冯 治病疗伤 医生护士

和恐惧月怕 读念讽诵 站立卧倒 只言片语 接连继续 决断嫌疑 功课作业

小学常用3500字顺口溜 易语言

中华历史 罗月五千 文武成康 治乱存亡 渊源流长 古往今来 雪雨风霜

王侯将相 公卿大夫 敢于担当 塞外边疆 秦皇汉武 汉刘曹魏 李唐赵宋

功成名就 三番五次 征战讨伐 改朝换代 睁眨瞬间 辉煌灿烂 耳闻目见

阴晴圆缺 福祸旦夕 和谐融洽 散虑逍遥 烦闷懊恼

大小多少 远近高低 高矮胖瘦 长短粗细 日月水火 山石田王 男女老少

先来后到 莫名其妙 护卫保镖 穿衣戴帽 众多寡少 幼稚孩童 活泼可爱

士农工商 兵学官警 描图绘画 飞黄腾达 飞鸟走兽 游鱼爬虫 江河湖海

之乎者也 爷娘姑舅 端庄秀丽 撑持维系 操持把握 落花流水 刮风下雨

东南西北 年月日时 钟表铃铛 宾客朋友 善始令终 紧道缓冲 队伍军团

迅速疾快 挑担扛抬 酒囊饭袋 熬汤闷饭 张灯结彩 观望视看 佛道神仙

魔鬼妖孽 弃恶从善 岁时季节 刚强猛烈 夫妻双对 哭泣涕泪 前进后退

成双结对 率部突围 治乱安危 权势名位 阅历趣味 开花结果 春华秋实

跋山涉水 翻山越岭 千山万水 思想意念 举步维艰 济世度人 出生入死

树木森林 困难容易 前后左右 孔很太甚 暂且俄而 蒙蔽壅瞒 壅塞堵截

斩钉截铁 是乃其也 君王霸主 奔奋猛突 铺盖被褥 辉煌灿烂 辞旧迎新

言谈论说 舰艇船舶 辞别再见 战士格斗 跨越冲闯 治病疗伤 医生护士

恐惧畏怕 读念讽诵 站立卧倒 只言片语 接连继续 决断嫌疑 功课作业

小学常用3500字顺口溜 PaddleOCR

中华历史 岁月五千 文武成康 治乱存亡 渊源流长 古往今来 雪雨风霜

王侯将相 公卿大夫 敢于担当 塞外边疆 秦皇汉武 汉刘曹魏 李唐赵宋

功成名就 三番五次 征战讨伐 改朝换代 挣眩瞬间 辉煌灿烂 耳闻目见

阴晴圆缺 福祸旦夕 和谐融洽 散虑逍遥 烦闷快恼

大小多少 远近高低 高矮胖瘦 长短粗细 日月水火 山石田土 男女老少

先来后到 莫名其妙 护卫保镖 穿衣戴帽 众多寡少 幼稚孩童 活泼可爱

士农工商 兵学官警 描图绘画 飞黄腾达 飞鸟走兽 游鱼爬虫 江河湖海

之乎者也 爷娘姑舅 端庄秀丽 撑持维系 操持把握 落花流水 刮风下雨

东南西北 年月日时 钟表铃铛 宾客朋友 善始令终 紧迫缓冲 队伍军团

迅速疾快 挑担扛抬 酒囊饭袋 熬汤闷饭 张灯结彩 观望视看 佛道神仙

魔鬼妖孽 弃恶从善 岁时季节 刚强猛烈 夫妻双对 哭泣沸泪 前进后退

成双结对 率部突围 治乱安危 权势名位 阅历趣味 开花结果 春华秋实

X山涉水 翻山越岭 千山万水 思想意念 举步维艰 济世度人 出生入死

树木森林 困难容易 前后左右 孔很太甚 暂X俄而 蒙蔽雍瞒 雍塞堵截

斩钉截铁 是乃其也 君王霸主 奔奋猛突 铺盖被褥 辉煌灿烂 辞旧迎新

言谈论说 舰艇船舶 辞别再见 战士格斗 跨越冲闯 治病疗伤 医生护士

恐惧畏怕 读念讽诵 站立卧倒 只言片语 接连继续 决断嫌疑 功课作业

从识别的准确率上看,易语言的最好,然后是paddleocr,但pytesseract能识别出空格。

标签:ocr,Python,image,辉煌灿烂,源码,result,import,line,识别
From: https://blog.csdn.net/2401_82434226/article/details/139676388

相关文章

  • 基于profanity-check实现不文明用语识别和斗殴行为预测
    一、语音识别不文明用语1.1、语言检查库profanity-check这是一个快速、强大的Python库,用于检测字符串中的不雅或冒犯性语言。更多关于profanity-check如何构建以及为何要构建它的信息可在这篇博客文章中找到。1.2、测试模型运行环境:python               ......
  • Linux下的python的部署
    一、python的验证一般情况下liunx系统都会自带python输入python--version便可以查看当前安装的python版本二、Linux系统下安装anaconda步骤大纲:下载anaconda文件→更改文件的权限→开始安装→完成交互问题(更改安装位置)→配置环境变量→更改文件目录权限2.1、下载anacon......
  • 【Python&RS】基于Rasterio库裁剪栅格数据&压缩栅格影像
    ​     之前分享过【Python&RS】Rasterio库安装+基础函数使用教程,大家有兴趣的可以去看看。由于最近有涉及到栅格裁剪和压缩的问题,所以研究了一下今天和大家分享分享。原创作者:RS迷途小书童博客地址:https://blog.csdn.net/m0_56729804?type=blog1需要的库imp......
  • 【制作100个unity游戏之29】使用unity复刻经典游戏《愤怒的小鸟》(完结,附带项目源码)
    最终效果前言欢迎来到【制作100个Unity游戏】系列!本系列将引导您一步步学习如何使用Unity开发各种类型的游戏。在这第29篇中,我们将探索如何用unity复刻经典游戏《愤怒的小鸟》,我会附带项目源码,以便你更好理解它。简单搭建环境修改图片配置并切图,修改最大尺寸是为了让图......
  • 浙大版PTA python程序设计 第七章题目解析
    一、判断题1.以"w"模式打开的文件无法进行读操作。  -正确。以"w"模式(写入模式)打开文件时,只允许写操作,不能进行读操作。如果尝试读操作会引发错误。2.Pandas库是用于图像处理的库。  -错误。Pandas库主要用于数据处理和分析,不是用于图像处理的。图像处理通常......
  • python利用蒙版进行抠图,背景透明和前景透明
    深度学习中利用黑白蒙版进行抠图importcv2importnumpyasnpdefget_alpha(image,mask):#归一化mask=mask/255back_mask=mask#将透明度A值转成一样维度back_transparent=back_mask.reshape(back_mask.shape[0],back_mask.shape[1],1......
  • python爬虫:实现动态网页的爬取,以爬取视频为例
    引言:爬虫也被称为网络蜘蛛(Spider),是一种自动化的软件程序,能够在互联网上漫游,按照一定的规则和算法抓取数据。爬虫技术广泛应用于搜索引擎、数据挖掘、信息提取等领域,是互联网技术的重要组成部分。摘要:作为爬虫的初学者,网页越简单越好,因为网页的结构越简单,则组织框架更清晰......
  • 基于Python3.11及SQL Server实现股票组合价值曲线相关计算分析
       本文中Python的版本使用的是3.11,数据库使用的是SQLSERVER2008,项目运行效果图如下:蒙特卡洛相关:突出风险最小点:夏普比率相关夏普比率无风险最大点文章中的股票每日交易数据摘取自:英为财情 https://cn.investing.com/蒙特卡洛及夏普相关计算参考【胖哥真......
  • Python脚本中使用 if 语句导致的错误代码
    在Python脚本中使用if语句是一种常见的控制流程结构,用于根据条件决定程序的执行路径。当使用Python中的if语句时,可能会导致一些常见的错误。下面就是我经常遇到的错误代码示例及其可能的原因和解决方法,希望对大家有些帮助,少走弯路。1、问题背景一位用户在编写一......
  • TiKV 源码分析之 PointGet
    作者:来自vivo互联网存储研发团队-GuoXiang本文介绍了TiDB中最基本的PointGet算子在存储层TiKV中的执行流程。一、背景介绍TiDB是一款具有HTAP能力(同时支持在线事务处理与在线分析处理)的融合型分布式数据库产品,具备水平扩容或者缩容等重要特性。TiDB采用多副本+Multi-R......