首页 > 编程语言 >python - tesseract-ocr

python - tesseract-ocr

时间:2023-03-20 21:45:35浏览次数:40  
标签:tesseract pytesseract python https import ocr 安装

1. 安装tesseract-ocr

下载链接:https://digi.bib.uni-mannheim.de/tesseract/
安装后添加环境变量
image
测试安装情况
image

2. 安装pytesseract

pip3 install pytesseract -i https://pypi.tuna.tsinghua.edu.cn/simple

3.添加中文包

下载链接:https://github.com/tesseract-ocr/tessdata_best
chi_sim.traineddata 为简体中文训练集
下载后放在 **\Tesseract-OCR\tessdata 目录

4. 脚本如下

from PIL import Image
import pytesseract
import cv2 as cv
img = Image.open('test.png')
pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files/Tesseract-OCR/tesseract.exe'
res = pytesseract.image_to_string(img, lang='chi_sim')
print(res)

识别效果
image
image

标签:tesseract,pytesseract,python,https,import,ocr,安装
From: https://www.cnblogs.com/wstong2052/p/17237696.html

相关文章

  • 使用python来模拟端口被占用的测试场景
    一、测试场景拿到一个运维如软件,做安装部署测试。其中,测试过程中存在一种场景:由于环境清理不干净等原因,导致软件安装部署时,某个组件的端口号被占用,而导致部署失败的情况。......
  • 使用 Python 实现一个 RPC 框架
    1.概述RPC是什么?RPC(RemoteProcedureCallProtocol),RPC是指远程过程调用,比如现在有两台服务器A、B,一个应用部署在A服务器上,想要调用B服务器上应用提供的函数/方......
  • 基于深度学习的鸟类检测识别系统(含UI界面,Python代码)
    摘要:鸟类识别是深度学习和机器视觉领域的一个热门应用,本文详细介绍基于YOLOv5的鸟类检测识别系统,在介绍算法原理的同时,给出Python的实现代码以及PyQt的UI界面。在界面中......
  • 【Python】数据结构:字典,元素为键值对表示
    1.字典可以存储任意类型对象,每个元素由键值对组成。花括号scores={'张三':99,'李四':64,'王五':88}print(scores)#{'张三':99,'李四':64,'王五':88}pri......
  • Lniux有关python多线程的历史
    在内核2.6以前的调度实体都是进程,内核并没有真正支持线程。它是能过一个系统调用clone()来实现的,这个调用创建了一份调用进程的拷贝,跟fork()不同的是,这份进程拷贝完全共......
  • 100道python基础题——(10)
    问题:编写一个程序,接受一系列空格分隔的单词作为输入,并在删除所有重复的单词并按字母数字排序后打印这些单词。假设向程序提供以下输入:helloworldandpracticemakespe......
  • 100道python基础题——(11)
    问题:编写一个程序,接受一系列逗号分隔的4位二进制数作为输入,然后检查它们是否可被5整除。可被5整除的数字将以逗号分隔的顺序打印。例:0100,0011,1010,1001那么输出应该是:10......
  • Dockerfile 构建 dotnet + python 镜像
    1编写DockerfileFROMmcr.microsoft.com/dotnet/aspnet:6.0WORKDIR/rootRUNaptupdate\&&aptinstallwgetbuild-essentialzlib1g-devlibncurses5-devli......
  • [oeasy]python0112_扩展ascii_Extended_ascii_法文字符
    法文字符回忆上次内容上次回顾了字型编码的进化过程从7-seg到点阵字库终于让字母、数字、标点明确了字型小写字符占据了位置法文字符没有地方放了7-bit的ascii已......
  • git 集成部署的python代码部分
    importos,requests,hashlib,tarfiledefdepoly(web1_tar_path,web1_deploy_dir,current):tar=tarfile.open(web1_tar_path,mode="r")#解包tar.extractal......