python-识别图片中的文字

时间：2024-06-11 18:22:38浏览次数：23

标签：tesseract img python text pytesseract 识别图片

1、下载：https://digi.bib.uni-mannheim.de/tesseract/

我们之所以要应用Tesseract，是因为他是一个开源的OCR（光学字符识别）引擎，它可以从各种图像中提取文本信息。

它具有以下作用：
    - 从扫描或拍摄的图像中提取文本：Tesseract可以从这些非结构化的图像中识别和提取文本，这些图像可以包括文档、照片、屏幕截图等。
    - 支持多种语言：Tesseract支持超过100种语言，这使得它能够适应各种不同的场景和需求。

2、请注意安装的时候一定要选择Additioinal language data,否则可能无法识别中文

安装的时候语言包还是十分重要滴！默认只能识别英文

3、配置环境变量（不在cmd中使用可以不配）

变量名：TESSDATA_PREFIX

变量值：E:\installDir\tesseract-ocr\tessdata

cmd 打开输入： tesseract -v

python中安装： pip install pytesseract #如无法安装需要开启魔法

简单的识别图片中的文字

import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r'E:\installDir\tesseract-ocr\tesseract.exe'
# text=pytesseract.image_to_string(Image.open('img\img_1.png'),lang='eng')#英文
text=pytesseract.image_to_string(Image.open('img\img_1.png'),lang='chi_sim')#中文识别
print(text)

标签：tesseract,img,python,text,pytesseract,识别,图片
From： https://www.cnblogs.com/littlecc/p/18242425

贪吃蛇小游戏Python Pygame实现
运行结果游戏规则1.↑↓←→来控制蛇的移动方向2.蛇吃到自己身体的任意一部分游戏结束,自动退出窗口3. 蛇的速度会随游戏时间增长越来越快,与吃食物的多少(分数)无关4.蛇可以穿过边界到达另一边5.场上食物同时只会存在一个,颜色随机,但每个颜色的所得分......
Python 字符串
Python字符串Python中的字符串是一种常见且重要的数据类型，用于存储文本信息。字符串是不可变的，即一旦创建，就不能更改其内容。但我们可以创建新的字符串作为修改的结果。以下是关于Python字符串的一些基本操作和功能的介绍。数据类型转字符串在Python中，你可以使用str()......
爬取京东商品图片的Python实现方法
引言在数据驱动的商业环境中，网络爬虫技术已成为获取信息的重要手段。京东作为中国领先的电商平台，拥有海量的商品信息和图片资源。本文将详细介绍如何使用Python编写爬虫程序，爬取京东商品的图片，并提供完整的代码实现过程。爬虫基础在开始编写爬虫之前，需要了解一些基本的网......
Python 调整PDF页面尺寸大小
在处理PDF文件时，我们可能会遇到这样的情况：原始PDF文档不符合我们的阅读习惯，或者需要适配不同显示设备等。这时，我们就需要及时调整PDF文档中的页面尺寸，以满足不同应用场景的需求。利用Python语言的高效性和灵活性，再结合Spire.PDFforPython库的强大功能，我们可以通过Python代码轻......
python怎么保留小数
保留两位小数，并做四舍五入处理方法一：使用字符串格式化a = 12.345print("%.2f" % a)# 12.35方法二：使用round内置函数a = 12.345a1 = round(a, 2)print(a1)# 12.35方法三：使用decimal模块from decimal import Decimala = 12.345Decimal(a).......
python怎么画曲线图
如何使用python画曲线图？下面是基本步骤：前提首先，为了实际使用Matplotlib，我们需要安装它。安装如果你安装了更高版本的Python，你应该能够打开cmd.exe或终端，然后执行：pip install matplotlib注意：如果上面的较短命令不工作，你可能需要执行C:/Python34/Scripts/pipinsta......
基于Vue+Node.js的高校学业预警系统+10551（免费领源码）可做计算机毕业设计JAVA、PHP、爬
NodeJS高校学业预警系统摘要随着科学技术的飞速发展，社会的方方面面、各行各业都在努力与现代的先进技术接轨，通过科技手段来提高自身的优势，教育行业当然也不能排除在外。高校学业预警系统是以实际运用为开发背景，运用软件工程开发方法，采用Node.JS技术构建的一个管理系统。......
使用python处理excel数据
使用python处理excel数据python处理excel数据时间差计算平均量计算excel处理后数据python处理excel数据excel数据有一列是开始时间，一列为结束时间，计算时间差，时间差>1h，将数据平均为1h。时间差>1h，总量也将平均到每个小时，如第三行数据，时间差为4h，数据为5.2，所以每小时......
python-找第一个只出现一次的字符
[题目描述]给定一个只包含小写字母的字符串，请你找到第一个仅出现一次的字符。如果没有，输出no。输入：一个字符串，长度小于1100。输出：输出第一个仅出现一次的字符，若没有则输出no。样例输入1abcabd样例输出1c来源/分类(难度系数：一星) 完整代码如下：a=list(input())b=[......
图片翻译成文字怎么操作？不妨来试试这五款翻译软件吧
不知道各位小伙伴们是否有一种疑惑：#为什么感觉去旅游的人越来越多了#？这是因为旅游不仅可以让旅行者体验不同的地域文化，享受异域风情，它更是一种生活态度的体现。可能有部份小伙伴会因为语言障碍问题而望而却步，其实借助图片文字翻译编辑软件，让它识别并翻译图片中的文字，就可以......

python-识别图片中的文字

相关文章

赞助商

阅读排行