首页 > 编程语言 >python-识别图片中的文字

python-识别图片中的文字

时间:2024-06-11 18:22:38浏览次数:23  
标签:tesseract img python text pytesseract 识别 图片

1、下载:https://digi.bib.uni-mannheim.de/tesseract/

我们之所以要应用Tesseract,是因为他是一个开源的OCR(光学字符识别)引擎,它可以从各种图像中提取文本信息。

它具有以下作用:
    - 从扫描或拍摄的图像中提取文本:Tesseract可以从这些非结构化的图像中识别和提取文本,这些图像可以包括文档、照片、屏幕截图等。
    - 支持多种语言:Tesseract支持超过100种语言,这使得它能够适应各种不同的场景和需求。

2、请注意安装的时候一定要选择Additioinal language data,否则可能无法识别中文

安装的时候语言包还是十分重要滴!默认只能识别英文

3、配置环境变量(不在cmd中使用 可以不配)

变量名:TESSDATA_PREFIX

变量值:E:\installDir\tesseract-ocr\tessdata

cmd 打开输入: tesseract -v

python中安装: pip install pytesseract     #如无法安装需要开启魔法

简单的识别图片中的文字

import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r'E:\installDir\tesseract-ocr\tesseract.exe'
# text=pytesseract.image_to_string(Image.open('img\img_1.png'),lang='eng')#英文
text=pytesseract.image_to_string(Image.open('img\img_1.png'),lang='chi_sim')#中文识别
print(text)

 

标签:tesseract,img,python,text,pytesseract,识别,图片
From: https://www.cnblogs.com/littlecc/p/18242425

相关文章

  • 贪吃蛇小游戏Python Pygame实现
    运行结果 游戏规则1.↑↓←→来控制蛇的移动方向2.蛇吃到自己身体的任意一部分游戏结束,自动退出窗口3. 蛇的速度会随游戏时间增长越来越快,与吃食物的多少(分数)无关4.蛇可以穿过边界到达另一边5.场上食物同时只会存在一个,颜色随机,但每个颜色的所得分......
  • Python 字符串
    Python字符串Python中的字符串是一种常见且重要的数据类型,用于存储文本信息。字符串是不可变的,即一旦创建,就不能更改其内容。但我们可以创建新的字符串作为修改的结果。以下是关于Python字符串的一些基本操作和功能的介绍。数据类型转字符串在Python中,你可以使用str()......
  • 爬取京东商品图片的Python实现方法
    引言在数据驱动的商业环境中,网络爬虫技术已成为获取信息的重要手段。京东作为中国领先的电商平台,拥有海量的商品信息和图片资源。本文将详细介绍如何使用Python编写爬虫程序,爬取京东商品的图片,并提供完整的代码实现过程。爬虫基础在开始编写爬虫之前,需要了解一些基本的网......
  • Python 调整PDF页面尺寸大小
    在处理PDF文件时,我们可能会遇到这样的情况:原始PDF文档不符合我们的阅读习惯,或者需要适配不同显示设备等。这时,我们就需要及时调整PDF文档中的页面尺寸,以满足不同应用场景的需求。利用Python语言的高效性和灵活性,再结合Spire.PDFforPython库的强大功能,我们可以通过Python代码轻......
  • python怎么保留小数
    保留两位小数,并做四舍五入处理方法一:使用字符串格式化a = 12.345print("%.2f" % a)# 12.35方法二:使用round内置函数a = 12.345a1 = round(a, 2)print(a1)# 12.35方法三:使用decimal模块from decimal import Decimala = 12.345Decimal(a).......
  • python怎么画曲线图
    如何使用python画曲线图?下面是基本步骤:前提首先,为了实际使用Matplotlib,我们需要安装它。安装如果你安装了更高版本的Python,你应该能够打开cmd.exe或终端,然后执行:pip install matplotlib注意:如果上面的较短命令不工作,你可能需要执行C:/Python34/Scripts/pipinsta......
  • 基于Vue+Node.js的高校学业预警系统+10551(免费领源码)可做计算机毕业设计JAVA、PHP、爬
    NodeJS高校学业预警系统摘 要随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,教育行业当然也不能排除在外。高校学业预警系统是以实际运用为开发背景,运用软件工程开发方法,采用Node.JS技术构建的一个管理系统。......
  • 使用python处理excel数据
    使用python处理excel数据python处理excel数据时间差计算平均量计算excel处理后数据python处理excel数据excel数据有一列是开始时间,一列为结束时间,计算时间差,时间差>1h,将数据平均为1h。时间差>1h,总量也将平均到每个小时,如第三行数据,时间差为4h,数据为5.2,所以每小时......
  • python-找第一个只出现一次的字符
    [题目描述]给定一个只包含小写字母的字符串,请你找到第一个仅出现一次的字符。如果没有,输出no。输入:一个字符串,长度小于1100。输出:输出第一个仅出现一次的字符,若没有则输出no。样例输入1abcabd样例输出1c来源/分类(难度系数:一星) 完整代码如下:a=list(input())b=[......
  • 图片翻译成文字怎么操作?不妨来试试这五款翻译软件吧
    不知道各位小伙伴们是否有一种疑惑:#为什么感觉去旅游的人越来越多了#?这是因为旅游不仅可以让旅行者体验不同的地域文化,享受异域风情,它更是一种生活态度的体现。可能有部份小伙伴会因为语言障碍问题而望而却步,其实借助图片文字翻译编辑软件,让它识别并翻译图片中的文字,就可以......