首页 > 编程问答 >PyTesseract 不提取文本?我是所有这些Python的新手,请需要h3lp

PyTesseract 不提取文本?我是所有这些Python的新手,请需要h3lp

时间:2024-07-26 09:49:59浏览次数:15  
标签:python new-operator

它不想从图像中提取文本,就像终端保持黑色并带有空格,就像它实际上试图提取文本一样,这是我的代码和图像 从 PIL 导入图像 导入 pytesseract 导入CV2 “C:\用户\埃米利亚诺\下载\practic.png” pytesseract.pytesseract.tesseract_cmd="C:\Program Files\Tesseract-OCR\tesseract.exe"

img=cv2.imread('C:\Users\Emiliano\Downloads\practic.png') cv2.imshow('窗口', img) cv2.waitKey(0) cv2.destroyAllWindows() 文本=pytesseract.image_to_string(img) print(text)

没注意到这个xd


你的代码有一些问题:

  1. 图片路径不正确: 你正在使用反斜杠 ( \ ) 用于图片路径,这在 Python 中可能会被解释为转义字符。你需要使用正斜杠 ( / ) 或者在路径字符串前面加上 r 来表示原始字符串。
  2. 没有显示图片: 你在调用 cv2.imshow() 后立即调用了 cv2.destroyAllWindows() ,这意味着图片窗口会立即关闭,你无法看到它。
  3. 代码缩进错误: Python 代码的缩进非常重要,你需要确保代码块的缩进正确。

以下是修改后的代码:

from PIL import Image
import pytesseract
import cv2

# 设置 Tesseract 路径
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

# 读取图片
img = cv2.imread(r'C:/Users/Emiliano/Downloads/practic.png') 

# 显示图片
cv2.imshow('图片', img)
cv2.waitKey(0) 
cv2.destroyAllWindows()

# 使用 Pytesseract 提取文本
text = pytesseract.image_to_string(img)

# 打印提取的文本
print(text)

修改说明:

  • 使用了 r 前缀来表示原始字符串,避免反斜杠被解释为转义字符。
  • cv2.imshow() 后添加了 cv2.waitKey(0) ,以便在按下任意键之前保持图片窗口显示。
  • 确保代码块的缩进正确。

如果仍然无法提取文本,请确保:

  • 你已经正确安装了 Tesseract OCR,并且设置了正确的路径。
  • 图片清晰,文字易于识别。如果图片质量差,Pytesseract 可能无法准确提取文本。你可以尝试使用图像处理技术来提高图像质量。

希望以上信息能够帮助你解决问题!

标签:python,new-operator
From: 78795947

相关文章

  • Python安装第三方库
    Python安装PILPIL(PythonImagingLibrary)是一个旧的Python库,用于处理图像。然而,PIL已经不再维护,并被一个名为Pillow的库所取代。Pillow是PIL的一个分支,并且完全兼容PIL。建议使用Pillow而不是PIL。pipinstallpillowPython安装moviepymoviepy是一个用于视频编辑的Python库,......
  • 优化Python中图像中的OCR文本检测
    我目前正在用python编写一个程序,该程序获取包含大量文本的图像,将其提取到.txt文件,然后将找到的单词与另一个文件中的单词列表进行比较,并创建一些坐标(根据像素)在图像中找到的单词中,如果找到图像,则会在图像中绘制红色方块。到目前为止,我已经正确处理了坐标部分,在单词周围绘制了......
  • Python保存字典类型数据到文件的三种方法
    1、在Python中使用pickle模块的dump函数将字典保存到文件中importpicklemy_dict={'Apple':4,'Banana':2,'Orange':6,'Grapes':11}#保存文件withopen("myDictionary.pkl","wb")astf:pickle.dump(my_dict,tf)......
  • 《最新出炉》系列入门篇-Python+Playwright自动化测试-53- 处理面包屑(详细教程)
    1.简介面包屑(Breadcrumb),又称面包屑导航(BreadcrumbNavigation)这个概念来自童话故事“汉赛尔和格莱特”,当汉赛尔和格莱特穿过森林时,不小心迷路了,但是他们发现沿途走过的地方都撒下了面包屑,让这些面包屑来帮助他们找到回家的路。所以,面包屑导航的作用是告诉访问者他们在网站中......
  • 如何使用 Python 在 Telegram 中进行标签搜索
    Telegram最近添加了一项新功能,可以在所有公共频道中同时按主题标签进行搜索:https://telegram.org/blog/message-effects-and-more#hashtag-search如何进行此类搜索用蟒蛇?(Telethon,Python-Telegram-Bot,...)我在Telethon文档中找到了这个函数:https://tl.......
  • 使用 Python 构建一个简单的 REST API
    使用Python构建一个简单的RESTAPI简介本文档将引导您使用Python和Flask框架构建一个简单的RESTAPI。我们将创建一个API,用于管理一个虚拟的书籍数据库。准备工作Python环境:确保您的系统上安装了Python3.x。Flask框架:使用pip安装Flask:pipinstallFla......
  • python学习之闭包与装饰器
    一、闭包闭包允许一个函数访问并操作函数外部的变量(即父级作用域中的变量),即使在该函数外部执行。特性:(1)外部函数嵌套内部函数。(2)外部函数可以返回内部函数。(3)内部函数可以访问外部函数的局部变量。defout():print("我是外层")n=10defins():......
  • 如何正确处理Python中的可选功能
    我正在开发实现科学模型的python包,我想知道处理可选功能的最佳方法是什么。这是我想要的行为:如果无法导入某些可选依赖项(例如,在无头机器上绘制模块),我想在我的类中禁用使用这些模块的功能,警告用户如果他尝试使用它们以及所有这些,而不会破坏执行。所以下面的脚本在任何情况下......
  • 在Python中,对于一个数字列表,如何找到具有最大和的数字的连续子集范围?
    输入的一个示例可能是nums1=[-1,4,-3,5,-5]nums2=[-1,4]我想知道这里什么可能是有效的解决方案。谢谢。defmax_subarray_sum_range(nums):"""找到数字列表中具有最大和的连续子集范围。Args:nums:数字列表。Returns:一个包含最大和子集起......
  • 如何安装mysqlclient 1.4.6? (Python 3.6)MacO?
    我安装pipinstallmysqlclient==1.4.6--no-cache-dir但是出现错误:ld:library'ssl'notfoundclang:error:linkercommandfailedwithexitcode1(use-vtoseeinvocation)error:command'clang'failedwithexitstatus......