首页 > 编程语言 >(15)Python识别文字,tesseract包

(15)Python识别文字,tesseract包

时间:2023-01-04 18:32:05浏览次数:68  
标签:15 Python text image sudo 语言包 tesseract 安装


使用python提供的tesseract包识别图片中的文字,但效果一般
我的是在arch中实现的

文章目录

  • ​​1、安装tesseract和英文和中文语言包​​
  • ​​2、安装必要的第三方库​​
  • ​​3、案例展示​​
  • ​​4、效果如下​​
  • ​​5、附件​​
  • ​​7、参考文献​​

1、安装tesseract和英文和中文语言包

sudo pacman -S tesseract tesseract-data-eng tesseract-data-chi_sim

注:如果要识别其他的语言,那么就需要安装其他的语言包​​https://github.com/tesseract-ocr/tessdata​

2、安装必要的第三方库

sudo pip install pillow
sudo pip install pytesseract

3、案例展示

from PIL import Image
import pytesseract
image = Image.open('1.png')
text = pytesseract.image_to_string(image, lang='chi_sim')
print(text)

4、效果如下

(15)Python识别文字,tesseract包_Image

5、附件

原图

(15)Python识别文字,tesseract包_参考文献_02

标签:15,Python,text,image,sudo,语言包,tesseract,安装
From: https://blog.51cto.com/u_14597003/5989188

相关文章