pytesseract是基于Python的OCR工具, 底层使用的是Google的Tesseract-OCR 引擎,支持识别图片中的文字,支持jpeg, png, gif, bmp, tiff等图片格式。
如何安装使用请看我的上一篇。
在使用pytesseract打开图片是遇到没有找到文件解决pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.
解决办法:
1.添加环境变量 系统-属性-高级-环境变量
系统变量path添加tesseract的安装路径D:\Program Files\tesseract
2.系统变量增加一个TESSDATA_PREFIX变量名,变量值还是安装路径D:\Program Files\tesseract\tessdata这是语言字库文件夹
3.修改D:\python路径\Lib\site-packages\pytesseract\pytesseract.py文件
tesseract_cmd = r'D:\Program Files\tesseract\tesseract.exe'
然后就可以了
标签:information,OCR,file,installed,pytesseract,tesseract,环境变量 From: https://www.cnblogs.com/hiit/p/17579205.html