ddddocr基本使用和介绍
摘要:在使用爬虫登录网站的时候,经常输入用户名和密码后会遇到验证码,这时候就需要用到今天给大家介绍的python第三方库ddddocr,ddddocr是一款强大的通用开源ocr识别库,具有高效、准确、易用的特点,广泛应用于图像处理和文字识别任务。本文将为大家介绍ddddocr的基本使用方法,以及示例代码。
项目地址:https://github.com/sml2h3/ddddocr
一、安装
直接使用pip安装即可
pip install ddddocr
安装完成后就可以在python代码中引入ddddocr库了
import ddddocr
二、使用示例
识别以下验证码
代码示例
# test.py
import ddddocr
ocr = ddddocr.DdddOcr(show_ad=False)
with open("./img/1.jpg", "rb") as f1:
im = f1.read()
yzm1 = ocr.classification(im)
with open("./img/2.jpg", "rb") as f2:
im = f2.read()
yzm2 = ocr.classification(im)
print(yzm1, yzm2)
运行结果
三、总结
本文介绍了识别英文+数字图片验证码的过程,ddddocr在对图片不进行任何处理的情况下识别效率已经非常高了,我们在实际应用场景中还可以根据自身需求对图片进行进一步的处理提高识别率。在遇到一些复杂难以识别的验证码时我们可以对其进行深度学习训练,具体实现流程可以参考我前面的博客。此外,ddddocr还可以实现识别滑块验证码和图片点选验证码的功能,有兴趣的小伙伴可以自行研究。
标签:基本,识别,示例,验证码,介绍,ddddocr,im,ocr From: https://www.cnblogs.com/gggod/p/18145363