前言

验证码的种类有很多，它是常用的一种反爬手段，包括：图片验证码，滑块验证码，等一些常见的验证码场景。
识别验证码的python 库有很多，用起来也并不简单，这里推荐一个简单实用的识别验证码的库 ddddorc (带带弟弟orc)库.

环境准备

python 版本要求小于等于python3.9 版本
pip 安装

pip install ddddocr

下载的安装包比较大，一般用国内的下载源可以加快下载速度

pip install ddddocr -i https://pypi.douban.com/simple

github地址https://github.com/sml2h3/ddddocr

快速开始

先随便找个纯英文的验证码,保持为a1.png

代码示例

import ddddocr                       # 导入 ddddocr
ocr = ddddocr.DdddOcr()              # 实例化
with open('a1.png', 'rb') as f:     # 打开图片
    img_bytes = f.read()             # 读取图片
res = ocr.classification(img_bytes)  # 识别
print(res)

运行结果

已经能识别到 xnen ,但是会出现"欢迎使用ddddocr，本项目专注带动行业内卷..."提示语，可以加一个参数show_ad=False

import ddddocr                       # 导入 ddddocr
ocr = ddddocr.DdddOcr(show_ad=False)              # 实例化
with open('a1.png', 'rb') as f:     # 打开图片
    img_bytes = f.read()             # 读取图片
res = ocr.classification(img_bytes)  # 识别
print(res)

图片验证码

识别一下三种验证码

代码示例

import ddddocr                       # 导入 ddddocr
ocr = ddddocr.DdddOcr(show_ad=False)              # 实例化
with open('a2.png', 'rb') as f:     # 打开图片
    img_bytes = f.read()             # 读取图片
res2 = ocr.classification(img_bytes)  # 识别

print(res2) 
with open('a3.png', 'rb') as f:     # 打开图片
    img_bytes = f.read()             # 读取图片
res3 = ocr.classification(img_bytes)  # 识别
print(res3)

with open('a4.png', 'rb') as f:     # 打开图片
    img_bytes = f.read()             # 读取图片
res4 = ocr.classification(img_bytes)  # 识别
print(res4)

运行结果

giv6j
zppk
4Tskh

滑块验证码

滑块验证码场景如下场景示例

先抠出2张图片，分别为background.png 和 target.png

解决问题的重点是计算缺口的位置

import ddddocr

det = ddddocr.DdddOcr(det=False, ocr=False, show_ad=False)

with open('target.png', 'rb') as f:
    target_bytes = f.read()

with open('background.png', 'rb') as f:
    background_bytes = f.read()

res = det.slide_match(target_bytes, background_bytes, simple_target=True)
print(res)

运行结果

{'target_y': 0, 'target': [184, 58, 246, 120]}

target 的四个值就是缺口位置的左上角和右下角的左边位置

识别中文

识别图片上的文字

import ddddocr
import cv2

det = ddddocr.DdddOcr(det=True)

with open("test.png", 'rb') as f:
    image = f.read()

poses = det.detection(image)

im = cv2.imread("test.png")

for box in poses:
    x1, y1, x2, y2 = box
    im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

cv2.imwrite("result.jpg", im)

保存后的图片

标签：img,滑块,python,bytes,验证码,ddddocr,png,图片
From： https://www.cnblogs.com/yoyoketang/p/17087257.html

Python教程：OS与sys模块用法教程
一、Pythonos模块包含普遍的操作系统功能，如果你希望你的程序能够与平台无关的话，这个模块是尤为重要的。1、os.access()查看文件是否有指定权限，有则返回True否则返回fla......
Python numpy 入门系列 22 合并ndarray
ndarray的合并定义要使用的数据源 a=np.array([1,1,1])b=np.array([2,2,2])print('a',a)print('b',b) <class'n......
python pandas设置excel列宽、缩放比例
pandas设置excel列宽、缩放比例文件存在file_path='保存的文件路径'sheet_name='数据在Excel的sheet名'result=pd.DataFrame()withpd.ExcelWriter(file_path,......
python mysql直接导出excel文件
importpymysqlimportxlwt#数据库连接对象conn=pymysql.connect(host='124.71.72.144',port=3306,user='root',password="gClUjjCh2tozZY23o",db="pay",chars......
[oeasy]python0070_ 字体样式_下划线_中划线_闪动效果_反相_取消效果
字体样式回忆上次内容m可以改变字体样式0-10之间设置的都是字体效果0复原1变亮2变暗从3到10又是什么效果呢？？真的可以blink闪烁吗？......
[oeasy]python0070_ 字体样式_下划线_中划线_闪动效果_反相_取消效果
字体样式回忆上次内容m可以改变字体样式0-10之间设置的都是字体效果0复原1变亮2变暗从3到10又是什么效果呢？？真的可以blink闪烁吗？......
使用python编写简单的api接口
先安装flask模块pipinstallFlaskpy文件fromflaskimportFlask,request,jsonifyapp=Flask(__name__)@app.route('/hello_world')defhello_world():r......
python之路62 drf从入门到成神 3 序列化类常用字段和字段参数、序列化高级用法之sour
作业#原生的django中request中没有datafromdjango.shortcutsimportrender,HttpResponseimportjson#通过装饰器做,装饰器视图函数的，以后都会有requestdefwr......
Python学习笔记--面向对象--进阶
1.一切皆对象，什么是一切皆对象？python中，创建一个学生类，也就是创建了一个类型叫学生类。classStudent:def__init__(self,x,y,z):self.name=x......
Python之字典遍历元素（4种方式）
第一种：foringirl_dict={"China":"小美","Japan":"图多天光","Korea":"斯密达美"}foreveryKeyingirl_dict:print("key:"+everyKey+"value:"......

python 识别图片验证码/滑块验证码准确率极高的 ddddorc 库

前言

环境准备

快速开始

图片验证码

滑块验证码

识别中文

相关文章

赞助商

阅读排行