首页 > 其他分享 >百度中文点选验证码研究

百度中文点选验证码研究

时间:2023-09-12 21:32:03浏览次数:51  
标签:点选 中文 img format base64 验证码 str img2 百度

之前百度都是只有旋转验证码,最近总是出现中文点选验证码。而且中文数量比较多,大图中有固定的7个中文字符需要识别。

我首先想到使用通用的中文识别,当时我尝试了很多出名的中文识别但是效果都非常差,基本上全错,完全是不可用的状态。

没有办法,只有自己来训练识别模型了。由于中文种类非常多,常用中文就有3500个左右,所以标注数据量非常巨大,经过了两个月的标注,现在终于有了一些成效。起码比通用中文识别强几倍,首先我们来看看我训练的效果。

百度中文点选验证码研究_人工智能

百度中文点选验证码研究_深度学习_02

通过两个月没日没夜的标注,一共标注了10万个样本,目前单字的正确率在85%左右。之后也会继续标注提高正确率。

现在提供了免费的识别接口供大家测试调用,接口调用代码如下:

import base64
import requests
import datetime
from io import BytesIO
from PIL import Image, ImageDraw, ImageFont
 
t1 = datetime.datetime.now()
 
#PIL图片保存为base64编码
def PIL_base64(img, coding='utf-8'):
    img_format = img.format
    if img_format == None:
        img_format = 'JPEG'
 
    format_str = 'JPEG'
    if 'png' == img_format.lower():
        format_str = 'PNG'
    if 'gif' == img_format.lower():
        format_str = 'gif'
 
    if img.mode == "P":
        img = img.convert('RGB')
    if img.mode == "RGBA":
        format_str = 'PNG'
        img_format = 'PNG'
 
    output_buffer = BytesIO()
    # img.save(output_buffer, format=format_str)
    img.save(output_buffer, quality=100, format=format_str)
    byte_data = output_buffer.getvalue()
    base64_str = 'data:image/' + img_format.lower() + ';base64,' + base64.b64encode(byte_data).decode(coding)
 
    return base64_str
 
# 加载图片
img1 = Image.open(r'E:\Python\lixin_project\lixin\static\img\baidu_zwdx_img\img1\1693142399158.jpg')
img2 = Image.open(r'E:\Python\lixin_project\lixin\static\img\baidu_zwdx_img\img2\1693142399158.png')
 
# 图片转base64
img1_base64 = PIL_base64(img1)
img2_base64 = PIL_base64(img2)
 
# 验证码识别接口
url = "http://www.detayun.cn/openapi/verify_code_identify/"
data = {
    # 用户的key
    "key":"9sdPsk5Czyj4vhXujuJw",
    # 验证码类型
    "verify_idf_id":"29",
    # 大图
    "img1": img1_base64,
    # 小图
    "img2": img2_base64,
}
header = {"Content-Type": "application/json"}
 
# 发送请求调用接口
response = requests.post(url=url, json=data, headers=header)
 
# 获取响应数据,识别结果
print(response.text)
print("耗时:", datetime.datetime.now() - t1)

想要了解更多信息,请访问:得塔云

标签:点选,中文,img,format,base64,验证码,str,img2,百度
From: https://blog.51cto.com/u_16189926/7448734

相关文章

  • 删除百度网盘windows右键菜单的脚本
    以下代码保存为任意文件名.bat,然后右键“以管理员身份运行”即可regdeleteHKEY_CLASSES_ROOT\Directory\shellex\ContextMenuHandlers\YunShellExt/fregdeleteHKEY_CLASSES_ROOT\*\shellex\ContextMenuHandlers\YunShellExt/fpause     原文链接https://zhu......
  • 百度飞桨(厦门)人工智能产业赋能中心签约,共创人工智能产业协同服务新生态
    9月8日,第二十三届中国国际投资贸易洽谈会在厦门正式开幕。当日,厦门市思明区政府和火炬管委会,与百度正式签约,联手共建百度飞桨(厦门)人工智能产业赋能中心。思明区委书记林重阳,厦门市工信局副局长、大数据局长许文恭,厦门市科技局副局长黄颖,火炬高新区党工委副书记、管委会副主任林卫东......
  • 后端生成验证码图片
    后端生成验证码一、前端请求/***获取验证码*/exportasyncfunctiongetCaptcha(){//这是前端的请求,用的是axiosconstres=awaitrequest.get('/Commons/getCaptcha');if(res.data.code==200){returnres.data.data;}returnPromise.reject......
  • 百度开源上传组件webuploader
    //上传多文件   functionUploadMultiFile(){       varuploader=WebUploader.create({           //选完文件后,是否自动上传。           auto:true,           //swf文件路径           swf:'~/Cont......
  • 百度上传插件Web Uploader
    WebUploader是由BaiduWebFE(FEX)团队开发的一个简单的以HTML5为主,FLASH为辅的现代文件上传组件。在现代的浏览器里面能充分发挥HTML5的优势,同时又不摒弃主流IE浏览器,沿用原来的FLASH运行时,兼容IE6+,iOS6+,android4+。两套运行时,同样的调用方式,可供用户任意选用。采用大文件分......
  • 百度WebUploader开源上传控件
    前言首先声明一下,我这个是对WebUploader开源上传控件的二次封装,底层还是WebUploader实现的,只是为了更简洁的使用他而已.下面先介绍一下WebUploader简介:WebUploader是由BaiduWebFE(FEX)团队开发的一个简单的以HTML5为主,FLASH为辅的现代文件上传组件。在现代的浏览器里面能......
  • python爬虫练习2-百度热榜
    importrequestsfromlxmlimportetreeurl='https://top.baidu.com/board?tab=realtime'headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/116.0.0.0Safari/537.36&......
  • 百度“AI智障”到AI智能体验之旅
    目录前言一、百度PLATO1.抬杠第一名2.听Ta瞎扯淡3.TA当场去世了4.智障与网友的高光时刻二、文心一言1.设计测试用例2.随意发问3.手机端约会神器三、体验总结:四、千帆大模型前言最近收到了文心一言3.5大模型的内测资格,正巧之前也体验过它的前身"百度PLATO",这下子真的让我觉得不是......
  • 百度开源网关BFE源代码阅读
    BFE是一个非常强大的七层负载均衡,与其他负载均衡存在一些显著的差异(Product,GSLB等概念),也因为这些差异所以对于没有阅读其代码的用户在入门阶段非常的不友好,再者就是官方文档仅是一个查阅文档,这个查阅文档会的看得懂,不会的看不懂,对于教会用户怎么用实在是没有太多的帮助,所以笔......
  • selenium 解析验证码(普通的字符数字的验证码),解决方式:先将验证码保存为图片,然后使用ddd
     fromseleniumimportwebdriverfromselenium.webdriver.common.byimportByfromPILimportImagefromioimportBytesIOimportpytesseractimporttimeimportddddocrfromselenium.webdriver.supportimportexpected_conditionsfromselenium.webdriver.sup......