盘点一个ddddocr实现登录的实战案例

时间：2023-02-15 21:44:42浏览次数：31

标签：实战 session captcha url res ddddocr headers 盘点 text

大家好，我是皮皮。

一、前言

前几天在Python白银交流群【空翼】问了一个Pyhton网络爬虫的问题，这里拿出来给大家分享下。

二、实现过程

一开始看上去并不能登录，找不到原因在哪，后来【甯同学】帮忙搞定了，代码如下：

# -*- coding: utf-8 -*-
# @Author  : KongYi
# @Time    : 2022/12/3 13:49
import hashlib
import re
import requests
import ddddocr

baseurl = 'http://zhjw.scu.edu.cn/login'
session = requests.Session()
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36',
}
res = session.get(url=baseurl, headers=headers)

token = re.findall('<input type="hidden" id="tokenValue" name="tokenValue" value="(.*?)">', res.text)[0]

print(token)

res = session.get('http://zhjw.scu.edu.cn/img/captcha.jpg')
with open('captcha.jpg', 'wb') as f:
    f.write(res.content)
    f.close()

ocr = ddddocr.DdddOcr()
with open('captcha.jpg', 'rb') as f:
    img_bytes = f.read()
captcha_text = ocr.classification(img_bytes)

print(captcha_text)

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}

m = hashlib.md5()
m.update('Chenxiao12345!'.encode())
ctx = m.hexdigest()
print(ctx)

login_url = 'http://zhjw.scu.edu.cn/j_spring_security_check'
data = {
    'tokenValue': token,
    'j_username': '2020141410129',
    'j_password': ctx,
    'j_captcha': captcha_text
}

res = session.post(url=login_url, data=data, headers=headers)

jsonurl = 'http://zhjw.scu.edu.cn/'
res = session.post(url=jsonurl, headers=headers)
print(res.text)

代码运行之后，顺利地实现了网页登录。

顺利地解决了问题。

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Pyhton网络爬虫的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【空翼】提问，感谢【甯同学】给出的思路和代码解析，感谢【Python狗】等人参与学习交流。

标签：实战,session,captcha,url,res,ddddocr,headers,盘点,text
From： https://www.cnblogs.com/dcpeng/p/17124816.html

读Java实战（第二版）笔记10_函数式编程的技巧
1. 设计原则1.1. 将所有你愿意接受的作为参数的函数可能带来的副作用以文档的方式记录下来1.2. 最理想的情况下你接收的函数参数应该没有任何副作用1.3. 延迟数据......
#yyds干货盘点#Vue项目中的样式 v-deep、/deep/ 和 >>>
在 Vue 项目的开发中，很多人都因为想要限制 CSS 样式的作用范围（避免样式污染的问题）去使用 scope 属性。在实际情况中scope又会......
#yyds干货盘点# LeetCode程序员面试金典：变位词组
题目：编写一种方法，对字符串数组进行排序，将所有变位词组合在一起。变位词是指字母相同，但排列不同的字符串。注意：本题相对原题稍作修改示例:输入:["eat","tea","tan","ate"......
#yyds干货盘点# LeetCode面试题：最长公共前缀
1.简述：编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串 ""。示例1：输入：strs=["flower","flow","flight"]输出："fl"示例2：输入：strs=["......
关于Disruptor的实战应用
首先，需要引入Disruptor的依赖库，可以在Maven中添加如下依赖：<dependency><groupId>com.lmax</groupId><artifactId>disruptor</artifactId><version>3.......
Explain详解与索引最佳实战
Explain用途分析mysql中sql语句的执行计划Explain变种5.7之前用explain加上extended在分析结果中会多出一列filtered5.7之前用explain加上partitions在分析的结果中会......
高效、优雅的对象copy之MapStruct入门到精通，实战踩坑版
一、前言大家在开发中，最让人头疼的就是：对象之间的拷贝，前端的VO和数据库的Entity不一致！性能最好的就是手动set，主要是枯燥且无技术含量，不仅耗费大量时间而且很容易出错；所......
读Java实战（第二版）笔记09_函数式的思考
1. 规则1.1. 传递参数，返回结果1.1.1. 异常和中断都不算返回结果1.2. 减少共享的可变数据结构能帮助你降低维护和调试程序的代价2. 耦合性2.1. 软件系统中各组......
电商网站Web自动化测试实战（编写京东搜索脚本python+selenium框架）
电商网站Web自动化测试实战（编写京东搜索脚本）1，打开京东页京东首页地址：https://www.jd.com/，故进入京东首页如下：2，打开浏览器开发者模式定位元素前需先打开浏览器开发者......
#yyds干货盘点#如何在 Linux 下删除分区
有时，您可能希望删除Linux系统上的一些磁盘分区，以恢复或重新获得一些存储空间。只需几个简单的步骤，就可以在命令行上轻松完成这一任务。使用fdisk工具删除一个标准分区fd......

盘点一个ddddocr实现登录的实战案例

一、前言

二、实现过程

三、总结

相关文章

赞助商

阅读排行