python练习-爬虫(续)

时间：2023-06-26 17:26:07浏览次数：39

标签：username 1.1 python ip image 练习爬虫 gb2312 data

接下来就是查询数据了。

# 识别图片中的文字
#image = Image.open('captcha.png')
image = Image.open('G:\Python爬虫\captcha.png')
code = pytesseract.image_to_string(image)

# 从用户输入获取用户名、身份证号码和验证码
username = 'XXX'  
# input("请输入用户名：")
id_card = '123456789012345678'
#input("请输入身份证号码：")
ip = '1.1.1.1'
# 构造查询所需的数据
data = {
    "pusername":username,
#username.encode('utf-8'),
#urllib.parse.quote(username),
    "idcard": id_card,
    "ip":ip,
    "verifycode": code.strip()
}
print(data)
# 发送查询请求
response = requests.post("http://xyz/xyinfo.do?method=query", data=urllib.parse.urlencode(data, encoding='gb2312'), headers=headers4query)
# 输出查询结果
print(response.text)
print(data)

这里一个坑，请注意：

通过抓取包，发现发送的：

pusername=%D0%EC%123A%E131C%C120%B121C&idcard=323123123121231231&ip=1.1.1.1&verifycode=3313

是gb2312。在程序中也要进行对应转换。语句如下：

response = requests.post("http://xyz/xyinfo.do?method=query", data=urllib.parse.urlencode(data, encoding='gb2312'), headers=headers4query)

同时注意header中：'Content-Type': 'application/x-www-form-urlencoded;charset=gb2312',不要改成其它格式。

goodluck

标签：username,1.1,python,ip,image,练习,爬虫,gb2312,data
From： https://www.cnblogs.com/usegear/p/17506218.html

python函数的高阶使用
一：*强制位置传参和/分界线强制位置参数可以使用*进行标记，*后面的参数将成为强制位置参数，它们必须按照位置传递给函数，而不能使用关键字传递。/用于标记位置参数和关键字参数之间的分界线，即/之前的参数只能通过位置传递，/之后的参数可以通过位置或关键字传递。示例1：使......
标准化互信息NMI计算步骤及其Python实现
假设对于17个样本点(v1,v2,...,v17)进行聚类：某一种算法得到聚类结果为：A=[12111112222311333]标准的聚类结果为：B=[11111122222233333]问题：需要度量算法结果与标准结果之间的相似度，如果结果越相似NMI值应接近1；如果算法结果很差......
Python中进行字符串拼接的常用方法！
在Pyhon编程语言中，字符串拼接是一种十分常见的操作，通常用于将文本片段连接起来形成一段完整的字符串，然而很多人在进行字符串拼接操作时不可避免地会遇到一些错误，那么该如何解决呢?以下是详细的内容：1、使用"+"号进行字符串拼接在Python中，使用"+"号进行字符串拼接是最常......
一杯咖啡的时间带你了解Python中的类
1.定义类您可以使用class关键字在Python中定义一个类。下面是一个简单的类定义示例:classPerson:def__init__(self,name,age):self.name=nameself.age=agedefsay_hello(self):print("Hello,mynameis",self.name,"andIam",......
Python 实现将 Markdown 文档转换为 EPUB 电子书文件
Python实现将Markdown文档转换为EPUB电子书文件已有转换工具要将Markdown文档转换为EPUB文件，可以使用一些工具和软件。以下是一些常见的方法：使用在线转换工具：有一些在线转换工具可以将Markdown文件转换为EPUB格式，如PandocOnline。只需要将Markdown文件上传......
Python如何将某文件夹下的文件名称输出到.txt文件中
importos#os.listdir()方法获取文件夹名字，返回数组defgetAllFiles(targetDir):listFiles=os.listdir(targetDir)returnlistFilesfiles=getAllFiles(r"E:\UEtest\sla\精装\sla文件池\skp-10个")#写入list到txt文件中withopen(r"E:\UEtest\sla\精装\sla文件池\tes......
Python3 windows下多环境管理
windows下Python多环境隔离，每个项目拥有独立的依赖库，即site-packages。 ubuntu下通过 Anaconda 进行多环境操作， windows下往往直接下载安装包安装了（之前一直没去解决单个环境）现在整理下如下，方式一（略，安装包有点大）1.官网下载Anaconda安装包下载地址：https://www......
Linux修改python源
在运行pipinstallselenium或者安装其他三方库的时候遇到如下报错：Defaultingtouserinstallationbecausenormalsite-packagesisnotwriteableWARNING:pipisconfiguredwithlocationsthatrequireTLS/SSL,howeverthesslmoduleinPythonisnotavailable.Loo......
Python爬虫完整代码模版
以下是一个基本的Python爬虫代码模板，可以根据需要进行修改：importrequestsfrombs4importBeautifulSoup#设置请求头，模拟浏览器访问headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/58.0.3029.110......
您需要配置好的 Python 2 SDK 来渲染 Epydoc docstring
今天给代码写注释，写完以后，鼠标放在方法上注释显示异常。我发现是因为我注释的格式不对。把@改成:后问题解决......

python练习-爬虫(续)

相关文章

赞助商

阅读排行