前言

一. 数据来源分析

明确需求, 我们采集网上什么数据内容, 在什么地方

分析我们想要高清原图在什么地方有

浏览器自带工具: 开发者工具 F12

鼠标右键点击插件选择 network 刷新网页

点击选择 Img 可以直接找到图片地址

通过搜索分析, 可以知道, 我们想要图片原图url 就在图片详情页网页源代码里面

二. 代码大概实现步骤

发送请求, 模拟浏览器对于图片目录页面发送请求

获取数据, 获取服务器返回响应数据

解析数据, 提取我们想要数据内容

发送请求, 模拟浏览器对于图片详情页url 发送请求

获取数据, 获取服务器返回响应数据

解析数据, 提取我们想要数据内容

保存数据, 把图片保存文本文件夹

对于本篇文章有疑问的同学可以加【资料白嫖、解答交流群：753182387】

代码实现

导入模块

import requests
import re

请求数据

url = f'https://m.bcoderss.com/tag/漫画/page/1/'
# 模拟浏览器 --> headers 请求头
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
# 发送请求
response = requests.get(url=url, headers=headers)

<Response [200]> 表示请求成功

解析数据, 提取我们想要数据内容

提取详情页url地址

img_info = re.findall('<li><a target="_blank" href="(.*?)" alt="(.*?)" title=".*?">', response.text)

for循环遍历把列表里面元素一个一个提取出来

for img, title in img_info:
    html_data = requests.get(url=img, headers=headers).text
    # 提取原图url地址
    img_url = re.findall('<img alt=".*?" title=".*?" src="(.*?)">', html_data)[0]

获取二进制数据

img_content = requests.get(url=img_url).content

替换特殊字符

img_title = title + img_url.split('/')[-1]
img_title = re.sub(r'[\/:*?:<>|]', '_', img_title)

保存数据

with opythonpen('img漫画\\' + img_title, mode='wb') as f:
    f.write(img_content)
print(img_url, img_title)

运行代码

标签：练手,请求,img,title,Python,url,4K,数据,headers
From： https://www.cnblogs.com/qshhl/p/16822491.html

Python的数据类型详解
1.字符串及其常用函数1.字符串中访问指定的值字符串中访问指定的值1.用[i]下标表示，从左到右顺序从0开始，从右到左顺序从-1开始2.变量[头下标:尾下标]，截取......
python画图去除横纵坐标值；设置横纵坐标名称；设置坐标轴刻度大小
1.去除横纵坐标值plt.xticks([])#去掉横坐标值plt.yticks([])#去掉纵坐标值2.设置横纵坐标名称ax1.set_xlabel('Outputclass',fontsize=24)#设置x轴名称a......
Python 根据两个字段排序中文排序汉字排序升序降序
Python根据两个字段排序中文排序汉字排序升序降序Python根据两个字段排序中文排序汉字排序升序降序Python根据两个字段排序中文排序汉字排序升序降序Pyt......
【Python基础学习】第十一节内置函数详解
Python基础学习之内置函数Python3.5版本中的68个内置函数，按顺序逐个进行了自认为详细的解析，现在是时候进行个总结了。为了方便记忆，将这些内置函数进行了如下分类：1.数学运......
解决selenium+python 打开浏览器报错 DeprecationWarning executable_path has been d
报错如下：解决方案：直接上代码如下：#-*-coding:utf-8-*-"""@Time：2022/10/2416:03@Auth：软件测试君@File：wait_demo.py@IDE：PyCharm@Motto：ABC(AlwaysBeCod......
人家网站都免费了，你还用Python去爬？
⛳️实战场景这次实战的目标是一个叫做猫肯的字体站点，该站点所有的字体都是免费可商用的，所以为什么还要去下载呢？答案是练手，借免费站点学习爬虫，......
python校验各国手机号格式是否正确
下载库phonenumbersgithub地址defverify_phone_number(phone_number:str)->(bool,int):"""校验各国手机号格式"""z=phonenumbers.parse(ph......
莫烦python的tf神经网络训练例子（1）
importtensorflowastfimportnumpyasnp#导入有关数学的包#随机生成一些数据createdatax_data=np.random.rand(100).astype(np.float32)y_data=x_data*0.......
Python基础之Python注释，变量
注释在Python中有两种形式：单⾏注释与多行注释☆单⾏注释单⾏注释只能注释一行内容，基本语法：#注释内容☆多⾏注释多行注释可以注释多行内容，常用于代码块......
python渗透测试入门——基础的网络编程工具
《Python黑帽子——黑客与渗透测试编程之道学习》这本书是我在学习安全的过程中发现的在我看来十分优秀的一本书，业内也拥有很高的评价，所以在这里将自己的学习内容分享出来......

Python获取手机4K壁纸，一个入门练手的案例

前言

一. 数据来源分析

二. 代码大概实现步骤

对于本篇文章有疑问的同学可以加【资料白嫖、解答交流群：753182387】

代码实现

导入模块

请求数据

解析数据, 提取我们想要数据内容

保存数据

运行代码

相关文章

赞助商

阅读排行