源码
#!/usr/bin/python
import random
import requests
import re
import time
for num in range(2,212):
# url网页地址
url = "https://pic.netbian.com/new/index_"+str(num)+".html" #需要爬取图片的网页地址
page = requests.get(url).text #得到网页源码
# print(page) #src="(.+?.jpg)"
res = re.compile(r'<a href="(/tupian/.+?.html)"')#运用正则表达式过滤出图片路径地址
reg = re.findall(res, page) #匹配网页进行搜索出 图片地址 数组
# print(reg)
#循环遍历下载图片
num = 1
for i in reg:
url = "https://pic.netbian.com/"+i
page1 = requests.get(url).text #得到网页源码
# print(page) #src="(.+?.jpg)"
res1 = re.compile(r'<img src="(.+?.jpg)"')#运用正则表达式过滤出图片路径地址
reg1 = re.findall(res1, page1) #匹配网页进行搜索出 图片地址 数组
# print(reg1)
reg1 = "https://pic.netbian.com/"+reg1[0]
a = requests.get(reg1)
f = open("F:/Users/MrFlySand/Desktop/py图片/img/%s.jpg"%(num+random.random()), 'wb')#以二进制格式写入img文件夹中
f.write(a.content)
f.close()
print("第%s张图片下载完毕"%num)
num = num+1
time.sleep(0.5)
戳下方链接,后台回复“交流群”获取更多趣味代码
https://mp.weixin.qq.com/s/bS1f7p9t7chj9wzHaR96mQ