python3爬取网页图片

时间：2022-11-08 22:03:13浏览次数：50

标签：网页 img url ele 爬取 537.36 lis import python3

爬取url网页里面所有的图片，把url填上就能用了，下面的自己看着改改进行筛选。

import requests
import re
import time
import random
import os
def Find(string):
    # findall() 查找匹配正则表达式的字符串
    st = re.findall('src="(.*?)"',string,re.S)
    return st
url = ''

user_agent= "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"
headers = {"User-Agent":user_agent}
headers2 = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36 ",
}
os.chdir('D:\\temp')
html_r = requests.get(url,headers = headers2)

#print(html_r.text, type(html_r.text))
lis = Find(html_r.text)
print(len(lis), lis)

name = 'xxxx'
i = 0
for ele in lis:
    i += 1
    if len(ele) > 20 and ele.startswith('https://'):
        img_url = ele
        img = requests.get(img_url, headers = headers2)
        savename = name + str(i) + '.jpg'
        with open(savename, 'wb') as w:
            w.write(img.content)
        time.sleep(random.randrange(4, 6))

标签：网页,img,url,ele,爬取,537.36,lis,import,python3
From： https://www.cnblogs.com/smatrchen/p/16871373.html

常用网页播放器代码
我们在网页上看到的播放器无外乎WMP/RealOne/MacromediaFlashPlayer,其他的无非是面板不同，或者添加了其他控件，对于计算机上安装的一些播放器也都是编码和解码器的整合，其......
python3-pycharm TAB键转换为4个空格
pycharm默认Tab为4个空格1【File】→【setting】编辑2.【Editor】→【CodeStyle】→【Python】编辑二、pycharm空格显示【General】→【Appearance】→Showwhitespace......
python3 计算SSL 证书过期时间
计算网站SSL证书距离当前还有多少天过期importsocketimportsslimportdatetimeimporttimedefget_domain_cert(domain):socket.setdefaulttimeout(5)......
mac(intel)安装python3，pycharm配置python3
mac自带python2.7，使用brew下载python3太慢经常容易失败，所以官网下载。本次安装版本为3.9.71.官网下载python3.9.7，鼠标滑到最下面，找到对应版本下载，然后一路下一步傻瓜安装......
谷歌浏览器意外关闭，如何快速恢复关闭的网页
????声明:作为全网AI领域干货最多的博主之一，❤️不负光阴不负卿❤️????#专栏：#图像修复一文读懂????????Followme????，一起Get更多有趣AI????????浏览器推......
5个程序员也应该掌握的网页设计技能
英文| https://javascript.plainenglish.io/5-web-design-skills-every-developer-should-master-d4ecda8d095a翻译|杨小二一个好的网站包括两个方面，视觉设计效果和网......
「前端游戏开发体验」我用react实现网页游戏的全过程（包括规则设计）
关于游戏的灵感来源今年元宵节的时候，我玩的小游戏里面有限时任务，可以解锁节日限定物品，于是那几天我玩的很欢乐很积极。端午节到来之前，我想玩一下身份转换，从玩家转换到游戏策......
网页翻译 iTranslator 浏览器插件
iTranslator2.2.0浏览器插件版，免费的多功能网页翻译油猴脚本浏览器插件本文转自https://www.hezibuluo.com/159129.html，如有侵权，请联系删除。iTranslator是一款免......
网页的头部开发01
样本：第一步：分析网页的布局情况：1.板子盒子为1200*42的盒子水平居中对齐，上下给一个margin值就可以。2.版心盒子里面包含二号盒子logo3.版心盒子里面包含三号盒子nav......
【C#爬虫】使用C# 进行bing翻译爬取
首先我们打开bing翻译页面并将浏览器控制台打开编辑然后在文本框随便输入看右侧工作台中网络里面请求的变化经过多次输入编辑可以看到每次输入字符后都会......

python3爬取网页图片

相关文章

赞助商

阅读排行