python爬虫之抓取高清壁纸

时间：2023-01-05 10:32:57浏览次数：40

标签：img get python list 爬虫抓取 url print headers

对于很多电脑玩家喜欢给自己电脑装饰精美的壁纸，但是碍于图片大小清晰度等原因无法找到合适的，今天我就利用爬虫技术手段，现实高清壁纸抓取，需要的小伙伴可以一起过来看看！

# coding=utf-8

import os.path
import requests
import parsel

def get_address():
    """
    获取url地址
    :return:
    """
    dirname = 'photo/'

    if not os.path.exists(dirname):
        os.mkdir(dirname)

    for page in range(2, 11):
        print(f'=====================正在爬取第{page}页内容========================')
        url = f'http://www.netbian.com/1920x1080/index_{page}.htm'

        # url = 'http://www.netbian.com/1920x1080/'
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36 Edg/99.0.1150.46'
        }
        res = requests.get(url, headers=headers)
        res.encoding = res.apparent_encoding

        selector = parsel.Selector(res.text)
        href = selector.css('.list li a::attr(href)').getall()

        # <img src="http://img.netbian.com/file/2022/0326/small003835uYAUe1648226315.jpg" alt="绿色草地 美女刘亦菲2022年4月日历桌面壁纸护眼">

        url_lis = selector.css('.list li')
        for lis in url_lis:
            title = lis.css('b::text').get()
            # 取出广告页面
            if title:
                list_url = 'http://www.netbian.com' + lis.css('a::attr(href)').get()
                # print(list_url)
                res1 = requests.get(list_url, headers=headers)
                # print(res1.text)
                selector1 = parsel.Selector(res1.text)
                img_url = selector1.css('.pic img::attr(src)').get()
                # print(img_url)

                # 保存图片
                img_content = requests.get(url=img_url).content
                with open('photo/' + title + '.jpg', 'wb') as f:
                    f.write(img_content)
                    print(title, img_url)

get_address()

标签：img,get,python,list,爬虫,抓取,url,print,headers
From： https://blog.51cto.com/u_13488918/5989497

极客编程python入门-内建模块datetime
datetimedatetime是Python处理日期和时间的标准库。获取当前日期和时间>>>fromdatetimeimportdatetime>>>now=datetime.now()#获取当前datetime>>>print(now)2015......
Python爬虫常用哪些库？
经常游弋在互联网爬虫行业的程序员来说，如何快速的实现程序自动化，高效化都是自身技术的一种沉淀的结果，那么使用Python爬虫都会需要那些数据库支持？下文就是有关于我经常使用的......
Python 实现Ping命令状态检测
ping是一种因特网包探索器，用于测试网络连接量的程序，Ping是工作在TCP/IP网络体系结构中应用层的一个服务命令，主要是向特定的目的主机发送ICMP请求报文，测试目的站是否可达......
Python源设置以及国内源地址
#########国内源地址##############腾讯开源镜像站http://mirrors.cloud.tencent.com/pypi/simple豆瓣http://pypi.douban.com/simple/网易开源镜像站http://mirrors.1......
Python学习day02
一、用户交互1.猜年龄death_age=80name=input("yourname:")age=int(input("yourage:"))print("yourname"name)print("youcanstilllivefor"death_age-age"yea......
python中模块的__all__属性详解
python中模块的__all__属性详解python模块中的__all__属性，可用于模块导入时限制示例1普通类#kk.pyclassA():def__init__(self,name,age):self.name......
python组合数据类型（容器数据类型）
全！python组合数据类型（容器类型）组合数据类型为python解释器中内置的标准类型，包含组合数据类型在内的内置标准类型有：数字、序列、映射、类等等序列类型三种基本序列类......
python中的copula：Frank、Clayton和Gumbel copula模型估计与可视化|附代码数据
全文下载链接：http://tecdat.cn/?p=23646最近我们被客户要求撰写关于copula的研究报告，包括一些图形和统计输出。你可能会问，为什么是copulas？我们指的是数学上的概念。简单......
python100个知识点
1 十转二将十进制转换为二进制：>>> bin(10)'0b1010'2十转八十进制转换为八进制：>>> oct(9)'0o11'3十转十六十进制转换为十六进制：>>> hex(15)'0xf'4 字符串......
python用回归、arima、随机森林、GARCH模型分析国债期货波动性、收益率、价格预测
全文链接：http://tecdat.cn/?p=31123原文出处：拓端数据部落公众号分析师：YihanMao解决方案本文为客户提供咨询，让个人购买人员了解美国国债期货的特性，以便于进行个人投资......

python爬虫之抓取高清壁纸

相关文章

赞助商

阅读排行