首页 > 编程语言 >python爬虫练习1-百度图片

python爬虫练习1-百度图片

时间:2023-09-08 13:12:57浏览次数:37  
标签:__ img headers python get 爬虫 title1 url 百度

 写了一个简单的爬图片练习

import requests
import os

def bd_img(title1):
    url = f'https://image.baidu.com/search/acjson?tn=resultjson_com&logid=10755979809828115852&ipn=rj&ct=201326592&is=&fp=result&fr=&word={title1}&queryWord={title1}&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&expermode=&nojc=&isAsync=&pn=60&rn=30&gsm=3c&1693994902388='
    headers = {
        'Cookie': 'BIDUPSID=4D5BFD2C8ECBF122BA1A0F786EC0383B; PSTM=1690680395; BAIDUID=5689C24BF18912C47F7B8AFF8FFEB272FG=1; MCITY=-356%3A; BDUSS=VZTVZuemFoSllLT25SS0d3Z2pRQXhzfmRyLTRvanlWY3NFU0tmbDdTVTQ5QWhsRVFBQUFBJCQAAAAAAAAAAAEAAADpE9JKwfTD-7rDwvAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADhn4WQ4Z-FkZm; BDUSS_BFESS=VZTVZuemFoSllLT25SS0d3Z2pRQXhzfmRyLTRvanlWY3NFU0tmbDdTVTQ5QWhsRVFBQUFBJCQAAAAAAAAAAAEAAADpE9JKwfTD-7rDwvAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADhn4WQ4Z-FkZm; BDORZ=FFFB88E999055A3F8A630C64834BD6D0; H_PS_PSSID=26350; BAIDUID_BFESS=5689C24BF18912C47F7B8AFF8FFEB272',
        'Referer': 'https//www.baidu.com/',
        'Upgrade-Insecure-Requests': '1',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.69'
    }
    img = requests.get(url,headers=headers).json().get('data')
    if not os.path.exists('./bdimg'):
        os.mkdir('./bdimg')
    num = 1
    for i in img:
        img_url = i.get('thumbURL')
        if img_url:
            img_re = requests.get(img_url, headers=headers)
            with open('./bdimg/{}_{}.png'.format(title1,num),'wb') as f:
                f.write(img_re.content)
            print("下载完成")
        num +=1

if __name__ == '__main__':
    title1 = input("请输入图片名称:")
    bd_img(title1)

 

标签:__,img,headers,python,get,爬虫,title1,url,百度
From: https://www.cnblogs.com/fanpush/p/17687300.html

相关文章

  • 深入理解 Python and 逻辑运算符(踩坑)
    1.引子defenabled()->bool:a=["a,"b"] b=Truec=Falsereturn(bandc)or(banda)以上代码返回什么?实际生产项目踩到的坑,也怪自己没理解到未,才疏学浅!!!想当然的以为python自己会做真值判断了。其实真值判断是在if条件语句时会生效,但在普通的......
  • python模拟用户登录
    python模拟用户登录目录python模拟用户登录一、授权认证二、Cookie认证一、授权认证1、HTTP基础认证importrequestsfromrequests.authimportHTTPBasicAuthurl="https://xxx.xxx.xxx/"username="admin"password="admin"#HTTP基础认证response=requests.ge......
  • python中元组的解包用法,以及 *在方法中的使用方法
    下面是关于python中*的用法详解1.*做法乘法运算符在python中,*作为乘法运算符是使用,用来进行两个数的乘法运算。示例代码:a=3b=4c=a*bprint(c)#12 2.*作为函数的可变参数(是元组的形式导入)单星号(*):*args。将所有参数以元组(tuple)的形式导入双星号(**):**kwargs。将参......
  • 【Python&GIS】矢量数据投影转换(坐标转换)
    ​    之前跟大家分享过面矢量数据投影转换和点矢量数据投影转换,但博主在日常工作的过程中发现之前分享的面矢量数据投影转换有时候会出现错误,或者转换后的效果不好。再一次偶然的过程中发现了新的坐标转换(投影转换)函数,所以今天和大家分享一下,大家在进行坐标转换时可以......
  • 【Python&RS】基于GDAL修改栅格数据的DN值
    ​    遥感工作者离不开栅格数据,有时候我们可能需要修改栅格数据的值,但ENVI和ArcGIS中并没有直接修改DN值的工具,只有栅格计算器、Bandmath这些工具去计算整个波段的值,或者EditClassificationImage工具可以修改ENVI分类后的像元值,但这个工具只对分类格式有效,博主整不......
  • 【题解】《PTA-Python程序设计》题目集分享
    第1章-1从键盘输入两个数,求它们的和并输出(30分)本题目要求读入2个整数A和B,然后输出它们的和。输入格式:在一行中给出一个被加数在另一行中给出一个加数输出格式:在一行中输出和值。输入样例:在这里给出一组输入。例如:18-48输出样例:在这里给出相应的输出。例如:......
  • Python学习日记 京东工单信息获取
    importrequestsimportcsvimportrandomf=open('vc.csv',mode='a',encoding='utf-8',newline='')csv_writer=csv.DictWriter(f,fieldnames=['客户姓名','订单编号','pin'])csv_wri......
  • 【HTTP爬虫ip实操】智能路由构建高效稳定爬虫系统
    在当今信息时代,数据的价值越来越受到重视。对于许多企业和个人而言,网络爬取成为了获取大量有用数据的关键手段之一。然而,在面对反爬机制、封锁限制以及频繁变动的网站结构时,如何确保稳定地采集所需数据却是一个不容忽视且具挑战性的问题。幸运的是,我们可以利用现代技术中强大工具—......
  • Python FastAPI 异步获取 Neo4j 数据
    前提条件先往Neo4j里,准备数据参考:https://www.cnblogs.com/vipsoft/p/17631347.html#创建传承人搭建FastAPI项目:https://www.cnblogs.com/vipsoft/p/17684079.html改造utils/neo4j_provider.py增加了暴露给外面调用的属性,同时提供了同步和异步执行的驱动#!/usr/bin/py......
  • Python实操:内存管理与优化策略
    在Python开发过程中,合理有效地管理和优化内存使用是提高程序性能和效率的关键。本文将深入探讨Python中的内存管理机制,并分享一些实用的优化策略和具体操作步骤,帮助您更好地利用资源、减少内存占用并提升代码执行速度。一、了解Python的垃圾回收机制垃圾回收是自动处理不再被......