首页 > 编程语言 >【python】18行代码带你采集国外网小姐姐绝美图片

【python】18行代码带你采集国外网小姐姐绝美图片

时间:2022-10-15 16:45:27浏览次数:67  
标签:小姐姐 img get python 18 bookmark url requests data

前言

嗨喽~大家好呀,这里是魔王呐 !

 

  我又来更新小姐姐网站,批量采集得办法拉~

让我们一起来学习吧~

开发环境:

  • Python 3.8
  • Pycharm

模块使用:

第三方模块 需要安装 在cmd里面 进行 pip install requests / parsel

  • requests

如何安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
  2. 在pycharm中点击Terminal(终端) 输入安装命令

代码

获取源码链接点击

import requests

headers = {
    'cookie': 'csrftoken=1fbccfe7be3950546f7138f25091d746; _routing_id="69be489d-566e-4ba3-9b0c-0101e5cc8a2e"; sessionFunnelEventLogged=1; g_state={"i_l":0}; _auth=1; _pinterest_sess=TWc9PSZEQ1FEMWt1S05WRTZJa1U1eFh6ZlpEdnc5OXRqdUlLZE9VemlNT3pZWEgwOFM3VDVNZkowcHVFSXRtai9LWWNXbjF3c3dPL05aYUNaeFc4RlpscTVJaVFQbUVaUllCKzNCTGY2OTFGWUdYZlJ5cHUwRUJxREJENnVCdlFpMWVYU3hiSUdaZElkRzBndEZ4VHB3VC9KK09Qd0RqbWYrcjRBbHZ4L2RGWW51NjdJMnBYQlhxV2RMdFZpNk1iQ1BwblNJWnVxQmNhclM4NFJkalpMU3hKWEsvUUlLdS8yMVNlK3JTUkZROEVtaGZkU3p6bElHd3JVdkJldUNTN1RISy9Qc3kyZmN5cmZBVk8veFZVNFVoSDZ4dkliK0NWSml0Z2ZhWU5mTUNMK0Jna0NMc3AwdkZZOXhHVC9qVVc0T05OTG1iUE5va09OY2xBMERBUDgvNXQzdnFyVVBVVnczNlhENnJjK3NYdFllZ3Y1bUhyaVBtcW8zS29RZHI0dDdvQUJUdzF0UU1idjNPb2w3UUZsaUpNcitXaU94c0ZzWldwdXBZTjJIcHVIb1Y5NmtmbUVIa09vOVFkKzRnMXZSZ2lFM0dZaktNSUtBNzdHQVMvVEgxaWhWcjJEc3FjMUF6QzdWU2tCNzVmYS9VNTVrV1FqeE5WbHV3QzRhRTlaZ0drVjNuVUwvSUNvc3hMUlNSZ2RwMzI4VUpoN0JndXN4QUNMR2lVa2xXRklJME9uNHBwd3VvMzM5a0ZjbHRXZVVobXhxUTdtdDdrR3dyKzh1dWlITHRISlhuM0U2RnZRLzhzS2lXYUxCbWJxMlRlYk5ZNnNQK2o1WlhIWVNTQzJOdk5Qc0wwdllCMWhHQ3FmOTJ4aFRjWkh5ZUJvYk0xS1J0Vy80UUpWQXF4bGdVOElCRm1lM2NBNVB5ejlNY0ZTTE9Jc25GM09XNW9jekIyd1NRMFJ2Y1NhU2kySDJFRGI5SmIzWWFiK01DVEN5ZmRtdlJzb0p5Y2NxeTdsTFE0MnlPc0RlT1hlRDg4RzI0Qi9kREJGMlJmZHBnPT0mSlFoTnZSdXVhQXo1UWt0UmVxRGZxYWtlWDlJPQ==; _b="AWhINcS3C8VBV4G03jvnkIaZom1KWxg8XVIgP4mExnEZvkkYv/AuTCOEObC+45sj5iQ="; cm_sub=none',

 



    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
}
def get_next(bookmark):
    url = 'https://www..com/resource/UserHomefeedResource/get/?source_url:/&{"options":{"field_set_key":"hf_grid","in_nux":false,"in_news_hub":false,"prependPartner":false,"static_feed":false,"bookmarks":["'+bookmark+'"],"no_fetch_context_on_resource":false},"context":{}}&_=1664260179856'

 

因链接太长,CSDN又不能出现网站链接

所以上面得代码我就把它删了,大家可以按照下面得图片把它添加一下

    json_data = requests.get(url, headers=headers).json()
    bookmark = json_data['resource_response']['bookmark']
    for data in json_data['resource_response']['data']:
        img_url = data['images']['orig']['url']
        print(img_url)
        img_name = img_url.split('/')[-1]
        img_data = requests.get(img_url).content
        with open(f'img/{img_name}', mode='wb') as f:
            f.write(img_data)
    get_next(bookmark)

get_next('Y2JVSG80T1ZFd1JrSlJhMFpDVVZWR1FsRlhPVUpSVjJSQ1VWVkdXbFJxYkhaa2EwWlVVVEJHUWxKRlJrSlJWVVpJVVZjNVFsRnJaM1pNZVRoMlRIazRka3d5ZUZWUk1FWkNVakJHUWxGVlJraFZXRTVDVVc1a1FsRlZSa0pOU0doUFlXeHJkMVJYY0Zwa01ERlZXVE53VUZKRmF6QlJNbVJDVTFkWmRreDVPSFpNZVRoMlN6RmFUbEZZZUcxT1JHTTBXbXBXYWs1cVdtMVphbXQ0VFcxTk5VNUhXVFZaYWxKdFRrZEpNVTFxVFhwWlYwWm9XWHBGTWxsWFdtcGFWRnBwVGtkUk1VMHlVWGxPUjBsNVdWZE5NMXBFUW1oYVJGazFUa1JWTWs1dFZUSm1SVFZHVmpOM1BRPT18VUhvNU5WUlhWbHBNTTBaTlZsTTRkbHA2TVdaTmFsWm1URlJHT0ZwWFNURlBSMXB0VFVkRk1VNTZaekZQUkVreldXcENiVmxxVm10YWFsSnRXV3BCZWxsdFdUUk9lbFUwV2tSb2FWbFhVVEZaYWtsNVRVZFZlRTR5V21sTlJFSnJXbFJGTWxsVVdteE5lbFpyVFcxRmVVNXVlRTlTVm1RNHwwYmNhMjZkNTdmYTUzMzA0MzEzM2Y1Yzg1OGZhZjY5NjMwNTc3MDUzNGRjM2FhNDhkNDQ4ZWIzNGYxODQ5YTA4fE5FV3w=')

 

效果

接下来我们就来欣赏一下我们得成果吧~

尾语

要成功,先发疯,下定决心往前冲!

学习是需要长期坚持的,一步一个脚印地走向未来!

未来的你一定会感谢今天学习的你。

—— 心灵鸡汤

本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦

标签:小姐姐,img,get,python,18,bookmark,url,requests,data
From: https://www.cnblogs.com/Qqun261823976/p/16794483.html

相关文章

  • python+selenium+opencv验证滑块
    我们在使用selenium爬虫的时候在登录时经常会遇到滑块验证码问题,导致登录受阻,正所谓万事开头难。登录就登录不进去更别提往后的操作的。今天以登录京东后台来演示下如何破......
  • python学习:获取指定目录下所有文件名os.walk和os.listdir
    1.os.walk返回指定路径下所有文件和子文件夹中所有文件列表其中文件夹下路径如下:importosdeffile_name_walk(file_dir):forroot,dirs,filesinos.walk(f......
  • python中sort()函数跟sorted()函数的用法及区别
    一、描述sorted()函数是用来对某个对象进行排序操作的函数sorted()函数与sort()函数的区别是:sort只能用于列表对象(list),而sorted可以对所有可迭代对象进行排序。sort......
  • Python初学学习笔记
    本篇为新生实践课所留作业的学习笔记,记录我尚不熟悉的Python知识刷题页面  1.保留字即关键字,是Python语言中内部使用的单词,代表一定语义。例如:and、class、if、el......
  • python烟花代码
    python烟花代码 如下#-*-coding:utf-8-*-importmath,random,timeimportthreadingimporttkinterastkimportre#importuuidFireworks=[]maxFirewor......
  • Python库-pandas详解
    1.pandas介绍 pandas是用于数据挖掘的Python库 便捷的数据处理能力独特的数据结构读取文件方便封装了matplotlib的画图和numpy的计算pandas的数据结构Ser......
  • Python简单爬虫
    对大佬的有些修改,用大佬的编码转换那里老是出问题这个亲测可以#-*-coding:utf-8-*-importrequestsimportparselurl=""#小说网站response=requests.get(url)respo......
  • python提效小工具-统计xmind用例数量
    问题:做测试的朋友们经常会用到xmind这个工具来梳理测试点或写测试用例,但是xmind8没有自带的统计测试用例,其他版本的xmind有些自带节点数量统计功能,但也也不会累计最终的数......
  • aardio 调用 python将图片放上界面
    在aardio中显示图片目录在aardio中显示图片显示图片的控件使用IO库在aardio中使用plus显示图片的控件在aardio中我们显示图片也有对应的控件,这个空间就是高......
  • FreeBSD下开发Python插件并使用nuitka打包
    承接前面的文章https://www.cnblogs.com/passedbylove/p/16759512.htmlhttps://www.cnblogs.com/passedbylove/p/16756063.html自定义Python插件的setup.pyfromdistu......