首页 > 其他分享 >有cookie的情况下爬虫如何运行

有cookie的情况下爬虫如何运行

时间:2023-07-20 14:35:53浏览次数:32  
标签:get url res 爬虫 headers cookie import 运行

import requests
import re
import time
import hashlib
import threading
import json
from lxml import etree
from pymysql.converters import escape_string
from fake_useragent import UserAgent

from mylib.module import *

headers = {
    'user-agent': UserAgent().random
}
url = 'https://www.ivsky.com/tupian/'
res = requests.get(url=url, headers=headers)
# 获取第一次请求网站的cookie信息
dt = res.cookies.get_dict()
# 请求头携带
'''
    这里先要在浏览器里清空Application里面的Cookies
    然后刷新页面,会看到第一个和第三个两个同名的框架文件(这里是tupian/)
    我们需要打开第一个,查看Response Headers选项里面的Set-Cookie选项
    要以第三个框架文件中的cookie为准,得出首次发送的cookie与正确的cookie之间适当的变化规律,分析得出结论
'''
cookies = {
    't': dt['token'],
    'r': str(int(dt['secret']) - 100)
}

# 第二次请求
res = requests.get(url=url, headers=headers, cookies=cookies)
html = res.text
e = etree.HTML(html)

lst = e.xpath('//div[@class="il_img"]/a/img/@src')
for i in range(len(lst)):
    url = 'https:' + lst[i]
    res = requests.get(url=url, headers=headers)
    code = res.content
    with open('./img/' + str(i) + '.jpg', 'wb') as f:
        f.write(code)
    time.sleep(1)

标签:get,url,res,爬虫,headers,cookie,import,运行
From: https://www.cnblogs.com/hacker-dvd/p/17568322.html

相关文章

  • Linux 下运行.NET 6 7 8 程序遇到的两个问题
    一、/lib64/libstdc++.so.6:version`GLIBCXX_3.4.21‘notfound的解决办法1.下载libstdc++.so.6.0.21文件注意区分x84_64和aarch64架构,下载对应的版本2.把libstdc++.so.6.0.21复制到/lib64/libstdc++.so.6.0.213.运行命令exportLD_PRELOAD="/lib64/libstdc++.s......
  • 使用GGML和LangChain在CPU上运行量化的llama2
    MetaAI在本周二发布了最新一代开源大模型Llama2。对比于今年2月发布的Llama1,训练所用的token翻了一倍,已经达到了2万亿,对于使用大模型最重要的上下文长度限制,Llama2也翻了一倍。在本文,我们将紧跟趋势介绍如何在本地CPU推理上运行量化版本的开源Llama2。 https:......
  • 安装pytorch并且搭建环境,在pycharm上成功可运行(解决各类疑难杂症版)
    首先非常推荐小土堆的安装教程,我是根据他的安装步骤出现各种问题,并且一个个解决!链接在这里,Click!问题一:Python版本选择在这边建议是跟着up主的版本走,旧版本大抵够用,新版本很容易遇到其他问题,我下载的版本是3.7(因为以前下载的时候就是下载3.7了,到现在已经算是旧版本了)问题二:a......
  • 使用管理员身份运行python脚本
    使用管理员身份运行Python脚本在某些情况下,我们可能需要以管理员身份运行Python脚本。管理员权限允许我们执行一些需要特权的操作,例如修改系统文件或者安装软件。本文将介绍在不同的操作系统中如何以管理员身份运行Python脚本,并提供相应的代码示例。Windows系统在Windows系统中,......
  • maven build 运行unit test失败 process exit code:134
    环境:JDK:17.0.7Springboot:3.1.0Junit:5问题:运行mvncleaninstall时在maven-surefire-plugin:test阶段失败。TheforkedVMterminatedwithoutprperlysayinggoodbye.VMcrashorSystem.exitcalled?dumpfile中的错误:Corruptedchannelbydirectlywriting......
  • CPU环境下运行基于yolov5的行人检测代码(pedestrain detection based on yolov5 in CPU
    最近在捣腾基于yolov5的行人检测代码,在github上下载一个案例之后因为没用GPU运行一直碰壁,出现了许多bug,现在整理了下error和解决方法,成功调试出了基于yolov5的行人检测代码,分享给大家~1.运行环境:window10,CPU,VisualStudioCode2.项目路径:dyh的 unbox_yolov5_deep......
  • JVM运行时数据区
    JVM运行时数据区1.概述内存是非常重要的系统资源,是硬盘和CPU的中间仓库及桥梁承载着操作系统和应用程序的实时运行。JVM内存布局规定了Java在运行过程中内存申请、分配、管理的策略,保证了JVM的高效稳定运行不同的JVM对于内存的划分方式和管理机制存在着部分差异。下图是经典的......
  • 针对于 Scrapy 爬虫框架的搭建与解析
    Scrapypipinstallscrapy1、Scrapy爬虫框架爬虫框架:爬虫框架是实现爬虫功能的一个软件结构和功能组件集合。爬虫框架是一个半成品,能够帮助用户实现专业的网络爬虫。解析Scrapy爬虫框架:Scrapy爬虫框架包含”5+2“结构,他有五个主模块以及两个中间键构成。engine......
  • 5分钟教你从爬虫到数据处理到图形化一个界面实现山西理科分数查学校-Python
    5分钟教你从爬虫到数据处理到图形化一个界面实现山西理科分数查学校-Python引言在高考结束后,学生们面临的一大挑战是如何根据自己的分数找到合适的大学。这是一个挑战性的任务,因为它涉及大量的数据和复杂的决策过程。大量的信息需要被过滤和解析,以便学生们能对可能的大学选择有......
  • android view上配置id, 运行后看不到
    AndroidView上配置ID,运行后看不到作为一名经验丰富的开发者,你需要教导一位刚入行的小白如何实现在AndroidView上配置ID,但在运行后看不到这些ID。下面是具体的步骤和代码示例。步骤以下是实现此功能的步骤:步骤描述1创建一个新的Android项目2在布局文件中添加一......