首页 > 其他分享 >爬虫 | 处理cookie的基本方法——session

爬虫 | 处理cookie的基本方法——session

时间:2024-06-12 10:57:20浏览次数:24  
标签:profile 登录 url 爬虫 session cookie login

很多网页要求登录后,才能查看对应的信息,整个流程是:

客户端                          服务器
玩家登录                        返回cookie
获得cookie后继续访问其他页面     根据cookie查验身份,返回对应内容

session会话,理解为可以连续请求,先提交data换来cookie,然后可以带着cookie继续访问。比如此时想访问一个需要登录后才能展示的个人信息页面 https://example.com/profile

其实有两种方法,第一种就是session,第二种则是在网页上登录之后,将cookie放入请求中。

第一种方法:session

import requests  
  
# 创建一个会话对象  
session = requests.session()  
  
# 使用会话对象登录(假设需要登录)  
login_url = 'https://example.com/login'  
login_data = {'username': 'myuser', 'password': 'mypass'}  
session.post(login_url, data=login_data)  
  
# 现在,由于我们使用了会话对象,所以后续的请求会携带前面请求中设置的cookies  
# 例如,访问一个需要登录后才能展示的个人信息页面  
profile_url = 'https://example.com/profile'  
response = session.get(profile_url)  #>>>> 用session去请求
print(response.text)  
  
# 当你完成所有请求后,可以关闭会话(但这不是强制的,因为Python的垃圾回收机制会处理它)  
session.close()

第二种方法

# 1. 在网页中完成登录
# 2. 进入想要访问的个人信息页面:https://example.com/profile
# 3. 在开发者工具中找到请求头request headers,里面有个cookie。复制下来

url = 'https://example.com/profile'
headers = {
    'cookie': '复制下来的一大串东西'
}
req = requests.get(url = url, headers = headers)

# 效果一样,但是麻烦一点点

标签:profile,登录,url,爬虫,session,cookie,login
From: https://www.cnblogs.com/abloger/p/18243467

相关文章

  • 计算机毕业设计项目推荐,32127 爬虫-自驾游搜索系统(开题答辩+程序定制+全套文案 )上万套
    目 录摘要1绪论1.1研究背景1.2爬虫技术1.3flask框架介绍21.4论文结构与章节安排32 自驾游搜索系统分析42.1可行性分析42.2系统流程分析42.2.1数据增加流程52.3.2数据修改流程52.3.3数据删除流程52.3系统功能分析52.3.1功能性分析62.......
  • 爬虫技术升级:如何结合DrissionPage和Auth代理插件实现数据采集
    背景/引言在大数据时代,网络爬虫技术已经成为数据收集的重要手段之一。爬虫技术可以自动化地从互联网上收集数据,节省大量人力和时间成本。然而,当使用需要身份验证的代理服务器时,许多现有的爬虫框架并不直接支持代理认证。这就需要我们寻找替代方案,以便在爬虫过程中能够顺利通过代......
  • 爬虫自动化之DRISSIONPAGE实现随时切换代理IP
    爬虫自动化之drissionpage实现随时切换代理iphttps://blog.csdn.net/qq_32334103/article/details/126133862下载SwitchyOmega地址:https://github.com/FelisCatus/SwitchyOmega/releases也可以直接用压缩文件打开,然后解压到当前文件夹123456789101112......
  • 爬虫 | xpath + lxml 库 解析爬取网页
    lxml库是用来解析XML和HTML网页内容的Xpath库则是用来查询数据(XPath表达式是一种在XML文档中查找信息的语言,它同样适用于HTML文档)简单示例:#先pipinstalllxmlimportrequestsfromlxmlimportetree#etree主要是用来解析和操作XML/HTML文档#步骤3:获取......
  • 基于Vue+Node.js的高校学业预警系统+10551(免费领源码)可做计算机毕业设计JAVA、PHP、爬
    NodeJS高校学业预警系统摘 要随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,教育行业当然也不能排除在外。高校学业预警系统是以实际运用为开发背景,运用软件工程开发方法,采用Node.JS技术构建的一个管理系统。......
  • python爬虫笔记——学习笔记—6
    爬虫笔记——学习笔记—61.安装scrapy打开此电脑![img](file:///C:/Users/Administrator/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png在桌面的上栏目输入cmd并打开再命令框中升级python:python-mpipinstall–upgradepip安装scrapy:pipinstallscrapy安装......
  • Python爬虫:通过js逆向了解某音请求接口参数a_bogus加密过程
    1.前言需要提前说明以下,本篇文章讲述的内容仅供学习,切莫用于商业活动,如若被相关人员发现,本小编概不负责!切记。。本次分析的接口为:https://www.douyin.com/aweme/v1/web/discover/search/它的请求方式为:GET请求需要的参数有:请求参数中需要进行js逆向是:a_bogus必须需要的请......
  • 【简写Mybatis-02】注册机的实现以及SqlSession处理
    前言注意:学习源码一定一定不要太关注代码的编写,而是注意代码实现思想:通过设问方式来体现代码中的思想;方法:5W+1H源代码:https://gitee.com/xbhog/mybatis-xbhog;https://github.com/xbhog/mybatis-xbhog;交个朋友,有价值欢迎star。回顾&分析上一局实现Mapper接口和映射器通......
  • ASP.NET第五章 Application、Session和Cookie对象
    第五章Global全局的1.包含所有应用程序的配置设置2.存储所有事件的事件处理程序3.存储在应用程序的根目录下4.它的位置定义应用程序的限界Global.asax六大事件:1.Application_Start调用当前应用程序目录(或其子目录)下的第一个ASP.NET页面时触发2.ApplicationEnd......
  • Springboot 开发 -- Redis实现分布式Session
    一、引言在微服务架构和分布式系统中,会话管理(SessionManagement)成为了一个挑战。传统的基于Servlet容器的会话管理方式在分布式环境下无法有效工作,因为用户请求可能会被分发到不同的服务器上,导致会话数据无法共享。为了解决这个问题,SpringSession提供了一种基于外部存储(......