使用python的requests开发爬虫类程序时,经常需要将之前请求返回的set-cookie值,作为下一个请求的cookie发送。比如模拟登录之后的返回的sessionId,就需要作为后续请求的cookie参数。
网上找了一圈,发现很多说需要手动添加或设置cookie的值。殊不知cookie是与域名、路径先关的,而且具有有效期。手动操作很容易掉坑里。。。
之前做C#时就有一个CookieContainer类可以自动处理cookie,照理requests的RequestsCookieJar应该也有类似的作用。研究了下发现其实requests组件确实具有自动处理cookie的能力,而且一句update代码就能搞定:
def __init__(self): self.cookies = requests.cookies.RequestsCookieJar() def go(self, url, method, post_data): response = requests.request(method, url , data=post_data , headers=info.headers , cookies=self.cookies) #传递cookie self.cookies.update(response.cookies) # 保存cookie
标签:cookies,python,self,cookie,requests,RequestsCookieJar From: https://www.cnblogs.com/qboshi/p/16964925.html