首页 > 编程语言 >「http代理」Python-Scrapy 代码样例(四)

「http代理」Python-Scrapy 代码样例(四)

时间:2022-10-18 11:11:50浏览次数:51  
标签:username http Python request 样例 代理 scrapy proxy

  http代理使用提示

  1.http/https网页均可适用

  2.scrapy不是python原生库,需要安装才能使用:pip install scrapy

  3.在第一级tutorial目录下运行如下命令查看结果:scrapy crawl kdl

  middlewares.py

  1.middlewares.py中新增ProxyDownloaderMiddleware即代理中间件

  2.请注意替换代码中的部分信息:username:用户名,password:密码

  #!/usr/bin/env python

  #--coding:utf-8--

  from scrapy import signals

  from.myextend import pro

  import random

  class ProxyDownloaderMiddleware:

  def process_request(self,request,spider):

  proxy=random.choice(pro.proxy_list)

  #用户名密码认证(私密代理/独享代理)

  username="username"

  password="password"

  request.meta['proxy']="http://%(user)s:%(pwd)s %(proxy)s/"%{"user":username,"pwd":password,"proxy":proxy}

  #白名单认证(私密代理/独享代理)

  #request.meta['proxy']="http://%(proxy)s/"%{"proxy":proxy}

  return None

 

标签:username,http,Python,request,样例,代理,scrapy,proxy
From: https://www.cnblogs.com/huakexiaopeng/p/16801938.html

相关文章

  • 「http代理」Python-Scrapy 代码样例(三)
    http代理使用提示1.http/https网页均可适用2.scrapy不是python原生库,需要安装才能使用:pipinstallscrapy3.在第一级tutorial目录下运行如下命令查看......
  • Python创建虚拟环境
    Python创建虚拟环境目录Python创建虚拟环境1命令行下1.1virtualenv1.2创建虚拟环境1.3激活/退出虚拟环境1.4删除虚拟环境1命令行下1.1virtualenvpip3installv......
  • python+clickhouse
    1.关于使用客户端能链接成功而使用代码无法访问clickhouse的问题clikchouse有两种链接方式:http端口默认为8123,tcp默认接口为9000使用客户端链接时用8123端口,而代码中就......
  • 【Python基础学习】第二节 列表操作
    Python基础学习之列表操作1.列表的增,删,改,查1.1列表的增加,常用的方法有:append,extent,incertappend()在列表的最后面增加元素;heros=['马里奥','路易斯','林......
  • python 如何将QueryDict转化为dict | 18
    假设我有以下QueryDict:<QueryDict:{u'num':[0],u'var1':[u'value1',u'value2'],u'var2':[u'8']}>我想要一本这样的字典,例如:{'num':[0],'var1':['value1','value2'......
  • 前端封装XmlHttpRequest超级实用
    前端封装XMLHttpRequest超级实用​ 很多时候我们只需要开发一个简单地页面,不需要引入任何js库,这时接口请求用到XMLHttpRequest对象必不可少,那么封装一个好用的请求方法......
  • 阿里云免费证书申请,配置安装,使用tomcat,此时服务器同时支持http端口80访问,https端口 44
      参数   说明商品类型   默认已选择云盾证书服务(无需修改)。云盾证书服务类型   SSL证书服务的类型。默认已选择云盾SSL证书(无需修改),表示付费版SSL证书。......
  • Python基础 字符串方法
    1、字符串首字母大写i="shulei_xiaoxin"S=i.capitalize()print(S)Shulei_xiaoxin2、字符串全部大写或小写i="shuLEI_XIAOxin"S=i.upper()S1=i.lower()......
  • 学习python-Day75
    运维的本质运维:运行维护应用程序岗位需求:自动化运维、DBA、docker+K8s...运维职责:尽可能保证应用程序24小时不间断运行尽可能保证数据的安全尽可能提升程序的......
  • 阿里云CLB代理https转发到harbor
    阿里云CLB代理https转发到harbor背景原来的harbor仓库和业务应用在同一台机器上,且没有域名。现在需要迁移到一台单独机器上并配置域名。迁移harbor#原来的harbor在启......