首页 > 编程语言 >【Python爬虫】python打印本地代理

【Python爬虫】python打印本地代理

时间:2023-09-14 16:05:46浏览次数:45  
标签:http Python IP 代理 爬虫 python movie requests proxies

在进行网络爬虫时,使用代理是非常重要的。因为爬虫经常会被网站封 IP,而代理可以隐藏你的真实 IP 地址,让你可以更不受限制地爬取数据。本文将介绍如何在 Python 中打印代理,包括代理 IP 的使用以及代码案例。

代理 IP 的使用

在使用代理 IP 时,需要注意一些事项,包括:

  1. 获取代理 IP

你可以在一些代理 IP 提供的网站上购买或免费获取代理 IP。一些代理 IP 提供包括:

  • 站大爷
  • 碟鸟ip
  • 开心代理等


  1. 选择合适的代理 IP

不同的代理 IP 有不同的速度、稳定性和隐私性能。选择合适的代理 IP 可以提高你的爬虫效率和安全性。

  1. 设置代理 IP

在 Python 中,可以通过设置代理 IP 来访问网站。使用 requests 库时,可以将代理 IP 作为参数传递给 get 或 post 方法,如下所示:

import requests

proxies = {
  "http": "http://123.25.452.80:3128",
  "https": "http://10.10.1.10:1080",
}

response = requests.get("http://www.example.com", proxies=proxies)

上面的示例中,我们设置了两个代理 IP,分别用于 HTTP 和 HTTPS 请求。我们可以将代理 IP 替换为自己的 IP 地址和端口号。

  1. 验证代理 IP

在使用代理 IP 时,有时候会遇到代理 IP 失效的情况。为了避免浪费时间在失效的代理 IP 上,我们可以使用代理 IP 验证器来验证代理 IP 是否有效,如下所示:

import requests

proxies = {
  "http": "http://10.10.1.10:3128",
  "https": "http://10.10.1.10:1080",
}

response = requests.get("http://www.example.com", proxies=proxies, timeout=5)
if response.status_code == 200:
    print("代理 IP 有效")
else:
    print("代理 IP 失效")

代理 IP 验证器的作用是发送一个 HTTP 请求,检查返回结果的状态码。如果状态码是 200,则代理 IP 有效。

代码案例

下面是一个使用代理 IP 的完整代码案例。我们使用 requests 库和 BeautifulSoup 库获取豆瓣电影 Top250 的电影名称和评分,使用了代理 IP 来避免被封 IP。

import requests
from bs4 import BeautifulSoup

# 代理 IP
proxies = {
  "http": "http://10.10.1.10:3128",
  "https": "http://10.10.1.10:1080",
}

# 网站 URL
url = "https://movie.douban.com/top250"

# 发送 HTTP 请求
response = requests.get(url, proxies=proxies)

# 解析 HTML
soup = BeautifulSoup(response.text, "html.parser")

# 查找电影列表
movie_list = soup.find_all(class_="grid_view")[0].find_all("li")

# 遍历电影列表,输出电影名称和评分
for movie in movie_list:
    title = movie.find_all("span", class_="title")[0].text
    rating = movie.find_all("span", class_="rating_num")[0].text
    print(title + " " + rating)

以上代码案例中,我们使用了代理 IP 来发送 HTTP 请求,设置了代理 IP 的地址和端口号。由于豆瓣网站对爬虫比较严格,使用代理 IP 可以有效避免被封 IP 的情况。

总结

在 Python 中使用代理 IP 可以有效避免被封 IP 的情况,并且还可以提高爬虫效率和安全性。在使用代理 IP 时,需要注意选择合适的代理 IP、设置代理 IP 和验证代理 IP,以确保代理 IP 的有效性和安全性。本文中提供了一个使用代理 IP 的完整代码案例,供读者参考。

标签:http,Python,IP,代理,爬虫,python,movie,requests,proxies
From: https://blog.51cto.com/u_16022798/7470812

相关文章

  • python: add more new row
    https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_excel.htmldefappendDataToExcel(excelName,sheetName,data):"""EXCEL向后行插入数据:paramexcelName:EXCEL文件:paramsheetName:工作表名:paramdata:数据集合:ret......
  • python-docx -快速入门
    docx​ python-docx是一个用于创建和更新Microsoftword(.docx)文件的Python库安装pipinstallpython-docx快速入门打开文档需要的第一件事是要处理的文档。fromdocximportDocumentdocument=Document()这将打开一个基于默认"模板"的空白文档,这与你使用内置默认......
  • python的flask框架部署网页过程报错及解决方案
    python安装好flask框架之后,创建一个flask的项目,运行发生以下报错UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0xa1inposition4:invalidstartbyte原因是读取flask库源码的时候系统默认未使用‘utf-8’格式win10电脑->控制面板->区域->管理->更改系统区域设置......
  • Python应用实战——盘点一个Python面试编程题(附代码)
    大家好,我是皮皮。一、前言前几天在Python奥特曼交流群【。。】问了一个Python面试题的问题,一起来看看吧,图片代码分享版本在这个文章,盘点一个Python面试编程题(Python应用实战)(文末赠书),在里边也可以拿到原始的需求数据。这里应粉丝的要求,分享一个代码版本,手残党福利来了!二、实现......
  • CMAKE相对路径编译和python的ctypes引用
    CMAKE相对路径编译和python的ctypes引用cmake编译库使用相对路径cmake编译使用相对路径生成动态库,进而满足其他代码的调用,如python的ctypes由于ctypes能调用c,而不能调用c++,所以,使用externc来处理,使ctypes能够调用。externc在需要编译动态库cpp代码中,使用C的方式处理函数......
  • 盘点6个应该掌握的Python内置函数!
    Python作为一种灵活而强大的编程语言,越来越多的工程师开始学习、使用它。今天给大家介绍6个常见的Python内置函数,希望大家能够掌握它,以下是详细的内容:1、len()函数len()命令是一种简单而不可或缺的机制,用于确定指定可迭代对象(如列表、元组或字符串)的大小(即组件的计......
  • python分片和断点续传oss
    分片上传和断点续传是常见于文件上传至云存储服务的操作,其中OSS(ObjectStorageService)是阿里云提供的云存储服务。Python可以用来实现分片上传和断点续传到阿里云OSS。下面是一个简单的示例,演示了如何使用Python和阿里云OSSSDK进行分片上传和断点续传。首先,确保你已......
  • python 根据asctime字符串转成日期
    1、将asctime转换为时间戳如果将asctime转换为日期时间字符串,首先需要将asctime转换为时间戳。时间戳是指自1970年1月1日以来的秒数。Python中的time模块提供了将asctime转换为时间戳的函数mktime。importtimeasctime="FriMay1405:24:592021"t=time.mktim......
  • MySQL 和 Python:无缝结合的数据库应用
    MySQL和Python都是广泛应用于软件开发的重要工具。MySQL是一种强大的关系型数据库管理系统,而Python则是一种灵活的高级编程语言。它们之间的紧密集成为开发人员提供了强大的数据存储和操作能力。本文将探讨MySQL和Python之间的关系,并提供一些示例代码来演示如何在Python......
  • 使用python进行数据同步,根据游标的方式
    使用python进行数据同步,根据游标的方式一、介绍:数据同步分为好几种,比如根据最大id排序,其次才是根据游标进行排序。为什么不使用最大id进行数据同步?如下:因为如果数据表中的数据是按照降序排序的,那么每次根据最大id取1000条数据的方式也是一种可行的分页查询方式。这种方式的优......