首页 > 其他分享 >爬取海量ip

爬取海量ip

时间:2023-04-06 13:47:41浏览次数:40  
标签:iptype 海量 ip time tr 爬取 text table

import requests
from lxml import etree
import pandas as pd
import time

url = "http://www.66ip.cn/index.html"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}
all_ip = []
all_duankou = []
all_adress = []
all_iptype = []
all_yz_time = []
num = 1

while True:
	if num == 2991:
		break
	try:
		res = requests.get(url, headers=headers, timeout=10)
	except:
		continue
	res.encoding = "gbk"

	e = etree.HTML(res.text)
	ip = e.xpath("//table/tr/td[1]/text()")
	duankou = e.xpath("//table/tr/td[2]/text()")
	adress = e.xpath("//table/tr/td[3]/text()")
	iptype = e.xpath("//table/tr/td[4]/text()")
	yz_time = e.xpath("//table/tr/td[5]/text()")
	num += 1
	url = "http://www.66ip.cn/" + str(num) + ".html"

	all_ip.extend(ip[3:])
	all_duankou.extend(duankou[1:])
	all_adress.extend(adress[1:])
	all_iptype.extend(iptype[1:])
	all_yz_time.extend(yz_time[1:])
	time.sleep(1)
	print(url)


df = pd.DataFrame({"ip": all_ip, "端口号": all_duankou, "代理位置": all_adress, "代理类型": all_iptype, "验证时间": all_yz_time})
df.to_excel(r"C:\Users\44281\Desktop\海量IP.xlsx", index=False)

标签:iptype,海量,ip,time,tr,爬取,text,table
From: https://www.cnblogs.com/jzm123/p/17292497.html

相关文章

  • 爬取豆瓣top250
    importrequestsfromlxmlimportetreeimportpandasaspdnum=0url="https://movie.douban.com/top250?start="+str(num)+"&filter="headers={"User-Agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/&q......
  • 爬取王者荣耀皮肤并保存图片
    importrequestsimporttimeimportpathlibfromlxmlimportetreeheaders={"user-agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/108.0.0.0Safari/537.36"}url="https://pvp.qq.com......
  • jmeter模拟多IP地址访问
    1.前言:今天一同事在压测时提到怎么用jmeter里虚拟多个ip来发送请求,我想了一下以前用LR时用过虚拟ip地址,jmeter还没有使用过。想着原理应该是相通的,既然LR都能支持的话,那Jmeter应该也是支持,于是就有了jmeter虚拟化IP地址的研究。在网上也查找了相应的资料,摸索参考着实践了一把,坑吃......
  • jmeter模拟多IP地址访问
    1.前言:今天一同事在压测时提到怎么用jmeter里虚拟多个ip来发送请求,我想了一下以前用LR时用过虚拟ip地址,jmeter还没有使用过。想着原理应该是相通的,既然LR都能支持的话,那Jmeter应该也是支持,于是就有了jmeter虚拟化IP地址的研究。在网上也查找了相应的资料,摸索参考着实践了一把,坑吃......
  • Sleuth+Zipkin 实现 Spring Cloud 链路追踪
    一、前言在全链路监控:方案概述与比较 一文中,我们有详细介绍过分布式链路跟踪的实现理论基础。我们看到上图,知道在微服务架构下,系统的功能是由大量的微服务协调组成的,例如:电商下单业务就需要订单服务、库存服务、支付服务、短信通知服务逐级调用才能完成。而每个服务可能是由不同......
  • 网站突然用 IP 访问不了应该怎么办
    在访问网站时,通常会通过域名进行访问,而不是直接使用IP地址。但是,偶尔会出现一些情况,导致使用域名无法访问,而只能使用IP地址进行访问。那么,当一个网站突然用IP访问不了时,我们应该怎么办呢?本文将给大家提供一些简单易行的解决方法。1、检查网络连接问题首先,我们需要确保......
  • 解决"No toolchains found in the NDK toolchains folder for ABI with prefix: mips6
    版权声明:本文为博主原创文章,遵循 CC4.0BY-SA 版权协议,转载请附上原文出处链接和本声明。今天安装了AndroidStudio3.2,打开一个旧工程,编译提示"NotoolchainsfoundintheNDKtoolchainsfolderforABIwithprefix:mips64el-linux-android"网上也有解决办法,就是下载旧版......
  • Jenkins 脚本式 Pipeline 清理工作空间
    清理工作空间中的目录node{dir('aaa'){deleteDir()}}清理工作空间node{cleanWs()}清理文件node{cleanWspatterns:[[pattern:'*.bak',type:'INCLUDE'],[pattern:'*.tmp',type:'INCLUDE']......
  • Javascript中扁平化数据结构与JSON树形结构转换详解
    Javascript中扁平化数据结构与JSON树形结构转换详解原文链接:https://www.jb51.net/article/247525.htm+目录一.先说简单的树形结构数扁平化处理二.再讲将扁平化数据结构转JSON树状形结构扩充一个知识点:forin与forof的区别:总结不废话,直接开干一.先说简单的树形结构数......
  • 微信公众号 过滤 typescript cheerio
    E:\公众号文章采集\fi_filter_过滤器\src\exact_新浪博客手机版提取连接.jsconstfs=require('fs');constjsdom=require('jsdom');const{JSDOM}=jsdom;fs.readdir('./html',function(err,files){files.forEach((file)=>{fs.read......