爬取海量ip

爬取海量ip

时间：2023-04-06 13:47:41浏览次数：42

标签：iptype 海量 ip time tr 爬取 text table

import requests
from lxml import etree
import pandas as pd
import time

url = "http://www.66ip.cn/index.html"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}
all_ip = []
all_duankou = []
all_adress = []
all_iptype = []
all_yz_time = []
num = 1

while True:
	if num == 2991:
		break
	try:
		res = requests.get(url, headers=headers, timeout=10)
	except:
		continue
	res.encoding = "gbk"

	e = etree.HTML(res.text)
	ip = e.xpath("//table/tr/td[1]/text()")
	duankou = e.xpath("//table/tr/td[2]/text()")
	adress = e.xpath("//table/tr/td[3]/text()")
	iptype = e.xpath("//table/tr/td[4]/text()")
	yz_time = e.xpath("//table/tr/td[5]/text()")
	num += 1
	url = "http://www.66ip.cn/" + str(num) + ".html"

	all_ip.extend(ip[3:])
	all_duankou.extend(duankou[1:])
	all_adress.extend(adress[1:])
	all_iptype.extend(iptype[1:])
	all_yz_time.extend(yz_time[1:])
	time.sleep(1)
	print(url)


df = pd.DataFrame({"ip": all_ip, "端口号": all_duankou, "代理位置": all_adress, "代理类型": all_iptype, "验证时间": all_yz_time})
df.to_excel(r"C:\Users\44281\Desktop\海量IP.xlsx", index=False)

标签：iptype,海量,ip,time,tr,爬取,text,table
From： https://www.cnblogs.com/jzm123/p/17292497.html

爬取豆瓣top250
importrequestsfromlxmlimportetreeimportpandasaspdnum=0url="https://movie.douban.com/top250?start="+str(num)+"&filter="headers={"User-Agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/&q......
爬取王者荣耀皮肤并保存图片
importrequestsimporttimeimportpathlibfromlxmlimportetreeheaders={"user-agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/108.0.0.0Safari/537.36"}url="https://pvp.qq.com......
jmeter模拟多IP地址访问
1.前言：今天一同事在压测时提到怎么用jmeter里虚拟多个ip来发送请求，我想了一下以前用LR时用过虚拟ip地址，jmeter还没有使用过。想着原理应该是相通的，既然LR都能支持的话，那Jmeter应该也是支持，于是就有了jmeter虚拟化IP地址的研究。在网上也查找了相应的资料，摸索参考着实践了一把，坑吃......
jmeter模拟多IP地址访问
1.前言：今天一同事在压测时提到怎么用jmeter里虚拟多个ip来发送请求，我想了一下以前用LR时用过虚拟ip地址，jmeter还没有使用过。想着原理应该是相通的，既然LR都能支持的话，那Jmeter应该也是支持，于是就有了jmeter虚拟化IP地址的研究。在网上也查找了相应的资料，摸索参考着实践了一把，坑吃......
Sleuth+Zipkin 实现 Spring Cloud 链路追踪
一、前言在全链路监控：方案概述与比较一文中，我们有详细介绍过分布式链路跟踪的实现理论基础。我们看到上图，知道在微服务架构下，系统的功能是由大量的微服务协调组成的，例如：电商下单业务就需要订单服务、库存服务、支付服务、短信通知服务逐级调用才能完成。而每个服务可能是由不同......
网站突然用 IP 访问不了应该怎么办
在访问网站时，通常会通过域名进行访问，而不是直接使用IP地址。但是，偶尔会出现一些情况，导致使用域名无法访问，而只能使用IP地址进行访问。那么，当一个网站突然用IP访问不了时，我们应该怎么办呢？本文将给大家提供一些简单易行的解决方法。1、检查网络连接问题首先，我们需要确保......
解决"No toolchains found in the NDK toolchains folder for ABI with prefix: mips6
版权声明：本文为博主原创文章，遵循 CC4.0BY-SA 版权协议，转载请附上原文出处链接和本声明。今天安装了AndroidStudio3.2，打开一个旧工程，编译提示"NotoolchainsfoundintheNDKtoolchainsfolderforABIwithprefix:mips64el-linux-android"网上也有解决办法，就是下载旧版......
Jenkins 脚本式 Pipeline 清理工作空间
清理工作空间中的目录node{dir('aaa'){deleteDir()}}清理工作空间node{cleanWs()}清理文件node{cleanWspatterns:[[pattern:'*.bak',type:'INCLUDE'],[pattern:'*.tmp',type:'INCLUDE']......
Javascript中扁平化数据结构与JSON树形结构转换详解
Javascript中扁平化数据结构与JSON树形结构转换详解原文链接：https://www.jb51.net/article/247525.htm+目录一.先说简单的树形结构数扁平化处理二.再讲将扁平化数据结构转JSON树状形结构扩充一个知识点：forin与forof的区别：总结不废话，直接开干一.先说简单的树形结构数......
微信公众号过滤 typescript cheerio
E:\公众号文章采集\fi_filter_过滤器\src\exact_新浪博客手机版提取连接.jsconstfs=require('fs');constjsdom=require('jsdom');const{JSDOM}=jsdom;fs.readdir('./html',function(err,files){files.forEach((file)=>{fs.read......

相关文章

赞助商

阅读排行