首页 > 编程语言 >Python爬取免费IP代理时,无法解析到数据

Python爬取免费IP代理时,无法解析到数据

时间:2024-03-13 09:05:07浏览次数:27  
标签:粉丝 Python IP 代码 爬取 解析 数据

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【ZXS】问了一个Python网络爬虫实战问题。问题如下:

我这里遇到一个问题:【爬取免费IP代理时,无法解析到数据】, 我通过 xpath,css定位到了元素,但是在运行时返回空列表,请问我该怎么解决呀 以下是解析数据的截图:

他自己提供了数据和写的代码如下:

image.png

不过代码得到的结果不是自己想要的。

image.png

二、实现过程

这里【吴超建】给了一个思路:css貌似写得不对。并且给出了对应html解析。

image.png

后来才发现粉丝自己把网站搞错了,真是太尴尬了。

image.png

不过针对粉丝当前的代码,不换网站的话,修改xpath后也是可以跑的通的。

image.png

顺利地解决了粉丝的问题。

image.png

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python库安装的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【ZXS】提出的问题,感谢【吴超建】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

image.png

标签:粉丝,Python,IP,代码,爬取,解析,数据
From: https://www.cnblogs.com/dcpeng/p/18069738

相关文章

  • 【网络基础学习之一】OSI参考模型与TCP/IP协议
    一.分层思想1.分层背景OSI(OpenSystemsInterconnection,开放式系统互联)是国际标准化组织(ISO)在20世纪80年代制定的一种通信协议的通信模型,主要用于计算机网络中,规定了计算机系统之间通信的标准方法和协议。2.分层优点各层之间相互独立,每一层只实现一种相对独立的功能,使问题复......
  • Python控制摄像头并获取数据文件
    一、引言摄像头作为计算机视觉领域的核心设备之一,广泛应用于视频监控、图像采集和数据处理等领域。通过Python编程语言,我们可以实现对摄像头的精确控制,包括摄像头的开启、关闭、参数设置以及数据获取等功能。本文将指导读者完成这些操作,实现摄像头数据的自动化管理。二、摄像......
  • 案例--某站视频爬取
    众所周知,某站的视频是:由视频和音频分开的。所以我们进行获取,需要分别获得它的音频和视频数据,然后进行音视频合并。这么多年了,某站还是老样子,只要加个防盗链就能绕过。(防止403)音视频合并用ffmpeg软件,需要设置环境变量。---soeasy  话不多说,直接上代码......
  • Python数学建模-2.2Python基本数据类型
    各位小伙伴大家好,今天开始学习司守奎老师的《数学建模算法与应用》啦,我也会边学习边与大家分享书中的内容,希望与大家共同进步哦Python中的基本数据类型主要包括以下几种:数字(Numbers)整型(int):正或负整数,没有限制大小。例如:100,-8080,0。浮点型(float):浮点数,即带有小数点的数字。......
  • 安装JDK11+Tomcat10.0.1+eclipse-jee-2023-12-R-win32-x86_64 配置
    第一步,先双击启动软件:改一下名称:C:\Users\Administrator\eclipse-workspace变成:C:\ProgramFiles\JavaJava:为什么JSP文件要放到SpringBoot工程的src/main/webapp目录下参考文章:https://blog.csdn.net/netyeaxi/article/details/100928105为了看到更具体的页面,可以做个性化......
  • eclipse连接hana数据库修改端口号
    在Eclipse中连接SAPHANA数据库时,如果需要修改端口号,你需要在JDBC连接URL中指定正确的端口。JDBC连接URL通常遵循以下格式:jdbc:sap://<hostname>:<port>/[<instance_number>]?currentschema=<schema_name>在这个URL中:<hostname>是SAPHANA数据库服务器的地址。<port>是SAP......
  • python安装库文件的时候一个一个安装的py脚本
    在编译安装一些python软件的时候,经常使用pipinstall-rrequirements.txt命令执行。如果其中一个库编译失败,会导致所有的库安装失败,非常费事费力。于是写了一个py小脚本pipinstall.py,将库改为一个一个的安装,这样再碰到编译失败的,也不会影响其它的库,节省时间。文件pipinsta......
  • zabbix直接ip访问web前端
    1、修改配置文件, sudovim/etc/apache2/sites-available/000-default.conf把之前的DocumentRoot/var/www/html这行注释掉,另起一行输入 DocumentRoot/usr/share/zabbix 2、重启Apache、zabbix-server服务sudosystemctlrestartapache2.servicezabbix-server.serv......
  • Windows命令行不加解释器和文件后缀名直接运行Python脚本
    Windows命令行不加解释器和文件后缀名直接运行Python脚本首次编辑:24/2/29/20:30最后编辑:24/2/25/20:44引子都知道Windowscmd中,运行可执行文件和bat时,可以直接输入不带后缀的文件名。rem运行main.exemainrem运行mybat.batmybat而执行python脚本时,却需要指明python作......
  • 利用Python中的ORM操作数据库Mysql(一)
    如何用python操作数据库?很多同学在用python操作数据库的时候会使用pymysql,这确实是一种成熟的方案,但是要写很多sql语句,今天我就来介绍在Django中使用ORM的方法操作数据库。第一章链接数据库首先,安装第三方模块mysqlclient在终端输入:pipinstallmysqlclient启动mys......