xpath的一次性同时获取a标签和p标签的内容？（下篇）

时间：2023-12-27 21:46:44浏览次数：30

大家好，我是皮皮。

一、前言

前几天在Python白银交流群【上海新年人】问了一个Python网络爬虫数据提取的问题，一起来看看吧。他的需求就是：xpath的一次性同时获取a标签和p标签的内容。上一篇文章中，大佬们已经给出了一个答案，可是数据获取下来后发现和网页上的顺序展示并不一致，这一篇文章我们一起来看看解决办法。

二、实现过程

这里【猫药师Kelly】给了一个指导，如下所示：碰到对位置要求严格的场景，用bs4吧。这里他给了一个提取的代码，如下：//div[@class='ui-list-item-author']/*[self::p or self::a]

顺利地解决了粉丝的问题。bs4 按照节点取一层一层找，直观一点，而且数据获取之后，顺序方面也是和网页上的显示是一致的。

当然了，条条大路通罗马，针对该问题，还有其他的标签可以获取，也是可以一样达到数据提取目标的。

下面【瑜亮老师】也给了一个方法，如下图所示：

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Python网络爬虫数据提取的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【上海新年人】提出的问题，感谢【猫药师Kelly】、【东哥】、【巭孬

标签：xpath,下篇,Python,标签,代码,获取,数据
From： https://www.cnblogs.com/dcpeng/p/17931493.html

Python采集html页面时如何去除掉script,link等指定html标签
python爬虫去除html中特定标签、去除注释、替换实体前言：本文主要讲w3lib库的四个函数html.remove_tags()html.remove_tags_with_content()html.remove_comments()html.remove_entities()remove_tags作用：去除或保留标签，但是仅仅是去除标签，正文部分是不做处理的看其函数......
c#实现对大量文章标签进行聚合分组
比如已知是10001个章节，第个页面最多显示100个标签，则最终会有3层。以下代码是自己写出，由gpt将递归优化为while循环。voidMain(){inttotalChapterCount=10001;intmaxChapterCount=100;varchapters=newList<Chapter>();for(vari=0;i<tota......
06--xpath回顾
1xpath安装与使用安装安装lxml库pipinstalllxml-ipip源2解析流程与使用解析流程实例化一个etree的对象，把即将被解析的页面源码加载到该对象调用该对象的xpath方法，结合着不同形式的xpath表达，进行标签定位和数据提取使用#导入lxml.etreefromlxmlimportet......
python网站创建015：jQuery的标签操作
当我们找到标签之后，就要学习jQuery对这个标签都能做哪些操作？ 1、样式操作：也就是操作标签的css样式添加样式：addClass删除样式：removeClass判断是否有该样式：hasClass有则移除，无则添加：toggleClass<!DOCTYPEhtml><html><head><title>初识：JavaScript</title><meta......
墨水屏电子纸标签/电子纸价签领域如何选择无线通信方案？
很多的厂家都知道，电子标签/电子价签的全套解决方案中，无线通信方案是最核心的，选对了这个方案，整个系统就会成功一半。目前电子标签/电子价签应用的无线通信方案主要有2种：【方案一】在2.4G载波频率上的是zigBee和蓝牙无线通信方案【方案二】在433MHz载波频率上的无线通信方案，距离远那......
HTML学习第三天：探索语义化标签与响应式设计
在今天的HTML学习中，我进一步了解了语义化标签和响应式设计的重要性。早上，我开始学习语义化标签。这些标签不仅可以定义网页的结构，还能为搜索引擎和辅助技术提供信息。例如，<header>标签用于定义页面的头部，<nav>标签用于定义导航菜单。这些标签不仅提高了代码的可读性，还有助于提高网......
html列表标签
一、无序标签基本语法<ul><li>芊嵛</li><li>流年</li><li>依诺</li></ul>前面的符号设置方法一ul{/*去除none实心小圆点disc默认空心圆circle空心正方形square*/list-style:none;}方法二<!--......
obsidian dataview写年报：按标签分类汇总
原文地址：https://www.cnblogs.com/liqinglucky/p/ob-dataview.html使用场景上次我们讲过用dataview写周报obsidiandataview写周报：统计一周内的文件-liqinglucky-博客园(cnblogs.com)。现在考虑另一个场景，年底要写年报，将一年的工作汇总。但通常不是像周报那样只是简单的罗......
常用xpath选择器和css选择器总结
xpath选择器表达式说明article选取所有article元素的所有子节点/article选取根元素articlearticle/a选取所有属于article的子元素的a元素//div选取所有div子元素（不论出现在文档任何地方）article//div选取所有属于article元素的后代的div元素，不管它出现在ar......
微信标签如何分类，可以标签群发吗？
微信群组太多？管理起来有难度？不知道怎么分类标签管理？别急，这就教你个好办法，可以轻松分类好友标签，还可以根据标签进行批量群发。在微信中，建立标签有三种途径，分别是：添加新联系人：设置备注和标签功能中，输入标签后，会自动建立新标签并将当前联系人加入此标签修改联系人备注和标签：修改备注和......

xpath的一次性同时获取a标签和p标签的内容？（下篇）

一、前言

二、实现过程

三、总结

相关文章

赞助商

阅读排行