XPATH

2024-11-20数据采集第四次实验
作业1要求：熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站：东方财富网：http://quote.eastmoney.com/center/g
2024-11-19数据采集实践4
课程链接https://edu.cnblogs.com/campus/fzu/2024DataCollectionandFusiontechnology作业链接https://edu.cnblogs.com/campus/fzu/2024DataCollectionandFusiontechnology/homework/13288gitee仓库链接https://gitee.com/wd_b/party-soldier-data-collection/tree
2024-11-16数据采集与融合技术实验四
数据采集与融合技术作业四码云链接完整代码链接：gitte作业①:要求：▪熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。▪使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据
2024-11-14实验4
作业1要求：熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站：东方财富http://quote.eastmoney.com/center/grid
2024-11-14第八课 Python自动化之selenium
python+seleniumselenium是一个第三方库，python有很多库；1、什么是ui自动化?通过模拟手工操作用户ui页面的方式，用代码去实现自动化操作和验证的行为。2、ui自动化的优点？（1）解决重复性的功能测试和验证（2）减少测试人员在回归测试时用例漏测和验证点的漏测（3）减少冒烟测试，回归测试的
2024-11-12数据采集实验四
作业一（1）实验内容要求熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站东方财富网输出信息MYSQL
2024-11-12使用python爬取百度热搜
文章目录前言一、requests是什么？二、使用步骤1.引入库2.获取页面数据3.使用xpath解析页面，获取词条列表信息4.获取指定元素信息，添加到dataframe中5.保存数据到指定的文件或数据库总结前言本文介绍使用request获取百度热搜的简单功能一、requests是什么？Pythonreq
2024-11-10基于Python电影票房数据分析可视化系统 Flask框架豆瓣电影票房 MySQL数据库大数据毕业设计✅
博主介绍：✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久，选择我们就是选择放心、选择安心毕业✌>
2024-11-09【浪潮商城-注册安全分析报告-无验证方式导致安全隐患】
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机
2024-11-06Zabbix7.0教程：新增Browser监控项
1 前言 Zabbix 7.0.0版本之后，增加了“Browser”监控项类型，即浏览器监控，能够使用浏览器监控复杂的网站和web应用。浏览器监控项允许执行用户定义的JavaScript代码来模拟与浏览器相关的操作，例如点击、输入文本、网页导航等。该监控项通过HTTP/HTTPS收集数据，并部分实现了
2024-11-04python爬虫：xpath的基本使用指南
当面对一个新网站时，了解其数据加载逻辑是获取所需信息的关键。以下是一份详细的技术指南，帮助你分析和提取网站数据。1.数据加载来源分析1.1数据从页面源代码加载浏览器获取页面源代码浏览器通过发送HTTP请求获取页面源代码。作为开发者，我们可以通过编程模拟这一过程。
2024-10-22使用Python抓取房源信息
1.引言在当今大数据时代，网络爬虫成为获取信息的重要手段之一。本文将以某家二手房为例，演示如何使用Python爬虫抓取房源信息，并将这些信息保存到Excel文件中。目标网站2.准备工作2.1安装必要的库在开始之前，请确保你的环境中已经安装了以下Python库：requests：用于发送H
2024-10-17爬虫之数据提取
HTML数据提取这一片文章,我们一起学习如何利用HTML标签来提取数据。我们打开二手房网站:我们打开开发者工具,找到请求:这次我们找的请求,和以前的不一样了,所以这里面带大家找一找,以前我们找的请求都是json格式的响应数据,那今天由于我们要学习如何提取ht
2024-10-15xpath案例-豆瓣top250电影
需求：需求：爬取电影名称、评分、引言、详情页的url，翻页爬取1-10页。代码：importrequestsfromlxmlimportetree'''url分析:第一页：https://movie.douban.com/top250第二页：https://movie.douban.com/top250?start=25&filter=第三页：https://movie.douban.com/top250
2024-10-15数据解析 - xpath 语法
1、基础语法（1）/说明：从根节点开始。示例：/html/body（2）//说明：选择匹配的任何位置。示例：//input（3）.说明：当前节点。（4）..说明：父节点。（5）@说明：选择属性。示例：//*[@id="kw"]#表示选择具备id="kw"属性的节点（6）[node]说明：选择所有node子元素。（7）[@attr]说明：选取带有attr属
2024-09-29xpath解析数据
节点的关系：父子同胞先辈后代常用路径表达式表达式描述nodename选取此节点的所有子节点/从根节点选取//从匹配选择的当前节点中选择文档的节点.获取当前节点..选取当前节点的父节点@选择属性通配符通配符描述*匹配任何元素节点
2024-09-25XPath【详细解读，持续更新中】
目录XPath是什么呢？Xpath的核心功能与特点XPath的应用XPath中的路径表达式与节点以及相关语法XPath中的节点XPath中的其他节点术语节点间的关系XPath路径表达式的语法选取节点谓语（Predicates）选取未知节点选取若干路径XPath中的轴（Axes）轴的相关案例XPath运算
2024-09-25一文搞懂XPath查找html dom
博主介绍：大家好，我是Yuperman，互联网宇宙厂经验，17年医疗健康行业的码拉松奔跑者，曾担任技术专家、架构师、研发总监负责和主导多个应用架构。技术范围：目前专注java体系，以及golang、.Net、软件架构、DDD、微服务、redis、nginx、tomcat、mysql、oracle等业务范围：从数字医
2024-09-19开发者工具（F12）进行元素定位
步骤1：打开开发者工具使用F12:打开你想要查找元素的网页。按F12键（或者右键点击页面，选择“检查”）以打开浏览器的开发者工具。选择Elements面板:在开发者工具中，通常会默认打开Elements面板。该面板显示网页的HTML结构和相关的CSS样式。步骤2：查找元素
2024-09-16xpath 选择器的语法
选择节点： //tag：选择文档中所有tag元素。 /tag：选择根节点下的tag元素。 //tag[@attribute='value']：选择具有特定属性值的tag元素。选择子节点： tag1/tag2：选择tag1下的所有tag2子节点。 tag1/*：选择tag1下的所有子元素。选择父节点： ..：选择
2024-09-07【Python xpath爬虫实战】抓取下厨房的菜谱信息，并存储到MySQL数据库
获取全部的本周最受欢迎菜谱信息本周最受欢迎菜谱_下厨房获取标题，详情页链接，原材料列表，七天内做过人数，作者字段数据需要存入mysqlimportrequestsfromlxmlimportetreeimportpymysqldb_config={'host':'127.0.0.1',#数据库地址'user':'root',#
2024-09-07【Python xpath爬虫实战】抓取纵横小说图书信息，并存储到MySQL数据库
写在前面本篇博客只是为练习xpath的用法，其中的实践案例用其他的更简单方法也可以实现。想着实战演练一遍（主要是里面的案例无法使用，哭唧唧），找了一下经常爬取的网站，例如淘宝，知网什么的，但是这些网站都需要登录，难度偏大一点，就给否决掉了，最后选到了纵横小说排行榜这个网站，因为这个
2024-09-059.5内网横向&代理&隧道
Socks代理思路：工具：nps、frp、ngrok、reGeorg、sockscap64、earthworm、proxifier、proxychains知识点1、内外网简单知识2、内网1和内网2通信问题3、正向反向协议通信连接问题4、内网穿透代理隧道技术说明代理解决通信问题，隧道解决流量分析、流量监控工具、防火墙等内网穿
2024-09-02第十周总结（2024.9.7）
保存文件时候会报错“FileNotFoundError：Nosuchfileordirectory”Python在保存文件时，如果路径下你要操作的文件不存在，它会自动创建一个文件，然后写入数据。但是，如果是路径中的文件夹不存在，则不会自动创建，而是会报错上面那样的错误。只是你的路径中没有对应的文件夹而已，缺哪
2024-08-30怎么用xpath写drissionpage？或者用相对位置？
大家好，我是Python进阶者。一、前言前几天在Python最强王者交流群【黑科技·鼓包】问了一个Python网络爬虫处理的问题。问题如下：有没有大佬指点下怎么用xpath写drissionpage？或者用相对位置？我看了半天中文文档硬是写不出来。这是xpath //*[@id="ng-app"]/body/div/div/div[1]/