• 2024-11-20数据采集第四次实验
    作业1要求:熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站:东方财富网:http://quote.eastmoney.com/center/g
  • 2024-11-19数据采集实践4
    课程链接https://edu.cnblogs.com/campus/fzu/2024DataCollectionandFusiontechnology作业链接https://edu.cnblogs.com/campus/fzu/2024DataCollectionandFusiontechnology/homework/13288gitee仓库链接https://gitee.com/wd_b/party-soldier-data-collection/tree
  • 2024-11-16数据采集与融合技术实验四
    数据采集与融合技术作业四码云链接完整代码链接:gitte作业①:要求:▪熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。▪使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据
  • 2024-11-14实验4
    作业1要求:熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站:东方财富http://quote.eastmoney.com/center/grid
  • 2024-11-14第八课 Python自动化之selenium
    python+seleniumselenium是一个第三方库,python有很多库;1、什么是ui自动化?通过模拟手工操作用户ui页面的方式,用代码去实现自动化操作和验证的行为。2、ui自动化的优点?(1)解决重复性的功能测试和验证(2)减少测试人员在回归测试时用例漏测和验证点的漏测(3)减少冒烟测试,回归测试的
  • 2024-11-12数据采集实验四
    作业一(1)实验内容要求熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站东方财富网输出信息MYSQL
  • 2024-11-12使用python爬取百度热搜
    文章目录前言一、requests是什么?二、使用步骤1.引入库2.获取页面数据3.使用xpath解析页面,获取词条列表信息4.获取指定元素信息,添加到dataframe中5.保存数据到指定的文件或数据库总结前言本文介绍使用request获取百度热搜的简单功能一、requests是什么?Pythonreq
  • 2024-11-10基于Python电影票房数据分析可视化系统 Flask框架 豆瓣电影票房 MySQL数据库 大数据毕业设计✅
    博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久,选择我们就是选择放心、选择安心毕业✌>
  • 2024-11-09【浪潮商城-注册安全分析报告-无验证方式导致安全隐患】
    前言由于网站注册入口容易被黑客攻击,存在如下安全问题:1.暴力破解密码,造成用户信息泄露2.短信盗刷的安全问题,影响业务及导致用户投诉3.带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案,但在机
  • 2024-11-06Zabbix7.0教程:新增Browser监控项
    1 前言    Zabbix 7.0.0版本之后,增加了“Browser”监控项类型,即浏览器监控,能够使用浏览器监控复杂的网站和web应用。浏览器监控项允许执行用户定义的JavaScript代码来模拟与浏览器相关的操作,例如点击、输入文本、网页导航等。该监控项通过HTTP/HTTPS收集数据,并部分实现了
  • 2024-11-04python爬虫:xpath的基本使用指南
    当面对一个新网站时,了解其数据加载逻辑是获取所需信息的关键。以下是一份详细的技术指南,帮助你分析和提取网站数据。1.数据加载来源分析1.1数据从页面源代码加载浏览器获取页面源代码浏览器通过发送HTTP请求获取页面源代码。作为开发者,我们可以通过编程模拟这一过程。
  • 2024-10-22使用Python抓取房源信息
    1.引言在当今大数据时代,网络爬虫成为获取信息的重要手段之一。本文将以某家二手房为例,演示如何使用Python爬虫抓取房源信息,并将这些信息保存到Excel文件中。目标网站2.准备工作2.1安装必要的库在开始之前,请确保你的环境中已经安装了以下Python库:requests:用于发送H
  • 2024-10-17爬虫之数据提取
    HTML数据提取这一片文章,我们一起学习如何利用HTML标签来提取数据。我们打开二手房网站:我们打开开发者工具,找到请求:这次我们找的请求,和以前的不一样了,所以这里面带大家找一找,以前我们找的请求都是json格式的响应数据,那今天由于我们要学习如何提取ht
  • 2024-10-15xpath案例-豆瓣top250电影
    需求:需求:爬取电影名称、评分、引言、详情页的url,翻页爬取1-10页。代码:importrequestsfromlxmlimportetree'''url分析:第一页:https://movie.douban.com/top250第二页:https://movie.douban.com/top250?start=25&filter=第三页:https://movie.douban.com/top250
  • 2024-10-15数据解析 - xpath 语法
    1、基础语法(1)/说明:从根节点开始。示例:/html/body(2)//说明:选择匹配的任何位置。示例://input(3).说明:当前节点。(4)..说明:父节点。(5)@说明:选择属性。示例://*[@id="kw"]#表示选择具备id="kw"属性的节点(6)[node]说明:选择所有node子元素。(7)[@attr]说明:选取带有attr属
  • 2024-09-29xpath解析数据
    节点的关系:父子同胞先辈后代常用路径表达式表达式描述nodename选取此节点的所有子节点/从根节点选取//从匹配选择的当前节点中选择文档的节点.获取当前节点..选取当前节点的父节点@选择属性通配符通配符描述*匹配任何元素节点
  • 2024-09-25XPath【详细解读,持续更新中】
    目录XPath是什么呢?Xpath的核心功能与特点XPath的应用XPath中的路径表达式与节点以及相关语法XPath中的节点XPath中的其他节点术语节点间的关系XPath路径表达式的语法选取节点谓语(Predicates)选取未知节点选取若干路径XPath中的轴(Axes)  轴的相关案例XPath运算
  • 2024-09-25一文搞懂XPath查找html dom
     博主介绍: 大家好,我是Yuperman,互联网宇宙厂经验,17年医疗健康行业的码拉松奔跑者,曾担任技术专家、架构师、研发总监负责和主导多个应用架构。技术范围: 目前专注java体系,以及golang、.Net、软件架构、DDD、微服务、redis、nginx、tomcat、mysql、oracle等业务范围: 从数字医
  • 2024-09-19开发者工具(F12)进行元素定位
    步骤1:打开开发者工具使用F12:打开你想要查找元素的网页。按F12键(或者右键点击页面,选择“检查”)以打开浏览器的开发者工具。选择Elements面板:在开发者工具中,通常会默认打开Elements面板。该面板显示网页的HTML结构和相关的CSS样式。步骤2:查找元素
  • 2024-09-16xpath 选择器的语法
    选择节点: //tag:选择文档中所有tag元素。 /tag:选择根节点下的tag元素。 //tag[@attribute='value']:选择具有特定属性值的tag元素。 选择子节点: tag1/tag2:选择tag1下的所有tag2子节点。 tag1/*:选择tag1下的所有子元素。 选择父节点: ..:选择
  • 2024-09-07【Python xpath爬虫实战】抓取下厨房的菜谱信息,并存储到MySQL数据库
    获取全部的本周最受欢迎菜谱信息本周最受欢迎菜谱_下厨房获取标题,详情页链接,原材料列表,七天内做过人数,作者字段数据需要存入mysqlimportrequestsfromlxmlimportetreeimportpymysqldb_config={'host':'127.0.0.1',#数据库地址'user':'root',#
  • 2024-09-07【Python xpath爬虫实战】抓取纵横小说图书信息,并存储到MySQL数据库
    写在前面本篇博客只是为练习xpath的用法,其中的实践案例用其他的更简单方法也可以实现。想着实战演练一遍(主要是里面的案例无法使用,哭唧唧),找了一下经常爬取的网站,例如淘宝,知网什么的,但是这些网站都需要登录,难度偏大一点,就给否决掉了,最后选到了纵横小说排行榜这个网站,因为这个
  • 2024-09-059.5内网横向&代理&隧道
    Socks代理思路:工具:nps、frp、ngrok、reGeorg、sockscap64、earthworm、proxifier、proxychains知识点1、内外网简单知识2、内网1和内网2通信问题3、正向反向协议通信连接问题4、内网穿透代理隧道技术说明代理解决通信问题,隧道解决流量分析、流量监控工具、防火墙等内网穿
  • 2024-09-02第十周总结(2024.9.7)
    保存文件时候会报错“FileNotFoundError:Nosuchfileordirectory”Python在保存文件时,如果路径下你要操作的文件不存在,它会自动创建一个文件,然后写入数据。但是,如果是路径中的文件夹不存在,则不会自动创建,而是会报错上面那样的错误。只是你的路径中没有对应的文件夹而已,缺哪
  • 2024-08-30怎么用xpath写drissionpage?或者用相对位置?
    大家好,我是Python进阶者。一、前言前几天在Python最强王者交流群【黑科技·鼓包】问了一个Python网络爬虫处理的问题。问题如下:有没有大佬指点下怎么用xpath写drissionpage?或者用相对位置?我看了半天中文文档硬是写不出来。这是xpath //*[@id="ng-app"]/body/div/div/div[1]/