DrissionPage

2024-12-26python的网页自动化工具DrissionPage
一直以来用的都是Python+Selenium实现自动化。直到发现了DrissionPage，实际用过之后写脚本速度提高了100%，执行效率提高了50%。代码简洁，功能强大，Selenium代码迁移也很丝滑。概述基于python的网页自动化工具。既能控制浏览器，也能收发数据包。可兼顾浏览器自动化的便利性和re
2024-12-04Python 浏览器自动化新利器：DrissionPage，让网页操作更简单！
Python浏览器自动化新利器：DrissionPage，让网页操作更简单！文章目录Python浏览器自动化新利器：DrissionPage，让网页操作更简单！
2024-12-04DrissionPage 过滑动验证码
首先安装：DrissionPagepipinstallDrissionPage安装ddddocr：pipinstallddddocr代码示例：fromDrissionPageimportChromiumPage,ChromiumOptionsimportrandomimporttimeimportddddocr#浏览器路径path=r'C:\ProgramFiles\Google\Chrome\Application\chro
2024-12-04「嵌入式系统设计与实现」书评：初步印象
本文首发于：【「嵌入式系统设计与实现」阅读体验】+初步印象-社区活动专版-电子技术论坛-广受欢迎的专业电子论坛!感谢电子发烧友论坛和电子工业出版社的赠书。我自己从事嵌入式系统的教学工作，也指导过学生参加嵌入式相关的比赛并获得过一些奖项。《嵌入式系统设计与实现
2024-12-02第8章应力状态分析强度理论精简版
2024-12-01C#面向对象之抽象，接口，运算符重载，属性，索引器
目录1抽象1.1抽象方法1.1.1抽象方法1.1.2虚方法1.1.3new1.2抽象属性1.3抽象示例2接口2.1定义2.2简单使用2.2.1声明使用接口2.2.2接口继承2.3接口显式实现和隐式实现2.3.1隐式实现2.3.2显式实现2.3.3多接口实现中的应用3运算符重载operator3.1简介3.2示例4属
2024-10-11使用DrissionPage自动化抓取Boss直聘网站数据
简介在大数据时代，信息的获取和处理变得越来越重要。对于求职者而言，能够快速准确地获取招聘信息是至关重要的。本文将介绍如何使用DrissionPage库来自动化浏览并抓取招聘网站上的职位信息。我们将以Boss直聘为例，展示如何抓取与Python爬虫工程师相关的职位列表。准备工作在
2024-09-13DrissionPage解决滑动验证
之前爬取某数据统计平台时遇到了相当严重的反爬机制，采用普通的Selenium也无法绕过。之前尝试过undetected_chromedriver可以使用，但无法设置无头模式，使用起来还是有一定的不美观性。正好近日学习了DrissionPage这款相当高效的工具，顺手掏出这个项目重构了一下。填输入数据相当简
2024-09-09DrissionPage过5秒盾：反CloudFlare反爬
5秒盾实例偶尔有用的解决方式：curl_cffi可以实现一些简单的反5秒盾。pipinstallcurl_cffifromcurl_cffiimportrequestsascffi_requestsheaders={"User-Agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/
2024-08-30怎么用xpath写drissionpage？或者用相对位置？
大家好，我是Python进阶者。一、前言前几天在Python最强王者交流群【黑科技·鼓包】问了一个Python网络爬虫处理的问题。问题如下：有没有大佬指点下怎么用xpath写drissionpage？或者用相对位置？我看了半天中文文档硬是写不出来。这是xpath //*[@id="ng-app"]/body/div/div/div[1]/
2024-08-22爬虫案例1-爬取图片的三种方式之一：DrissionPage篇(3)
@目录前言DrissionPage介绍实战共勉博客前言继requests篇和selenium篇，本文是爬取图片的最后一个案例，利用了python第三方库DrissionPage来自动化爬取图片。当然，爬取图片肯定不止这三种方法，还有基于python的scrapy框架，基于node.js的express框架以及基于Java的webmagic框架等等。D
2024-08-18DrissionPage实战之采集猫眼电影top100榜
在当今信息化的时代，数据的获取与分析变得愈发重要。电影行业作为一个充满活力的领域，吸引了大量观众和投资者。猫眼电影作为中国领先的电影票务平台之一，提供了丰富的电影信息和用户评价，成为了研究电影市场趋势和观众偏好的重要数据源。通过抓取猫眼电影的Top100榜单，开发者可以
2024-07-18基于DrissionPage实现淘宝商品信息的批量获取
摘要本文章主要讲解如何利用DrissionPage来避开淘宝的反爬机制，批量获取商品信息并保存到xlsx表格文件中，用于数据分析或深度学习模型的训练。（注：本文代码为一步一步调试出来的测试版，只是提供调试思路以及初步实现，并不能作为高效的成品程序，如有需要还请各位自行编写喵）1.淘宝
2024-07-02自动化（爬虫）工具 DrissionPage SessionPage模式 API介绍使用笔记（三）
自动化（爬虫）工具DrissionPageSessionPage模式API介绍使用笔记（三）目录启动驱动启动配置常用方法(API)启动最简单的启动方式，更多启动方式见这里fromDrissionPageimportSessionPage#session_or_options:Session对象或SessionOptions对象#timeout:超时时间（秒）o
2024-06-16python 小爬虫 DrissionPage+BeautifulSoup
哈喽，大家好，我要开始写博客啦
2024-06-11爬虫技术升级：如何结合DrissionPage和Auth代理插件实现数据采集
背景/引言在大数据时代，网络爬虫技术已经成为数据收集的重要手段之一。爬虫技术可以自动化地从互联网上收集数据，节省大量人力和时间成本。然而，当使用需要身份验证的代理服务器时，许多现有的爬虫框架并不直接支持代理认证。这就需要我们寻找替代方案，以便在爬虫过程中能够顺利通过代
2024-06-11爬虫自动化之DRISSIONPAGE实现随时切换代理IP
爬虫自动化之drissionpage实现随时切换代理iphttps://blog.csdn.net/qq_32334103/article/details/126133862下载SwitchyOmega地址:https://github.com/FelisCatus/SwitchyOmega/releases也可以直接用压缩文件打开,然后解压到当前文件夹123456789101112
2024-06-08分享一个超强的网页自动化工具！写得快，跑得快，开发人员狂喜（带私活）
「今天分享一个开源项目：可控制浏览器，也可收发数据包，可模拟键盘和鼠标的操作」背景做数据采集的同学应该知道，当我们采集要登录的网站时，不仅要分析数据包、JS源码，构造复杂的请求，还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高，开发效率不高。然后使用浏览器，可以
2024-05-17DrissionPage对浏览器的一些配置
DrissionPage对浏览器的一些配置ele=page.ele('中国日报')#查找text包含“中国日报”的元素page.wait.title_change('连铸坯表面纵裂纹的形成与控制研究现状')#等待title变化出现目标文本importtimeimportrandomfromDrissionPageimportChromiumPage,ChromiumO
2024-05-09DrissionPage自动化框架学习
DrissionPage学习官网：http://drissionpage.cn/features/intimate/自动化测试框架：DrissionPage1.DrissionPage事件1.1元素定位查找#根据属性查找，@后面可跟任意属性page.ele('@id:ele_id',timeout=2)#查找id为ele_id的元素，设置等待时间2秒page.eles('@class')#
2024-04-29爬虫自动化之drissionpage实现随时切换代理ip
爬虫自动化之drissionpage实现随时切换代理iphttps://blog.csdn.net/qq_32334103/article/details/126133862下载SwitchyOmega地址:https://github.com/FelisCatus/SwitchyOmega/releases importplatformfromDrissionPageimportChromiumPage,ChromiumOptions
2024-04-085秒盾cf-turnstile-response破解
可以参观相关文档：DrissionPage官网准备环境pipinstallDrissionPage目前DrissionPage是直接绕过5秒盾模块（selenium，异步等都需要配置），不需要任何配置可直接绕过当前网站的保护打开开发者#DrissionPage可以参观开发文档（url:https://drissionpage.cn/）fromDris