「今天分享一个开源项目:可控制浏览器,也可收发数据包,可模拟键盘和鼠标的操作」
背景
做数据采集的同学应该知道,当我们采集要登录的网站时,不仅要分析数据包、JS 源码,构造复杂的请求,还要应付验证码、JS 混淆、签名参数等反爬手段,
门槛较高,开发效率不高。然后使用浏览器,可以很大程度上绕过这些坑,但是浏览器运行效率仍然不高。
因此,今天给大家介绍的DrissionPage
正是为了解决上诉问题,实现“写得快”和“跑得快”,提供一种人性化的使用方法,提高开发和运行效率。
介绍
DrissionPage
是一个基于 python 的网页自动化工具,秉着简洁、易用 、方便三个理念,不仅支持 Chromium 内核浏览器。它还将控制浏览器和收发请求两大功能合二为一,并提供了统一、简洁的接口。并且有强大的特性和亮点:
-
采用全自研的内核,内置了 N 多实用功能,对常用功能作了整合和优化
-
功能强大,内置无数人性化设计和便捷功能
-
语法简洁而优雅,代码量少,对新手友好
快速使用
官方提供了非常详细的文档如下:
官网地址:http://g1879.gitee.io/drissionpagedocs/
1、安装库
使用 pip 安装 DrissionPage
#安装
pip install DrissionPage
#升级
pip install DrissionPage --upgrade
2、使用示例
页面类
页面类用于控制浏览器,或收发数据包,是最主要的工具。DrissionPage 包含三种主要页面类。根据须要在其中选择使用。
WebPage
是功能最全面的页面类,既可控制浏览器,也可收发数据包:
from DrissionPage import WebPage
如果只要控制浏览器,导入ChromiumPage
:
from DrissionPage import ChromiumPage
如果只要收发数据包,导入SessionPage
:
from DrissionPage import SessionPage
配置工具
很多时候我们须要设置启动参数,可导入以下两个类,但不是必须的。
ChromiumOptions
类用于设置浏览器启动参数:
from DrissionPage import ChromiumOptions
SessionOptions
类用于设置Session
对象启动参数:
from DrissionPage import SessionOptions
Settings
用于设置全局配置:
from DrissionPage.common import Settings
其它工具
有两个我们可能须要用到的工具,需要时可以导入。
动作链,用于模拟一系列键盘和鼠标的操作:
from DrissionPage.common import ActionChains
键盘按键类,用于键入 ctrl、alt 等按键:
from DrissionPage.common import Keys
与 selenium 一致的By
类,便于项目迁移:
from DrissionPage.common import By
整体使用非常简单,可以根据文档各取所需,具体参考官方的详细使用文档
http://g1879.gitee.io/drissionpagedocs/usage_introduction/
总结
DrissionPage作为一个基于 python 的网页自动化工具,并且在社区拥有2.3k的star,可以说功能非常强大,社区也比较活跃,作者也会及时更新版本,可以放心使用
最后在贴上地址:
使用文档:http://g1879.gitee.io/drissionpagedocs/
github代码:「https://github.com/g1879/DrissionPage」
gitee代码:「https://gitee.com/g1879/DrissionPage」
写在最后(私活源码)
今天还给大家分享一套基于Springboot+Vue的仓库管理系统源码,在实际项目中可以直接复用。(免费提供,文末自取)
一、系统运行图(设计报告和接口文档)
1、登陆页面
2、物品信息管理
3、设计报告包含接口文档
二、系统搭建视频教程(部分截图)
源码免费领取方式
扫码关注本号,后台回复 仓库
扫码关注本号,后台回复 仓库
持续关注本号,分享更多项目源码
标签:DrissionPage,跑得快,开发人员,源码,文档,import,浏览器,私活,数据包 From: https://blog.csdn.net/m0_68103666/article/details/143530929