实战练习：用airtest-selenium脚本爬取百度热搜标题

时间：2022-12-29 17:12:37浏览次数：70

标签：脚本 web selenium driver 爬取 airtest 百度

1. 前言

很多同学，使用AirtestIDE都是做移动端的测试，其实它还有个隐藏功能，就是做web自动化测试。

搞网页测试，使用AirtestIDE的好处是，能借助selenium的辅助窗，帮助我们快捷地生产web自动化脚本。

这里用到的库叫做airtest-selenium。今天我们就利用airtest-selenium来完成一个简单的实操练习：自动爬取百度热搜标题。

2. 爬取标题的脚本

示例为一个简单的纯py脚本，它的功能是：

打开chrome浏览器
打开百度首页
点击“百度热搜”
获取热搜标题并print出来

# -*- encoding=utf8 -*-
__author__ = "AirtestProject"

from airtest.core.api import *
auto_setup(__file__)

# 初始化并打开chrome浏览器
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from airtest_selenium.proxy import WebChrome
driver = WebChrome()
driver.implicitly_wait(20)

# 打开百度首页
driver.get("https://www.baidu.com/")

# 点击百度热搜并切换到新标签页
driver.find_element_by_xpath("//*[@id=\"s-hotsearch-wrapper\"]/div/a/div/i").click()
driver.switch_to_new_tab()

# 打印百度热搜榜的标题
for hot in driver.find_elements_by_class_name("c-single-text-ellipsis"):
   print(hot.text)

3. 命令行运行Web自动化脚本

当然，写好web自动化脚本之后，我们其实也不用依赖于AirtestIDE来运行的。我们完全可以脱离IDE。

但相比于在IDE上运行web脚本，我们只需要在选项设置里面填一下chrome path这么简单。脱离IDE运行web脚本，我们所要准备的工作就多得多的。

1）python环境准备

首先确保我们有一个可用的python环境，其次，需要在环境里面装好第三方库：airtest、airtest-selenium、selenium。

另外还需要注意下，selenium的版本不能大于4.0，因为该版本airtest-selenium还未兼容。

2）chrome与chromedriver版本对应

另外，我们还需要确保运行环境设置好了版本对应的chromedriver，否则容易报错：

selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 98
Current browser version is 108.0.5359.73 with binary path C:\Program Files (x86)\Google\Chrome\Application\chrome.exe

3）命令行运行

以上2个步骤都确认以后，我们可以非常简单的在终端敲命令运行写好的web自动化脚本（因为这个练习，不需要生成报告什么的，所以运行命令非常简单）：

4. 小结

那今天的web自动化小练习就到这里啦，如果同学们还有别的想看的自动化脚本，欢迎给我们留言！

Airtest官网：https://airtest.netease.com/
Airtest教程官网：https://airtest.doc.io.netease.com/
搭建企业私有云服务：https://airlab.163.com/b2b

官方答疑 Q 群：117973773

呀，这么认真都看到这里啦，帮忙点个推荐支持一下呗，灰常感谢~

标签：脚本,web,selenium,driver,爬取,airtest,百度
From： https://www.cnblogs.com/AirtestProject/p/17013019.html

Python 爬取微博指定博主所有内容
这么做有啥用呢，一方面是为了防止他的微博删除，另一方面怕被系统和谐，所以就把他的微博内容爬取下来，然后保存到word文档中，以备不时查看...那么接下来进入爬虫分析环节，小编这里......
Python爬取抖音创作者所有短视频
小伙伴们，大家好呀，上次给大家分享了如何爬取快手up主所有的短视频后，不少人在后台留言说，想要爬取抖音up主的所有短视频，那么今天代码就来了。其实有了爬取快手up主......
python爬取百度图库多张图片
hello啊，各位小伙伴，眨眼间7月份过去了，八月已经悄然来临，不知道八月大家又立了什么样的flag,作为一个低产的公众号运营者，想想都是一阵莫名奇妙的辛酸，每月就三四篇文章，唉…不多......
使用Py的多线程爬取P站，老司机慎入。
hello呀，小伙伴们，今个给大家带来的是爬取P站的教程，别搞错，这个不是你想的那个p站。这样想肯定是你用黄黄的思想点进来的。众所周知，P站是个插画网站，也包含一些R18的插画。停停......
使用xpath爬取对应百度贴吧下面的帖子图片
hello,小伙伴们，上次给大家分享了如何使用python的正则匹配爬取百思不得姐的网站代码，虽然说正则匹配爬取网站的执行效率高，但是正则匹配的规则编写着实是令人头痛的一件事。今......
利用python爬取百思不得姐demo实例
作为一个刚接触爬虫的小白，在学习了一定的语法后，第一个目标就是找一个适合初学者的网站来小试牛刀。一般来讲都会选择一个难度系数比较低的网站来进行爬取，这样不仅有助于我们......
利用bs4爬取传智的讲师团队信息
终于五一了，好不容易迎来了小长假，首先在这里恭祝大家节日快乐，劳动人民最可爱，向劳动人民致敬，在这也祝愿大家的付出都能够得到回报。面对疫情后的复工复产，想必大家现在恨不得全......
利用py爬取生日的那天哈勃望远镜拍到了什么？
于1990年4月发射升空的哈勃太空望远镜迎来了升空30周年纪念。为此，美国宇航局（NASA）近日在其官网上发起一项活动——“哈勃望远镜在你生日那天看到了什么？”NASA邀请大家搜索自......
Python爬取意林杂志所有期刊文章
可能很多人对这个意林杂志比较陌生，但是对于小编来说，那可是满满的回忆。记得我们上中学那时候读过的意林，那可是一本接着一本，其中有很多令人感动的故事，一直被温暖，被治愈。接下......
python爬取公众号链接里面的图片
话不多说，步入今天文章的分享内容，今天给大家带来的是~~爬取微信公众号文章里面的图片。爬虫代码：#coding:utf-8#__auth__="maiz"#__date__="2021/3/27"importosimport......