首页 > 其他分享 >实战练习:用airtest-selenium脚本爬取百度热搜标题

实战练习:用airtest-selenium脚本爬取百度热搜标题

时间:2022-12-29 17:12:37浏览次数:62  
标签:脚本 web selenium driver 爬取 airtest 百度

1. 前言

很多同学,使用AirtestIDE都是做移动端的测试,其实它还有个隐藏功能,就是做web自动化测试。

搞网页测试,使用AirtestIDE的好处是,能借助selenium的辅助窗,帮助我们快捷地生产web自动化脚本。

这里用到的库叫做airtest-selenium。今天我们就利用airtest-selenium来完成一个简单的实操练习:自动爬取百度热搜标题。

2. 爬取标题的脚本

示例为一个简单的纯py脚本,它的功能是:

  • 打开chrome浏览器
  • 打开百度首页
  • 点击“百度热搜”
  • 获取热搜标题并print出来
# -*- encoding=utf8 -*-
__author__ = "AirtestProject"

from airtest.core.api import *
auto_setup(__file__)

# 初始化并打开chrome浏览器
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from airtest_selenium.proxy import WebChrome
driver = WebChrome()
driver.implicitly_wait(20)

# 打开百度首页
driver.get("https://www.baidu.com/")

# 点击百度热搜并切换到新标签页
driver.find_element_by_xpath("//*[@id=\"s-hotsearch-wrapper\"]/div/a/div/i").click()
driver.switch_to_new_tab()

# 打印百度热搜榜的标题
for hot in driver.find_elements_by_class_name("c-single-text-ellipsis"):
   print(hot.text)

3. 命令行运行Web自动化脚本

当然,写好web自动化脚本之后,我们其实也不用依赖于AirtestIDE来运行的。我们完全可以脱离IDE。

但相比于在IDE上运行web脚本,我们只需要在选项设置里面填一下chrome path这么简单。脱离IDE运行web脚本,我们所要准备的工作就多得多的。

1)python环境准备

首先确保我们有一个可用的python环境,其次,需要在环境里面装好第三方库:airtest、airtest-selenium、selenium。

另外还需要注意下,selenium的版本不能大于4.0,因为该版本airtest-selenium还未兼容。

2)chrome与chromedriver版本对应

另外,我们还需要确保运行环境设置好了版本对应的chromedriver,否则容易报错:

selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 98
Current browser version is 108.0.5359.73 with binary path C:\Program Files (x86)\Google\Chrome\Application\chrome.exe
3)命令行运行

以上2个步骤都确认以后,我们可以非常简单的在终端敲命令运行写好的web自动化脚本(因为这个练习,不需要生成报告什么的,所以运行命令非常简单):

4. 小结

那今天的web自动化小练习就到这里啦,如果同学们还有别的想看的自动化脚本,欢迎给我们留言!


Airtest官网https://airtest.netease.com/
Airtest教程官网https://airtest.doc.io.netease.com/
搭建企业私有云服务https://airlab.163.com/b2b

官方答疑 Q 群:117973773

呀,这么认真都看到这里啦,帮忙点个推荐支持一下呗,灰常感谢~

标签:脚本,web,selenium,driver,爬取,airtest,百度
From: https://www.cnblogs.com/AirtestProject/p/17013019.html

相关文章

  • Python 爬取微博指定博主所有内容
    这么做有啥用呢,一方面是为了防止他的微博删除,另一方面怕被系统和谐,所以就把他的微博内容爬取下来,然后保存到word文档中,以备不时查看...那么接下来进入爬虫分析环节,小编这里......
  • Python爬取抖音创作者所有短视频
    小伙伴们,大家好呀,上次给大家分享了​​如何爬取快手up主所有的短视频​​后,不少人在后台留言说,想要爬取抖音up主的所有短视频,那么今天代码就来了。其实有了​​爬取快手up主......
  • python爬取百度图库多张图片
    hello啊,各位小伙伴,眨眼间7月份过去了,八月已经悄然来临,不知道八月大家又立了什么样的flag,作为一个低产的公众号运营者,想想都是一阵莫名奇妙的辛酸,每月就三四篇文章,唉…不多......
  • 使用Py的多线程爬取P站,老司机慎入。
    hello呀,小伙伴们,今个给大家带来的是爬取P站的教程,别搞错,这个不是你想的那个p站。这样想肯定是你用黄黄的思想点进来的。众所周知,P站是个插画网站,也包含一些R18的插画。停停......
  • 使用xpath爬取对应百度贴吧下面的帖子图片
    hello,小伙伴们,上次给大家分享了如何使用python的正则匹配爬取百思不得姐的网站代码,虽然说正则匹配爬取网站的执行效率高,但是正则匹配的规则编写着实是令人头痛的一件事。今......
  • 利用python爬取百思不得姐demo实例
    作为一个刚接触爬虫的小白,在学习了一定的语法后,第一个目标就是找一个适合初学者的网站来小试牛刀。一般来讲都会选择一个难度系数比较低的网站来进行爬取,这样不仅有助于我们......
  • 利用bs4爬取传智的讲师团队信息
    终于五一了,好不容易迎来了小长假,首先在这里恭祝大家节日快乐,劳动人民最可爱,向劳动人民致敬,在这也祝愿大家的付出都能够得到回报。面对疫情后的复工复产,想必大家现在恨不得全......
  • 利用py爬取生日的那天哈勃望远镜拍到了什么?
    于1990年4月发射升空的哈勃太空望远镜迎来了升空30周年纪念。为此,美国宇航局(NASA)近日在其官网上发起一项活动——“哈勃望远镜在你生日那天看到了什么?”NASA邀请大家搜索自......
  • Python爬取意林杂志所有期刊文章
    可能很多人对这个意林杂志比较陌生,但是对于小编来说,那可是满满的回忆。记得我们上中学那时候读过的意林,那可是一本接着一本,其中有很多令人感动的故事,一直被温暖,被治愈。接下......
  • python爬取公众号链接里面的图片
    话不多说,步入今天文章的分享内容,今天给大家带来的是~~爬取微信公众号文章里面的图片。爬虫代码:#coding:utf-8#__auth__="maiz"#__date__="2021/3/27"importosimport......