首页 > 其他分享 >Airtest-Selenium实操小课②:刷B站视频

Airtest-Selenium实操小课②:刷B站视频

时间:2024-01-11 15:46:10浏览次数:31  
标签:Selenium driver element 小课 cookie 实操 print div class

此文章来源于项目官方公众号:“AirtestProject”
版权声明:允许转载,但转载必须保留原链接;请勿用作商业或者非法用途

1. 前言

上一课我们讲到用Airtest-Selenium爬取网站上我们需要的信息数据,还没看的同学可以戳这里看看~

那么今天的推文,我们就来说说看,怎么实现看b站、刷b站的日常操作,包括点击暂停,发弹幕,点赞,收藏等操作,仅供大家参考学习~

2.需求分析和准备

整体的需求大致可以分为以下步骤:

  • 打开chrome浏览器
  • 打开百度网页
  • 搜索“哔哩哔哩”
  • 点击进入“哔哩哔哩”官网
  • 搜索关键词“Airtest酱”
  • 点击进入“Airtest酱”首页,随机点击播放视频
  • 并对视频点击暂停,发弹幕,点赞,收藏

在写脚本之前,我们需要准备好社区版AirtestIDE(目前最新版为1.2.16),设置好chrome.exe地址和对应的driver;并且确保我们的chrome浏览器版本不是太高以及selenium是4.0以下即可(这些兼容问题我们都会在后续的版本修复)。

3. 脚本实现与运行效果

3.1 脚本运行效果

我们在编写这次代码的时候,我们主要是使用了页面元素定位的方式去进行操作交互的,除此之外还实现了保存cookie、读取cookie的一个操作。大家在日常使用也会发现,在首次通过脚本开启的chrome网页界面是无cookie的,那么我们在进行一些任务之前是需要先登录后才能进行下一步操作的,可以通过首次登录时读取cookie数据保存到本地,往后每次运行只需要读取本地的cookie文件就可以轻松登录啦~

先来看下我们整体的运行效果:

3.2 完整代码分享

这里也附上完整的示例代码给大家参考,有需要的同学可以自取学习哦:

# -*- encoding=utf8 -*-
from airtest.core.api import *
# 引入selenium的webdriver模块
from airtest_selenium.proxy import WebChrome
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import threading
import time
import random
import json

#保存以及调用cookie的线程
class UtilFunc():
    def cookie_is_exist_(self, cook_name='_'):      # 检查txt文件是否存在
        if os.path.exists(f'{cook_name}cookies.txt'):
            return True
        return False

    def cookie_save_(self, driver, cook_name='_'):     #保存cookie到txt文件中以便下次读取
        # 获取当前页面的所有cookie
        cookies = driver.get_cookies()
        # 将cookie转换为JSON字符串
        cookies_json = json.dumps(cookies)
        # 保存cookie到txt文件
        with open(f'{cook_name}cookies.txt', 'w') as file:
            file.write(cookies_json)
        print(f"保存cookies:{cookies}")

    def cookie_set_(self, driver, cook_name='_'):     #读取cookie文件并给当前网站设置已存cookie
        # 从txt文件读取JSON_cookie数据
        with open(f'{cook_name}cookies.txt', 'r', encoding='gbk') as file:
            json_data = file.read()
        # 将JSON数据转换为列表
        data_list = json.loads(json_data)
        for cookie in data_list:
            driver.add_cookie(cookie)
        print("设置cookie")


# 创建一个实例,代码运行到这里,会打开一个chrome浏览器
driver = WebChrome()
isLogin = False   #存储登录状态值,False为未登录,True为已登录

#打开chrome浏览器并打开视频播放
def start_selenium():
    driver.implicitly_wait(20)
    driver.get("https://www.baidu.com/")
    # 输入搜索关键词并提交搜索
    search_box = driver.find_element_by_name('wd')
    search_box.send_keys('哔哩哔哩')
    search_box.submit()

    try:
    # 查找搜索结果中文本为 "哔哩哔哩" 的元素并点击
        results = driver.find_elements_by_xpath('//div[@id="content_left"]//span[contains(text(), "哔哩哔哩")]')
        if results:
            results[0].click()
            print("点击了哔哩哔哩搜索结果")
    except Exception as e:
        element = driver.find_element_by_xpath(
            "//div[@id='content_left']/div[@id='1']/div[@class='c-container']/div[1]/h3[@class='c-title t t tts-title']/a")
        element.click()
    driver.switch_to_new_tab()  # 切换界面

    util_cookie = UtilFunc()
    if util_cookie.cookie_is_exist_("Airtest酱登录"):  # 存在cookie文件,设置cookie
        util_cookie.cookie_set_(driver, "Airtest酱登录")
    # 输入搜索关键词并提交搜索
    search_box = driver.find_element_by_class_name('nav-search-input')
    search_box.send_keys('Airtest酱')
    # 模拟发送Enter键
    search_box.send_keys(Keys.ENTER)
    sleep(5)
    driver.switch_to_new_tab()  # 切换界面

    results_ = driver.find_elements_by_xpath(
        '//div[@class="bili-video-card__info--right"]//span[contains(text(),"Airtest酱")]')
    if results_:
        results_[0].click()
    driver.switch_to_new_tab()  # 切换界面

    driver.refresh()
    sleep(2)
    video_ele = driver.find_element_by_xpath("//div[@title='14天Airtest自动化测试小白课程']")
    # 滚动到指定元素处
    driver.execute_script("arguments[0].scrollIntoView(true);", video_ele)
    sleep(5)
    video_ele.click()
    driver.switch_to_new_tab()  # 切换界面

    # 获取所有视频
    video_list = driver.find_elements_by_xpath("//ul[@class='row video-list clearfix']//a[@class='title']")
    random_element = random.choice(video_list)
    random_element.click()  # 随机播放一个
    driver.switch_to_new_tab()  # 切换界面

#登录
def is_login():
    """线程检测登录弹窗"""

    def is_no_login(*args):
        global isLogin  # 在线程内修改外部常量的值
        no_login_tip = True
        while True:
            element = driver.find_elements_by_css_selector('.bili-mini-content-wp')
            if len(element) > 0:
                if no_login_tip:
                    print("未登录 请在五分钟内扫码")
                    no_login_tip = False
            else:
                print("未检测到登录弹窗")
                check_login_ele = driver.find_elements_by_css_selector('.bpx-player-dm-wrap')
                if not check_login_ele:
                    isLogin = True
                    UtilFunc().cookie_save_(driver, "Airtest酱登录")
                    print("保存cookie")
                    break
                log_text_array = [element.text for element in check_login_ele]  # 使用列表推导式简化代码
                if "请先登录或注册" in log_text_array:
                    loginbtn = driver.find_elements_by_xpath(
                        "//div[@class='bili-header fixed-header']//div[@class='header-login-entry']")
                    if loginbtn:
                        loginbtn[0].click()
                    isLogin = False
                    print("判断cookie文件是否存在,方便下次调用,设置后刷新页面")
                else:
                    isLogin = True
                    UtilFunc().cookie_save_(driver, "Airtest酱登录")
                    print("保存cookie")
                    break

    thread = threading.Thread(target=is_no_login, args=("args",))
    thread.start()

#暂停播放
def video_pause_and_play(check_btn=False):
    if isLogin:
        try:
            paus_btn = driver.find_elements_by_xpath(
                "//*[@id=\"bilibili-player\"]//div[@class='bpx-player-ctrl-btn bpx-player-ctrl-play']")
            if paus_btn[0]:
                detection_time1 = driver.find_elements_by_xpath(
                    '//*[@class="bpx-player-control-bottom-left"]//div[@class="bpx-player-ctrl-time-label"]')
                start_time = detection_time1[0].text
                sleep(5)
                # 时间戳检测是否在播放
                detection_time2 = driver.find_elements_by_xpath(
                    '//*[@class="bpx-player-control-bottom-left"]//div[@class="bpx-player-ctrl-time-label"]')
                end_time = detection_time2[0].text
                if start_time == end_time or check_btn:
                    print("点击播放(暂停)按钮")
                    paus_btn[0].click()
        except Exception as e:
            print(f"点击播放(暂停)出错{e}")

#发送弹幕
def video_sms(sms_body="不错"):
    if isLogin:
        try:
            sms_input_edit = driver.find_element_by_xpath("//input[@class='bpx-player-dm-input']")
            sms_input_edit.send_keys(sms_body)
            # 模拟发送Enter键
            sms_input_edit.send_keys(Keys.ENTER)
        except Exception as e:
            print(f"发弹幕出错{e}")
    print(f"发送弹幕:{sms_body}")

#点赞
def video_love():
    if isLogin:
        print("点赞")
        try:
            sms_input_edit = driver.find_elements_by_xpath(
                "//div[@class='toolbar-left-item-wrap']//div[@class='video-like video-toolbar-left-item']")
            if not sms_input_edit:
                print("已经点赞")
                return
            sms_input_edit[0].click()
        except Exception as e:
            print(f"点赞出错{e}")

#收藏
def video_collect():
    if isLogin:
        print("收藏")
        try:
            colle_btn = driver.find_elements_by_xpath(
                "//div[@class='toolbar-left-item-wrap']//div[@class='video-fav video-toolbar-left-item']")
            if not colle_btn:
                print("已经收藏")
                return
            colle_btn[0].click()
            sleep(2)
            list_coll = driver.find_elements_by_xpath("//div[@class='group-list']//ul/li/label")
            random_element = random.choice(list_coll)  # 随机收藏
            # 滚动到指定元素处
            driver.execute_script("arguments[0].scrollIntoView(true);", random_element)
            sleep(2)
            random_element.click()  # 随机收藏一个
            sleep(2)
            driver.find_element_by_xpath("//div/button[@class='btn submit-move']").click()  # 确认收藏
        except Exception as e:
            print(f"收藏出错{e}")


# 等待元素出现
def wait_for_element(driver, selector, timeout=60 * 5):
    try:
        element = WebDriverWait(driver, timeout).until(
            EC.presence_of_element_located((By.XPATH, selector))
        )
        return element
    except Exception:
        print("元素未出现")
        return None

#头像元素初始化
selem = "//div[@class='bili-header fixed-header']//*[contains(@class, 'header-avatar-wrap--container mini-avatar--init')]"

if __name__ == "__main__":
    start_selenium()  # 开启浏览器找到视频播放
    is_login()  # 检测是否出现登录弹窗
    # 等待元素出现
    element = wait_for_element(driver, selem)
    if element:
        print("检测到已经登录")
        # 暂停和播放视频
        for _ in range(2):
            video_pause_and_play()
            sleep(3)
        driver.refresh()
        # 发送弹幕
        sms_list = ["感觉不错,收藏了", "666,这么强", "自动化还得看airtest", "干货呀", "麦克阿瑟直呼内行"]
        for item in sms_list:
            wait_time = random.randint(5, 10)  # 随机生成等待时间,单位为秒
            time.sleep(wait_time)  # 等待随机的时间
            video_sms(item)  # 评论

        # 点赞和收藏视频
        for action in [video_love, video_collect]:
            action()
            sleep(3)
    else:
        print("登录超时")

3.2 重要知识点

1)切换新页面并打开新的标签页
driver.switch_to_new_tab()
**2)将随机的元素 random_element对象的“顶端”移动到与当前窗口的“顶部”**对齐。
driver.execute_script("arguments[0].scrollIntoView(true);", random_element)

3) 从非空序列中随机选取一个数据并返回,该序列可以是list、tuple、str、set**。**

random.choice()

4) 通过实例化threading.Thread类创建线程,target:在线程中调用的对象,可以为函数或者方法;args为target对象的参数。

start():开启线程,如果线程是通过继承threading.Thread子类的方法定义的,则调用该类中的run()方法;start()只能调用一次,否则报RuntimeError。

threading.Thread(target=is_no_login, args=("args",))
thread.start()

5) 使用expected_conditions模块(在使用时通常重命名为EC模块)去判断特定元素是否存在于页面DOM树中,如果是,则返回该元素(单个元素),否则就报错。

EC.presence_of_element_located((By.XPATH, selector))

4. 注意事项与小结

4.1 相关教程

4.2 课程小结

在本周的课程中,我们介绍了如何使用Airtest-selenium进行自动化刷B站视频的操作流程,也分享了Airtest-selenium比较常见的用法。但是,请大家注意,我们的分享仅供学习参考哦!我们分享的代码并不是永远适用的,因为网页的页面元素可能会不断更新。

同时,我们也非常欢迎同学们能够提供自己常用场景的代码,我们会积极分享相关的使用技巧。让我们一起努力,共同进步~


AirtestIDE下载:airtest.netease.com/
Airtest 教程官网:airtest.doc.io.netease.com/
搭建企业私有云服务:airlab.163.com/b2b

官方答疑 Q 群:117973773

标签:Selenium,driver,element,小课,cookie,实操,print,div,class
From: https://www.cnblogs.com/AirtestProject/p/17958701

相关文章

  • 自定义快捷键实操与踩坑
    0.缘起要做一个自定义快捷键的功能,web端实现。这里分为两块逻辑,一部分是快捷键的应用,一部分是快捷键的定义。先从应用说起,快捷键实际上是对浏览器按键动作的监听,不过由于浏览器本身也有快捷键,就会有冲突的情况,自定义的要求应运而生。快捷键的定义,其实类似于设置的功能,也是存、......
  • selenium获取淘宝内容
    淘宝的反爬非常厉害,即使模拟了浏览器,仍然会有一大堆验证流程,首先声明这里只是实现了可用的代码,并不实用。下面是一段示例代码,用于模拟爬取淘宝特定关键词下,按销量排序,商品的价格、店名等数据:在开始之前,要下载谷歌浏览器和对应的webdriver,Python、以及Python安装selenium,这句话仅......
  • 为什么selenium会被识别出来
    因为浏览器指纹暴露了身份可以通过下面这个网址检测,如果是selenium打开的,就会显示红色Antibot(sannysoft.com) 可以用selenium调试手动打开的浏览器来伪装:首先命令行加参数打开浏览器:startchrome.exe --remote-debugging-port=9222然后selenium加上以下选项fromsele......
  • 查看selenium具体版本的方法
    1、查看自己selenium版本方法一:本机进入CMD在cmd窗口中输入pipshowselenium如果是在Pycharm中直接安装的selenium。则有可能会有如下提示。那么请尝试方法二。方法二:在pycharm中查看selenium版本步骤一:在pycharm里打开命令行,输入python步骤二:执行importselenium和help(selen......
  • 使用Python+selenium实现第一个自动化测试脚本
    这篇文章主要介绍了使用Python+selenium实现第一个自动化测试脚本,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧最近在学web自动化,记录一下学习过程。此处我选用python3.6+selenium3.0,均用最新版本,以适应......
  • selenium窗口切换
    一、handle窗口切换当点击某个元素后,会重新生成一个新的页签,但此时我们的操作仍然在原先的窗口当中,如果要在新的窗口继续操作元素,那么就要用到handle窗口切换的方法。常用方法:window_handles:获取当前打开的所有窗口句柄,返回类型为一个列表。current_window_handle:获取当......
  • #星计划#【坚果派】JS开源库适配OpenHarmony系列——第一期实操
    (目录)JS开源库适配OpenHarmony系列第一期实操1.为什么适配JS开源库由于OpenHarmony应用是基于ArkTS开发,而ArkTS是在保持TypeScript(简称TS)基础语法风格的基础上,对TS的动态类型特性施加更严格的约束,引入静态类型。因此在开发OpenHarmony三方库时,建议首选在成熟的JS/TS开源三方......
  • Python+Selenium实现UI自动化
    自动化测试:自动化测试是把以人为驱动的测试行为转化成机器执行的一种过程,通常在设计了测试用例并通过评审之后,由测试人员根据测试用例中描述的规程一步步执行测试,得到实际结果与期望结果的比较,再此过程中,为了节省人力,时间或硬件资源,提高测试效率,便引用了自动化测试的概念Selenium:是......
  • 使用Selenium库的C#爬虫程序来爬取腾讯云的视频
    这是一个使用Selenium库的C#爬虫程序,用于爬取https://cloud.tencent.com/的视频。代码中使用了代理服务器,代理服务器的主机地址为www.duoip.cn,端口号为8000。以下是完整的代码解释://导入Selenium库usingOpenQA.Selenium;//创建一个ChromeDriver实例,使用代理服务器IWebDriver......
  • (selenium) 让浏览器在 webdriver 调用后保持打开状态
    在使用selenium进行webdriver测试时,浏览器在调用完后将会自动关闭,即使没有调用"driver.close()"。有时候,可能需要特意将浏览器保持开启状态,此时需要使用detach参数#'detach'=True将不会自动关闭options.add_experimental_option('detach',True)具体示例代码如......