首页 > 其他分享 >Airtest-Selenium实操小课:刷B站视频

Airtest-Selenium实操小课:刷B站视频

时间:2024-02-25 18:12:04浏览次数:33  
标签:Selenium driver element 小课 cookie 实操 print video class

1. 前言

上一课我们讲到用Airtest-Selenium爬取网站上我们需要的信息数据,还没看的同学可以戳这里看看~那么今天的推文,我们就来说说看,怎么实现看b站、刷b站的日常操作,包括点击暂停,发弹幕,点赞,收藏等操作,仅供大家参考学习~

2.需求分析和准备

整体的需求大致可以分为以下步骤:

  • 打开chrome浏览器
  • 打开百度网页
  • 搜索“哔哩哔哩”
  • 点击进入“哔哩哔哩”官网
  • 搜索关键词“Airtest酱”
  • 点击进入“Airtest酱”首页,随机点击播放视频
  • 并对视频点击暂停,发弹幕,点赞,收藏

在写脚本之前,我们需要准备好社区版AirtestIDE(目前最新版为1.2.16),设置好chrome.exe地址和对应的driver;并且确保我们的chrome浏览器版本不是太高以及selenium是4.0以下即可(这些兼容问题我们都会在后续的版本修复)。

3. 脚本实现与运行效果

3.1 脚本运行效果

我们在编写这次代码的时候,我们主要是使用了页面元素定位的方式去进行操作交互的,除此之外还实现了保存cookie、读取cookie的一个操作。大家在日常使用也会发现,在首次通过脚本开启的chrome网页界面是无cookie的,那么我们在进行一些任务之前是需要先登录后才能进行下一步操作的,可以通过首次登录时读取cookie数据保存到本地,往后每次运行只需要读取本地的cookie文件就可以轻松登录啦~ 

3.2 完整代码分享

这里也附上完整的示例代码给大家参考,有需要的同学可以自取学习哦:

# -*- encoding=utf8 -*-
from airtest.core.api import *
# 引入selenium的webdriver模块
from airtest_selenium.proxy import WebChrome
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import threading
import time
import random
import json

#保存以及调用cookie的线程
class UtilFunc():
def cookie_is_exist_(self, cook_name='_'): # 检查txt文件是否存在
if os.path.exists(f'{cook_name}cookies.txt'):
return True
return False

def cookie_save_(self, driver, cook_name='_'): #保存cookie到txt文件中以便下次读取
# 获取当前页面的所有cookie
cookies = driver.get_cookies()
# 将cookie转换为JSON字符串
cookies_json = json.dumps(cookies)
# 保存cookie到txt文件
with open(f'{cook_name}cookies.txt', 'w') as file:
file.write(cookies_json)
print(f"保存cookies:{cookies}")

def cookie_set_(self, driver, cook_name='_'): #读取cookie文件并给当前网站设置已存cookie
# 从txt文件读取JSON_cookie数据
with open(f'{cook_name}cookies.txt', 'r', encoding='gbk') as file:
json_data = file.read()
# 将JSON数据转换为列表
data_list = json.loads(json_data)
for cookie in data_list:
driver.add_cookie(cookie)
print("设置cookie")


# 创建一个实例,代码运行到这里,会打开一个chrome浏览器
driver = WebChrome()
isLogin = False #存储登录状态值,False为未登录,True为已登录

#打开chrome浏览器并打开视频播放
def start_selenium():
driver.implicitly_wait(20)
driver.get("https://www.baidu.com/")
# 输入搜索关键词并提交搜索
search_box = driver.find_element_by_name('wd')
search_box.send_keys('哔哩哔哩')
search_box.submit()

try:
# 查找搜索结果中文本为 "哔哩哔哩" 的元素并点击
results = driver.find_elements_by_xpath('//div[@id="content_left"]//span[contains(text(), "哔哩哔哩")]')
if results:
results[0].click()
print("点击了哔哩哔哩搜索结果")
except Exception as e:
element = driver.find_element_by_xpath(
"//div[@id='content_left']/div[@id='1']/div[@class='c-container']/div[1]/h3[@class='c-title t t tts-title']/a")
element.click()
driver.switch_to_new_tab() # 切换界面

util_cookie = UtilFunc()
if util_cookie.cookie_is_exist_("Airtest酱登录"): # 存在cookie文件,设置cookie
util_cookie.cookie_set_(driver, "Airtest酱登录")
# 输入搜索关键词并提交搜索
search_box = driver.find_element_by_class_name('nav-search-input')
search_box.send_keys('Airtest酱')
# 模拟发送Enter键
search_box.send_keys(Keys.ENTER)
sleep(5)
driver.switch_to_new_tab() # 切换界面

results_ = driver.find_elements_by_xpath(
'//div[@class="bili-video-card__info--right"]//span[contains(text(),"Airtest酱")]')
if results_:
results_[0].click()
driver.switch_to_new_tab() # 切换界面

driver.refresh()
sleep(2)
video_ele = driver.find_element_by_xpath("//div[@title='14天Airtest自动化测试小白课程']")
# 滚动到指定元素处
driver.execute_script("arguments[0].scrollIntoView(true);", video_ele)
sleep(5)
video_ele.click()
driver.switch_to_new_tab() # 切换界面

# 获取所有视频
video_list = driver.find_elements_by_xpath("//ul[@class='row video-list clearfix']//a[@class='title']")
random_element = random.choice(video_list)
random_element.click() # 随机播放一个
driver.switch_to_new_tab() # 切换界面

#登录
def is_login():
"""线程检测登录弹窗"""

def is_no_login(*args):
global isLogin # 在线程内修改外部常量的值
no_login_tip = True
while True:
element = driver.find_elements_by_css_selector('.bili-mini-content-wp')
if len(element) > 0:
if no_login_tip:
print("未登录 请在五分钟内扫码")
no_login_tip = False
else:
print("未检测到登录弹窗")
check_login_ele = driver.find_elements_by_css_selector('.bpx-player-dm-wrap')
if not check_login_ele:
isLogin = True
UtilFunc().cookie_save_(driver, "Airtest酱登录")
print("保存cookie")
break
log_text_array = [element.text for element in check_login_ele] # 使用列表推导式简化代码
if "请先登录或注册" in log_text_array:
loginbtn = driver.find_elements_by_xpath(
"//div[@class='bili-header fixed-header']//div[@class='header-login-entry']")
if loginbtn:
loginbtn[0].click()
isLogin = False
print("判断cookie文件是否存在,方便下次调用,设置后刷新页面")
else:
isLogin = True
UtilFunc().cookie_save_(driver, "Airtest酱登录")
print("保存cookie")
break

thread = threading.Thread(target=is_no_login, args=("args",))
thread.start()

#暂停播放
def video_pause_and_play(check_btn=False):
if isLogin:
try:
paus_btn = driver.find_elements_by_xpath(
"//*[@id=\"bilibili-player\"]//div[@class='bpx-player-ctrl-btn bpx-player-ctrl-play']")
if paus_btn[0]:
detection_time1 = driver.find_elements_by_xpath(
'//*[@class="bpx-player-control-bottom-left"]//div[@class="bpx-player-ctrl-time-label"]')
start_time = detection_time1[0].text
sleep(5)
# 时间戳检测是否在播放
detection_time2 = driver.find_elements_by_xpath(
'//*[@class="bpx-player-control-bottom-left"]//div[@class="bpx-player-ctrl-time-label"]')
end_time = detection_time2[0].text
if start_time == end_time or check_btn:
print("点击播放(暂停)按钮")
paus_btn[0].click()
except Exception as e:
print(f"点击播放(暂停)出错{e}")

#发送弹幕
def video_sms(sms_body="不错"):
if isLogin:
try:
sms_input_edit = driver.find_element_by_xpath("//input[@class='bpx-player-dm-input']")
sms_input_edit.send_keys(sms_body)
# 模拟发送Enter键
sms_input_edit.send_keys(Keys.ENTER)
except Exception as e:
print(f"发弹幕出错{e}")
print(f"发送弹幕:{sms_body}")

#点赞
def video_love():
if isLogin:
print("点赞")
try:
sms_input_edit = driver.find_elements_by_xpath(
"//div[@class='toolbar-left-item-wrap']//div[@class='video-like video-toolbar-left-item']")
if not sms_input_edit:
print("已经点赞")
return
sms_input_edit[0].click()
except Exception as e:
print(f"点赞出错{e}")

#收藏
def video_collect():
if isLogin:
print("收藏")
try:
colle_btn = driver.find_elements_by_xpath(
"//div[@class='toolbar-left-item-wrap']//div[@class='video-fav video-toolbar-left-item']")
if not colle_btn:
print("已经收藏")
return
colle_btn[0].click()
sleep(2)
list_coll = driver.find_elements_by_xpath("//div[@class='group-list']//ul/li/label")
random_element = random.choice(list_coll) # 随机收藏
# 滚动到指定元素处
driver.execute_script("arguments[0].scrollIntoView(true);", random_element)
sleep(2)
random_element.click() # 随机收藏一个
sleep(2)
driver.find_element_by_xpath("//div/button[@class='btn submit-move']").click() # 确认收藏
except Exception as e:
print(f"收藏出错{e}")


# 等待元素出现
def wait_for_element(driver, selector, timeout=60 * 5):
try:
element = WebDriverWait(driver, timeout).until(
EC.presence_of_element_located((By.XPATH, selector))
)
return element
except Exception:
print("元素未出现")
return None

#头像元素初始化
selem = "//div[@class='bili-header fixed-header']//*[contains(@class, 'header-avatar-wrap--container mini-avatar--init')]"

if __name__ == "__main__":
start_selenium() # 开启浏览器找到视频播放
is_login() # 检测是否出现登录弹窗
# 等待元素出现
element = wait_for_element(driver, selem)
if element:
print("检测到已经登录")
# 暂停和播放视频
for _ in range(2):
video_pause_and_play()
sleep(3)
driver.refresh()
# 发送弹幕
sms_list = ["感觉不错,收藏了", "666,这么强", "自动化还得看airtest", "干货呀", "麦克阿瑟直呼内行"]
for item in sms_list:
wait_time = random.randint(5, 10) # 随机生成等待时间,单位为秒
time.sleep(wait_time) # 等待随机的时间
video_sms(item) # 评论

# 点赞和收藏视频
for action in [video_love, video_collect]:
action()
sleep(3)
else:
print("登录超时")

3.3 重要知识点

1)切换新页面并打开新的标签页
driver.switch_to_new_tab()
2)将随机的元素 random_element对象的“顶端”移动到与当前窗口的“顶部”对齐。
driver.execute_script("arguments[0].scrollIntoView(true);", random_element)

3) 从非空序列中随机选取一个数据并返回,该序列可以是list、tuple、str、set

random.choice()

4) 通过实例化threading.Thread类创建线程target:在线程中调用的对象,可以为函数或者方法;args为target对象的参数。start():开启线程,如果线程是通过继承threading.Thread子类的方法定义的,则调用该类中的run()方法;start()只能调用一次,否则报RuntimeError。

threading.Thread(target=is_no_login, args=("args",))
thread.start()

5) 使用expected_conditions模块(在使用时通常重命名为EC模块)去判断特定元素是否存在于页面DOM树中,如果是,则返回该元素(单个元素),否则就报错。

EC.presence_of_element_located((By.XPATH, selector))

4. 注意事项与小结

4.1 相关教程

4.2 课程小结

在本周的课程中,我们介绍了如何使用Airtest-selenium进行自动化刷B站视频的操作流程,也分享了Airtest-selenium比较常见的用法。但是,请大家注意,我们的分享仅供学习参考哦!我们分享的代码并不是永远适用的,因为网页的页面元素可能会不断更新。

---------------------------------------------------------------------------------

关注微信公众号即可在手机上查阅,并可接收更多测试分享~

标签:Selenium,driver,element,小课,cookie,实操,print,video,class
From: https://www.cnblogs.com/songzhenhua/p/18032686

相关文章

  • selenium执行js与浏览器操作
    执行js前置准备importtimefromseleniumimportwebdriverfromselenium.webdriver.edge.serviceimportServiceser=Service()ser.path=r'D:\xxx\chromedriver.exe'bro=webdriver.Chrome(service=ser)bro.get("https://www.baidu.com")#隐士......
  • selenium自动登录cnblogs案例
    代码如下:importjsonimporttimefromseleniumimportwebdriverfromselenium.webdriver.common.byimportByfromselenium.webdriver.edge.serviceimportServicefromselenium.webdriver.chrome.optionsimportOptionsser=Service()ser.path=r'D:\驱动路径......
  • selenium设置无头浏览器
    使用场景:如果我们只需要获取执行后的数据结果,而不需要打开浏览器,就用得上无头浏览器设置方式:额外添加以下代码:fromselenium.webdriver.chrome.optionsimportOptionsoptions=Options()options.add_argument('blink-settings=imagesEnabled=false')#不加载图片,......
  • selenium搜索标签,获取标签属性
    搜索标签1By.ID#根据id号查找标签bro.find_element(By.ID,'id内容')2By.NAME#根据name属性查找标签3By.TAG_NAME#根据标签名查找标签a_list=bro.find_elements(By.TAG_NAME,'a')4By.CLASS_NAME#按类名找dig=bro.find_element(By.CLASS_NAME,'diggit')......
  • selenium的快速使用
    selenium介绍selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器快速使用第一步:确认要驱动的浏览器(以谷歌浏览器为例)第二步:下载与浏览器版本对应的驱动https://googlechromelabs.github.io/chrome-......
  • selenium使用已打开的浏览器
    最后更新:2024.02.19python版本:3.12selenium版本:4.16.0在写selenium的时候,调试网页每次都需要新建一个浏览器实例,再打开网页进行操作,比较费时,尤其是在当网页加载特别慢的情况下;使用 ChromeDevTools协议就可以让selenium直接使用当前已经打开的处于远程调试的浏览器实例,以下......
  • python+selenium基础语法
    一、执行环境Python3.12.0selenium3.14.0二、八大元素定位//示例:打开百度,输入123,点击搜索fromseleniumimportwebdriverfromtimeimportsleepfromselenium.webdriver.common.byimportBydeftest():driver=webdriver.Chrome("D:/driver/chromedri......
  • selenium
    1、概要本阶段课程主要学习selenium自动化测试框架在爬虫中的应用,selenium能够大幅降低爬虫的编写难度,但是也同样会大幅降低爬虫的爬取速度。在逼不得已的情况下我们可以使用selenium进行爬虫的编写。2、Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开......
  • Selenium
    Python爬取B站(Bilibili.com)UP主的所有视频链接及详细信息Python爬取B站(Bilibili.com)UP主的所有公开视频链接及信息安装selenium安装selenium:condainstallseleniumselenium+Edgeselenium+Edge浏览器在MicrosoftEdgeWebDriver|MicrosoftEdgeDeveloper下载电脑......
  • Selenium 4 新特性
    Selenium4新特性相对定位器to_left_of():位于目标元素左侧的元素to_right_of():位于目标元素右侧的元素above():位于目标元素上方的元素below():位于目标元素下方的元素near():位于目标元素附近(默认50像素以内)的元素示例代码fromseleniumimportwebdriverfromselenium.we......