首页 > 其他分享 >Selenium入门

Selenium入门

时间:2024-09-26 22:20:42浏览次数:10  
标签:定位 入门 元素 Selenium element 文本 find 属性

Selenium 是一个用于自动化 web 应用程序测试的工具,它支持多种浏览器和编程语言。

下载驱动程序:根据你的浏览器类型和版本,下载相应的 WebDriver。例如,Chrome 浏览器需要 ChromeDriver。

安装 Selenium 库
pip install selenium

导入

from selenium import webdriver

创建浏览器对象

test_webdriver = webdriver.Chrome(service=Service(r"驱动路径"))
test_webdriver.get("https://www.taobao.com")  # 访问网址

selenium元素定位

1. ID定位

通过元素的ID属性进行定位。ID属性在HTML页面中通常是唯一的,因此这种方法定位准确且高效。

driver.find_element(By.ID, "element_id")

2. Name定位

通过元素的name属性进行定位。与ID不同,name属性在页面中可能不是唯一的,但在某些情况下仍然可以作为定位的依据。

driver.find_element(By.NAME, "element_name")

3. TagName定位

通过元素的标签名(TagName)进行定位。由于标签名在页面中往往不是唯一的,因此这种方法定位到的可能是多个元素。

driver.find_elements(By.TAG_NAME, "input")(注意这里使用了find_elements来获取元素列表)

4. ClassName定位

通过元素的class属性进行定位。class属性可能包含多个值,且值之间用空格分隔。需要注意的是,如果class属性值中包含空格或特殊字符,可能需要进行转义处理。

driver.find_element(By.CLASS_NAME, "class_name")

5. LinkText定位

通过超链接的完整文本进行定位。这种方法适用于定位<a>标签的文本内容。

driver.find_element(By.LINK_TEXT, "完整链接文本")

6. PartialLinkText定位

通过超链接的部分文本进行定位。这种方法适用于链接文本较长或只需匹配部分文本的情况。

driver.find_element(By.PARTIAL_LINK_TEXT, "部分链接文本")

7. CSS Selector定位

通过CSS选择器进行定位。CSS选择器是一种强大的定位方式,它支持多种选择策略,如ID选择器、类选择器、属性选择器、伪类选择器等。

driver.find_element(By.CSS_SELECTOR,"#id_value") 或 driver.find_element(By.CSS_SELECTOR, ".class_value")

8. XPath定位

通过XPath表达式进行定位。XPath是一种在XML文档中查找信息的语言,由于HTML可以看作是XML的一种实现,因此XPath也可以用于定位HTML页面中的元素。XPath表达式非常灵活,几乎可以定位到页面上的任何元素。

driver.find_element(By.XPATH, "//input[@id='element_id']")

 Selenium访问元素

在使用Selenium进行Web自动化测试或爬虫时,经常需要访问和操作网页上的元素。Selenium提供了多种方式来访问元素的信息,包括元素的属性、文本内容、标签名等。

1. 获取元素的文本内容

使用text属性可以获取元素的文本内容(即元素内部的文本,不包括标签)。

element_text = element.text

 2. 获取元素的属性值

使用get_attribute(attribute_name)方法可以获取元素的指定属性值。例如,获取链接的href属性或图片的src属性。

href_value = element.get_attribute('href')  
src_value = element.get_attribute('src')

3. 获取元素的标签名

使用tag_name属性可以获取元素的标签名(例如,<div><a>等)。

tag_name = element.tag_name

元素操作

点击:使用click()方法模拟鼠标点击。

输入文本:使用send_keys()方法向输入框等元素发送文本。

清空内容:对于输入框等元素,使用clear()方法清空内容。

页面导航

使用get()方法打开新页面。

使用back()forward()方法模拟浏览器的后退和前进操作。

使用refresh()方法刷新当前页面。

标签:定位,入门,元素,Selenium,element,文本,find,属性
From: https://blog.csdn.net/weixin_52394366/article/details/142564333

相关文章

  • 零基础入门大语言模型
    阶段1:数学基础学习大语言模型的核心在于对以下数学概念的掌握:线性代数(矩阵、向量、矩阵乘法、特征值与特征向量)微积分(导数、偏导数、链式法则)概率与统计(条件概率、贝叶斯定理、期望值、方差)优化(梯度下降、凸优化)推荐学习资源:“MathematicsforMachineLearning”专......
  • 学编程难吗?多久能入门?
    当然,让我们继续补充并深化这篇文章的内容,探讨学习编程过程中的一些关键要素和心态调整。学习编程的心态调整学习编程不仅仅是掌握一门技术,更是一场心态的修行。在这个过程中,你可能会遇到各种挑战和挫折,比如代码bug难以解决、项目进展缓慢、新知识层出不穷等。面对这些困难,保......
  • 开发人员人工智能入门:揭秘基础知识部分
    开发者们大家好!人工智能不再只是一个梦想。它就在这里并改变我们构建软件的方式。它可以使应用程序更好、更有用。但如何开始在项目中使用人工智能呢?本系列旨在为您提供踏上人工智能开发之旅的基础知识。在第一部分中,我们将深入研究核心概念并提供使用langchain和openai的实践......
  • PHP反序列化1(基础入门)
    考点1:反序列化基础<aside>......
  • 数据结构:实现链式结构二叉树(Tree) 手把手带你入门数据结构~
    文章目录前言一、链式结构二叉树的概念1.定义2.节点结构3.操作4.优势与劣势二、链式结构二叉树的实现1.树结构的定义2.树的遍历(1)前序遍历(2)中序遍历(3)后序遍历3.二叉树结点个数4.二叉树叶子结点个数5.二叉树第k层结点个数6.二叉树的深度/高度7.二叉树查找值为......
  • MyBatisPlus快速入门
    MyBatisPlus需要的基础:MyBatisSpringSpringMVC一. MyBatisPlus概述1.介绍 MyBatis-Plus(简称MP)是一个 MyBatis的增强工具,在MyBatis的基础上只做增强不做改变,为简化开发、提高效率而生2.特性无侵入:只做增强不做改变,引入它不会对现有工程产生影响,如丝般顺滑损耗......
  • 找不到ddraw.dll文件怎么办?ddraw.dll文件丢失修复秘籍从入门到精通的全面指南
    当电脑提示找不到ddraw.dll文件时,这通常意味着系统或某个程序无法加载这个必要的动态链接库(DLL)文件。ddraw.dll是DirectX的一部分,对于许多游戏和旧版软件来说至关重要。以下是从入门到精通的全面指南,帮助您解决ddraw.dll文件丢失的问题。一、了解ddraw.dll文件ddraw.dll是Di......
  • 字符串从入门到退竞(2)——KMP 算法
    约定在文字描述中字符串下标从\(1\)开始,代码中从\(0\)开始。前缀函数对于长\(n\)的字符串\(S\),其前缀函数是一个长\(n\)的数组(数列)\(\pi\),定义如下:若\(S[1..i]\)有相等的真前缀和真后缀(称之为border),\(\pi[i]\)为其长度的最大值;若不存在,\(\pi[i]=0\)。字符串的......
  • BladeX开发入门(记录)
    BladeX物联网平台是一款高度集成的物联网解决方案,涵盖设备管理、数据采集、实时监控、数据分析以及开放API服务等核心功能。平台经过精心设计与开发,提供了全面的品类、产品和设备支持。设备注册成功后,能够轻松桥接至其他物联网云平台,实现设备的无缝集成。同时提供服务端订阅功......
  • RabbitMq 入门应用 提升性能 : 算法多阶段并行 (Python)
    大问题:我们有一个算法,它可以被分为多个阶段进行(顺序不可颠倒),每个阶段的性能和资源要求不同(且不均衡程度比较高);假设我们现在可以堆资源(较多的CPU和内存),如何将算法各个步骤拆分并进行性能均衡和实现,使得算法性能最大化以满足生产要求?多进程:由于算法有严格的顺序要求,如果是......