首页 > 编程语言 >[python][selenium][web自动化]元素定位方式

[python][selenium][web自动化]元素定位方式

时间:2024-09-01 18:15:34浏览次数:10  
标签:web webdriver python selenium driver element sleep import find

8种方式:
1、id
2、class_name
3、name
4、link_text
5、partial_link_text
6、tag_name
7、css_selector
8、XPath


1、2、3:元素属性,通常跟7、8去组合使用比较多。
4、5:是用可点击的链接的文本去定位。
6:是根据元素标签去定位。
7、8:最常用的方式,能结合前面6种方式组合去定位,我个人觉得理解后并不复杂,并且定位准确。
用什么定位方式,需要根据实际情况去选择,才是最合适的,
下面我用百度搜索来做demo,直接用代码+注释演示说明,学无止境,大家有什么看法或细节需要补充的可以告诉我把内容做得更好。


1、id

元素的id属性定位,id在当前页面是唯一的,但不是所有元素都有

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 操作:输入框输入"日历",点击搜索
driver.find_element(By.ID, "kw").send_keys("日历")
driver.find_element(By.ID, "su").click()
sleep(5)
driver.quit()

2、class_name

元素的class属性定位,大部分都有,但也有些没有

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 操作:输入框输入"日历",点击搜索,点开年份下拉列表,把年份选择1903年
driver.find_element(By.CLASS_NAME, "s_ipt").send_keys("日历")

# 注意这里:有不少元素有多个class,它们之间会用空格隔开,但是代码里不能用空格,有两种方式
# 方法一:用.代替,比如:百度的这个搜索按钮"bg s_btn",写成"bg.s_btn"
driver.find_element(By.CLASS_NAME, "bg.s_btn").click()
sleep(2)
# 方法二:使用最后一个class,比如:年份下拉列表的class是:sc-icon cu-icon _toggle-icon_9e3yq_71 toggle-icon_1tMxP,用最后一个
driver.find_element(By.CLASS_NAME, "toggle-icon_1tMxP").click()

# 年份class是"_selectItem_9e3yq_23  ",用网页F12检查有152个,不可能自己去数,所以用elements获取所有年份数据再用if判断我要的年份
elms = driver.find_elements(By.CLASS_NAME, "_selectItem_9e3yq_23  ")
# 先判断列表是否为空,因为有时候卡顿或者加载慢是可能导致获取元素失败的
if elms:
    for e in elms:
        if e.text == "1903年":
            e.click()
            break
            # 这里做了点击操作后一定要结束循环,不然会报异常StaleElementReferenceException。
            # 通过反复尝试和根据代码流程看,大致就是你循环过程中操作了元素,但是还继续循环操作就有可能因为元素发生变化找不到了,
            #   因为这里是点开下拉列表然后F12源码才会显示出年份元素,做了点击操作后下拉列表就会隐藏,然后元素也没了,操作自然报错。
            # 奇怪的是正常跑没问题,我自己把for、if、click3行打断点debug去看,跑到click就怎样都会出异常,手速点再快也不行。
            # 有大佬懂的话,不介意可以评论区指导下在下。

sleep(5)
driver.quit()

3、name

元素的name属性定位,也是不是所有都有,而且有时候值还是动态,每次打开页面都会变的

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 操作:输入框输入"日历"
driver.find_element(By.NAME, "wd").send_keys("日历")

sleep(5)
driver.quit()

4、link_text

根据可点击的链接的文本去定位

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 操作:点击页面上的"关于百度"和"更多"
driver.find_element(By.LINK_TEXT, "关于百度").click()
driver.find_element(By.LINK_TEXT, "更多").click()

sleep(5)
driver.quit()

5、partial_link_text

也是根据可点击的链接的文本去定位,但这是文本的模糊匹配,只要包含有关键字就可以匹配

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 操作:点击页面上的"关于百度"和"更多"
driver.find_element(By.PARTIAL_LINK_TEXT, "于百").click()
driver.find_element(By.PARTIAL_LINK_TEXT, "更").click()

sleep(5)
driver.quit()

6、tag_name

根据元素标签名定位

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 操作:输入框输入"日历"
elem = driver.find_elements(By.TAG_NAME, "input")
for e in elem:
    if e.get_attribute("name") == "wd":
        e.send_keys("日历")

sleep(5)
driver.quit()

7、css_selector

根据css选择器定位元素

7.1 常用属性

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 一:先看常用的属性格式写法,下面操作:输入“日历”,点击搜索,等待3秒,在日历上点击上个月,输入"1993"
# html标签:页面上一般都有多个相同标签,所以需要再加上父级标签指明是哪个标签下的,父级标签也有多个就再往上找父级,如此类推
driver.find_element(By.CSS_SELECTOR, "span>input").send_keys("日")
# name:[属性名],例:[name='wd']
driver.find_element(By.CSS_SELECTOR, "[name='wd']").send_keys("历")
# id:#id,例:#su
driver.find_element(By.CSS_SELECTOR, "#su").click()
sleep(3)
# class:.class,例:".calendar-prev-month_mlSD9 OP_LOG_BTN"
driver.find_element(By.CSS_SELECTOR, ".calendar-prev-month_mlSD9.OP_LOG_BTN").click()
# 组合使用:用标签+属性,下面是 input标签 + class_name + name的组合
driver.find_element(By.CSS_SELECTOR, "input.s_ipt[name='wd']").send_keys("1993")

sleep(4)
driver.quit()

7.2 模糊匹配定位

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 二:模糊匹配
# 这次用a标签和href属性来试,打开百度贴吧,下面代码一共会打开6个百度贴吧页面
driver.find_element(By.CSS_SELECTOR, "a[href='http://tieba.baidu.com/']").click()
# 模糊匹配-包含,只给出值的中间部分,可以匹配到开头和结尾
driver.find_element(By.CSS_SELECTOR, "a[href*='tieba.bai']").click()
# 模糊匹配-匹配开头,只给出值的开头部分内容,可以匹配到后面
driver.find_element(By.CSS_SELECTOR, "a[href^='http://tie']").click()
# 模糊匹配-匹配结尾,只给出值的后面结尾内容,可以匹配到前面
driver.find_element(By.CSS_SELECTOR, "a[href$='ba.baidu.com/']").click()
# 模糊匹配-标签,只给出值,可以匹配到标签
driver.find_element(By.CSS_SELECTOR, "*[href='http://tieba.baidu.com/']").click()
# 娱乐一下,超级模糊。。
driver.find_element(By.CSS_SELECTOR, "*[href*='tieba']").click()

sleep(4)
driver.quit()

7.3 通过父元素定位子元素的方法

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 三、通过父元素定位子元素的方法,这里用百度首页左上角的一堆链接演示
# 定位某标签下的第一个子元素::first-child,例:a:first-child,下面定位点击的是新闻
driver.find_element(By.CSS_SELECTOR, "div#s-top-left>a:first-child").click()
# 定位某标签下的指定位置的子元素::nth-child(n),例:a:nth-child(5),下面定位点击的是视频
driver.find_element(By.CSS_SELECTOR, "div#s-top-left>a:nth-child(5)").click()
# 还是定位点击视频,用elements拿到所有子元素,再用下标去获取元素,结果也是一样
driver.find_elements(By.CSS_SELECTOR, "div#s-top-left>a")[4].click()
# 定位某标签下的最后一个子元素::first-child,例:a:first-child
# 注意:仅匹配其父元素的最后一个子元素。如果最后一个子元素不是你想要定位的具体类型(比如,在一个<div>中包含了一个<p>和一个<span>,而<span>是最后一个子元素),
#      但你想要定位的是最后一个<p>元素,:last-child就不适用了
# 现在定位百度首页左上角的链接,F12打开看,div下子元素有一些a标签和一个div,div在最后,所以不能用来定位最后一个a标签,只能定位到div
driver.find_element(By.CSS_SELECTOR, "div#s-top-left>div:last-child").click()

sleep(4)
driver.quit()

8、XPath

根据元素路径定位,css方式看完后,看XPath应该就很好理解了,这里暂时列举出常用的

8.1 路径

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 一:路径
# 路径写法,相对路径://
driver.find_element(By.XPATH, "//span/input").send_keys("日历")
# 路径写法,绝对路径:/
driver.find_element(By.XPATH, "/html/body/div/div/div[5]/div/div/form/span/input").send_keys("日历")

sleep(4)
driver.quit()

8.2 属性

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 二:属性
# 根据属性id、name、class定位,注意:class定位,class值有多个时,值需要全部填写
# 格式://标签名[@属性名='属性值']
driver.find_element(By.XPATH, "//input[@id='kw']").send_keys("日")
driver.find_element(By.XPATH, "//input[@name='wd']").send_keys("历")
driver.find_element(By.XPATH, "//input[@class='bg s_btn']").click()
# 多个属性定位
driver.find_element(By.XPATH, "//input[@name='wd' and @class='s_ipt']").send_keys("日历")

sleep(4)
driver.quit()

8.3 其他

from selenium import webdriver
from selenium.webdriver.common.by import By
from time import sleep


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")

# 三:其他
# 匹配标签内的文本
driver.find_element(By.XPATH, "//a[text()='新闻']").click()
# 模糊匹配标签内的文本
driver.find_element(By.XPATH, "//a[contains(text(),'新')]").click()
# 指定标签内的属性匹配标签,例:百度首页点击贴吧
driver.find_element(By.XPATH, "//*[@href='http://tieba.baidu.com/']").click()

sleep(4)
driver.quit()

 

标签:web,webdriver,python,selenium,driver,element,sleep,import,find
From: https://www.cnblogs.com/laochang/p/18389785

相关文章

  • python threading 线程原理实验
    原理进程之间,编程语言可以不同,内存不共享。需要用socket/IRC/RPC等技术实现进程间通信线程之间,编程语言必须相同,内存共享。类变量self.xxx共享,分叉target的函数内变量private不共享。代码#!/usr/bin/env-Scondarun--live-stream-nbasepythonimportthreadingasthi......
  • 堆排序python实现
    一,树与二叉树1,树        树是一种数据结构,比如目录结构。        树是由n各节点组成的集合:    1.如果n=0,那存在一个节点作为数的根节点,其他节点可以分为m个集合,每个集合本身又是一颗树,比如:树的相关概念,比如根节点,叶子节点什么的不做过多介绍......
  • 基于yolov10的学生课堂行为检测系统,支持图像检测,也支持视频和摄像实时检测(pytorch框架
       更多目标检测和图像分类识别项目可看我主页其他文章功能演示:基于yolov10的学生课堂行为检测系统,支持图像、视频和摄像实时检测【pytorch框架、python】_哔哩哔哩_bilibili(一)简介基于yolov10的学生课堂行为检测系统是在pytorch框架下实现的,这是一个完整的项目,包括代码......
  • 计算机毕业设计选题推荐-个人健康档案管理系统-Java/Python项目实战
    ✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目......
  • 计算机毕业设计选题推荐-公司考勤管理系统-Java/Python项目实战
    ✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目......
  • 计算机毕业设计选题推荐-果树生长信息管理系统-Java/Python项目实战
    ✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目......
  • 计算机毕业设计选题推荐-客栈管理系统-酒店预订-民宿管理系统-Java/Python项目实战
    ✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目......
  • 【Python】Flask 快速入门
    Flask介绍Flask是一个轻量级的PythonWeb框架,非常适合快速开发和小型应用。官网:https://flask.palletsprojects.com/en/3.0.x/中文文档:https://dormousehole.readthedocs.io/en/latest/教程:https://www.runoob.com/flask/flask-tutorial.htmlFlask框架......
  • 【Python】Scrapy 快速入门
    Scrapy介绍Scrapy是一个强大的Python爬虫框架官网:https://scrapy.org/官方文档:https://docs.scrapy.org/en/latest/intro/tutorial.html教程参考:https://www.runoob.com/w3cnote/scrapy-detail.htmlScrapy架构概览Scrapy中的数据流由执行引擎......
  • 几分钟带你入门python GUI框架tkinter
    一、Tkinter是什么?Tkinter是Python的标准GUI库。Python与Tkinter结合使用时,提供了一种快速简便的方法来创建GUI应用程序。Tkinter为TkGUI工具包提供了一个强大的面向对象的接口。二、使用Tkinter创建GUI应用程序的基本步骤:1.安装python首先,确保你已经安......