首页 > 编程问答 >如何使用 Selenium Python 搜索 Excel 文件中的文本

如何使用 Selenium Python 搜索 Excel 文件中的文本

时间:2024-07-23 04:17:17浏览次数:10  
标签:python selenium-webdriver browser-automation

我有一些数据在 Excel 文件中。我想要转到 Excel 文件,然后搜索文本(取自网站表),然后获取该行的所有数据,这些数据将用于在浏览器中填充表格。

示例:我希望 selenium 搜索 ST0003 然后获取名称,该学生 ID 的父亲姓名,以便我可以在大学网站中填写此信息。

sample data of excel

我想我会从网站获取一个 Student_id,然后将其粘贴到现有的 Excel 工作表中,我将在其中使用 VLOOKUP 填写其他详细信息,但是这种方法看起来不太好。


你不需要Selenium来搜索Excel文件。 Selenium 主要用于自动化网页浏览器。 你可以使用 Python 的 openpyxl 库来实现。

以下是如何使用 openpyxl 在 Excel 文件中搜索文本并提取行数据的示例:

import openpyxl

def search_excel(file_path, search_term):
  """
  在 Excel 文件中搜索文本并返回匹配行的所有数据。

  Args:
    file_path: Excel 文件的路径。
    search_term: 要搜索的文本。

  Returns:
    包含匹配行数据的列表列表,如果没有找到匹配项,则返回 None。
  """

  wb = openpyxl.load_workbook(file_path)
  sheet = wb.active

  matching_rows = []
  for row in sheet.iter_rows():
    for cell in row:
      if cell.value == search_term:
        matching_rows.append([cell.value for cell in row])

  return matching_rows if matching_rows else None

# 示例用法
file_path = "student_data.xlsx"  # 替换为你的 Excel 文件路径
search_term = "ST0003"

matching_rows = search_excel(file_path, search_term)
if matching_rows:
  for row in matching_rows:
    print(f"姓名: {row[1]}, 父亲姓名: {row[2]}")  # 根据你的 Excel 表格结构调整列索引
else:
  print(f"未找到 {search_term}。")

这个脚本做了以下事情:

  1. 导入 openpyxl 库。
  2. 定义了一个名为 search_excel 的函数:
  3. 它接受 Excel 文件路径和要搜索的文本作为参数。
  4. 它使用 openpyxl.load_workbook 打开 Excel 文件。
  5. 它迭代工作表中的每一行和每个单元格。
  6. 如果找到匹配的文本,它会将整行的数据添加到 matching_rows 列表中。
  7. 最后,它返回 matching_rows 列表,如果没有找到匹配项,则返回 None
  8. 使用示例数据调用 search_excel 函数。
  9. 打印找到的匹配行的姓名和父亲姓名。

你需要安装 openpyxl 库:

pip install openpyxl

请注意:

  • 你需要将 file_path 变量更新为你的 Excel 文件的实际路径。
  • 你可能需要根据你的 Excel 文件的结构调整打印语句中的列索引。

这个脚本演示了如何在 Excel 文件中搜索特定文本并提取相关数据。 你可以将此代码集成到你的 Selenium 脚本中,以使用从 Excel 文件中检索到的数据填充网页表单。

标签:python,selenium-webdriver,browser-automation
From: 78777450

相关文章

  • Python 套接字请求在很多情况下都会失败
    我在python中尝试了超过5种不同的方法,尽管人们说它在其他论坛上有效,但所有这些方法都惨遭失败。importsocketmessage="test"clientsocket=socket.socket(socket.AF_INET,socket.SOCK_STREAM)clientsocket.connect(('1.1.1.1',80))clientsocket.send(mes......
  • Python 网络套接字
    我一直尝试通过Python访问该网站的websocket,但是需要绕过CloudFlare,现在我尝试通过cookie进行绕过,但是这不起作用。我已经尝试在没有cookie的情况下执行此操作,但这也不起作用。importwebsocketimportbase64importosdriver=selenium.webdriver.Firefox()driver.ge......
  • 如何在Python中使用Selenium提取data-v-xxx?
    因为我想查看每个class='num'内的文本是否大于0。如果测试通过,那么我需要获取venuen-name内的文本。我观察到,data-v是相同的。所以我的方法是获取相同的data-v-<hashvalue>来查找场地名称。我尝试了不同的方法来提取,但仍然无法提取。有什么建议吗?这是DOM<div......
  • Python:添加异常上下文
    假设我想提出一个异常并提供额外的处理信息;最好的做法是什么?我想出了以下方法,但对我来说有点可疑:definternal_function():raiseValueError("smellysocks!")defcontext_function():try:internal_function()exceptExceptionase:......
  • 【视频】Python遗传算法GA优化SVR、ANFIS预测证券指数ISE数据-CSDN博客
    全文链接:https://tecdat.cn/?p=37060本文旨在通过应用多种机器学习技术,对交易所的历史数据进行深入分析和预测。我们帮助客户使用了遗传算法GA优化的支持向量回归(SVR)、自适应神经模糊推理系统(ANFIS)等方法,对数据进行了特征选择、数据预处理、模型训练与评估。实验结果表明,这些方法......
  • Python学习笔记42:游戏篇之外星人入侵(三)
    前言在之前我们已经创建好了目录,并且编写好了游戏入口的模块。今天的内容主要是讲讲需求的分析以及项目各模块的代码初步编写。在正式编写代码前,碎碎念几句。在正式编写一个项目代码之前,实际是有很多工作要做的。就项目而言,简单的定项,需求对齐,项目架构设计,实际的代码编写,......
  • Python入门知识点 5--流程控制语句
    先来分享一个pycharm使用小技巧   红色波浪线:提醒可能报错   黄色波浪线:提醒书写不规范,ctrl+alt+l去掉黄线   code--Reformatcode,就可以去掉黄线,调整代码格式1、程序三大执行流程(1)顺序执行        程序执行时,代码从上往下,从左往右执行,中间......
  • python里读写excel等数据文件的几种常用方式
    python处理数据文件第一步是要读取数据,文件类型主要包括文本文件(csv、txt等)、excel文件、数据库文件、api等。下面整理下python有哪些方式可以读取数据文件。1.python内置方法(read、readline、readlines)read():一次性读取整个文件内容。推荐使用read(size)方法,size越大......
  • python+flask计算机毕业设计鲜花坊销售平台(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着电子商务的迅猛发展,线上购物已成为人们日常生活的重要组成部分,尤其在追求生活品质与个性化的今天,传统鲜花销售行业正经历着深刻的变革......
  • python+flask计算机毕业设计快递驿站管理系统(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着电子商务的迅猛发展,快递行业迎来了前所未有的繁荣期,快递包裹量急剧增长,对快递末端配送服务提出了更高的要求。传统的快递配送模式面临......