首页 > 编程语言 >【Python】Selenium根据网页页面长度,模拟向下滚动鼠标,直到网页底部的操作

【Python】Selenium根据网页页面长度,模拟向下滚动鼠标,直到网页底部的操作

时间:2025-01-17 17:33:47浏览次数:3  
标签:滚动 鼠标 Python driver Selenium import 网页 模拟 页面

最近在弄selenium的爬取的过程中,我发现一些网站上的表格,是需要手动拉到底部才能加载完成的。

如果没有拉到底部,那么在获取网页表格的时候,表格就会只有显示的一部分,页面就不完整。

所以我就整理了一些模拟滚动鼠标,加载到页面底部的方法。用于处理这个问题~

以下是几种常见的方法,个人是用的最多的是第一种,如果不好用的话,可以用后面几种。

1. 使用Selenium库

Selenium是一个强大的自动化测试工具,可以用来模拟浏览器操作,包括滚动页面。以下是一个使用Selenium模拟滚动页面的示例:

from selenium import webdriver
import time

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 打开目标网页
driver.get('https://example.com')

# 获取页面的总高度
last_height = driver.execute_script("return document.body.scrollHeight")

while True:
    # 滚动到页面底部
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    
    # 等待新内容加载
    time.sleep(2)
    
    # 获取新的页面高度
    new_height = driver.execute_script("return document.body.scrollHeight")
    
    # 如果页面高度没有变化,说明已经到底部
    if new_height == last_height:
        break
    
    last_height = new_height

# 关闭浏览器
driver.quit()

在这个示例中,我们首先创建了一个Chrome浏览器实例,然后打开目标网页。接着,我们使用一个while循环来滚动页面到底部,并每次滚动后等待新内容加载。如果新的页面高度与之前的相同,就结束循环,表示已经到达页面底部。最后,我们关闭了浏览器。

2. 使用PyAutoGUI库

PyAutoGUI是一个跨平台的GUI自动化库,可以用来模拟鼠标和键盘操作。以下是一个使用PyAutoGUI模拟鼠标滚动的示例:

import pyautogui
import time

# 获取屏幕尺寸
screen_width, screen_height = pyautogui.size()

# 移动鼠标到屏幕中央
pyautogui.moveTo(screen_width / 2, screen_height / 2)

# 模拟鼠标滚轮滚动
for i in range(10):  # 滚动10次
    pyautogui.scroll(-100)  # 向下滚动100单位
    time.sleep(1)  # 每次滚动后暂停1秒

这个的逻辑是,先获取屏幕尺寸,然后将鼠标移动到屏幕中央。接着,我们使用一个for循环来模拟鼠标滚轮滚动,每次向下滚动100单位,并在每次滚动后暂停1秒。

3. 使用Pynput库

Pynput是一个用于控制和监视输入设备(如鼠标和键盘)的Python库。以下是一个使用Pynput模拟鼠标滚动的示例:

from pynput.mouse import Controller
import time

# 创建鼠标控制器
mouse = Controller()

# 移动鼠标到屏幕中央
mouse.position = (screen_width / 2, screen_height / 2)

# 模拟鼠标滚轮滚动
for i in range(10):  # 滚动10次
    mouse.scroll(0, -2)  # 向下滚动2单位
    time.sleep(1)  # 每次滚动后暂停1秒

在上面的代码中,我们首先创建了一个鼠标控制器,然后将鼠标移动到屏幕中央。

接着,我们使用一个for循环来模拟鼠标滚轮滚动,每次向下滚动2单位,并在每次滚动后暂停1秒。

4. 使用ActionChains类

Selenium的ActionChains类可以用来模拟复杂的用户操作,包括鼠标拖动和滚动。以下是一个使用ActionChains类模拟滚动页面的示例:

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 打开目标网页
driver.get('https://example.com')

# 创建ActionChains对象
action = ActionChains(driver)

# 模拟鼠标滚动
for i in range(10):  # 滚动10次
    action.move_by_offset(0, 500).perform()  # 向下滚动500像素
    time.sleep(1)  # 每次滚动后暂停1秒

# 关闭浏览器
driver.quit()

这段代码中,我们首先创建了一个Chrome浏览器实例,然后打开目标网页。

接着,我们创建了一个ActionChains对象,并使用一个for循环来模拟鼠标滚动,每次向下滚动500像素,并在每次滚动后暂停1秒。最后,我们关闭了浏览器。

后面两种方法是模拟了鼠标操作,比较不容易被监测为爬虫,点击也方便。

总结

以上是几种在Python中根据页面长度模拟滚动鼠标的操作方法。

如果需要其他类型的鼠标滚动方法,可以参考:
【Python】Selenium模拟滚动鼠标的各种示例(一口气滚动到网页底部、逐步滚动、滚动到某个元素可见,按照次数滚动)

在这里插入图片描述

标签:滚动,鼠标,Python,driver,Selenium,import,网页,模拟,页面
From: https://blog.csdn.net/Meggie35/article/details/145144881

相关文章

  • The Zen of Python (Python 之禅)
    在交互式解释器中输入importthis就会显示TimPeters的TheZenofPython1>>>importthis2TheZenofPython,byTimPeters34Beautifulisbetterthanugly.5Explicitisbetterthanimplicit.6Simpleisbetterthancomplex.7Complexisbetterthancom......
  • python 股票数据接口 python如何获取股票交易数据
    python股票数据接口python如何获取股票交易数据 转载风华绝代的java2023-08-0521:48:47文章标签python股票数据接口python数据库c#sqlH5文章分类Python后端开发阅读数387有备考软考的小伙伴,想积分落户,单位评职称?科目太多不知道怎么选?考试考点难点太多没有头绪?刚准......
  • 超高频算法——双指针思想的领悟 python
    目录问题引入1解决方案牛刀小试问题引入2解决方案举一反三实战演练(双指针)问题引入3Whatis滑动窗口关键要素实战演练(滑动窗口)总结问题引入1给你一个数组(按非递减顺序排列),假定为【2,4,5,6,7,9】请你在数组中找到两个数满足:相加等于10,返回它们的值。你是一个不知道双......
  • 初学者如何用 Python 写第一个爬虫?
    ......
  • 【Python】深入探讨Python中的单例模式:元类与装饰器实现方式分析与代码示例
    《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门!解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界单例模式(SingletonPattern)是一种常见的设计模式,它确保一个类只有一个实例,并提供一个全局访问点。在Python中,实现单例模式的方式多种多样,包括......
  • Python魔法方法深度解析:解密 __call__、__new__ 和 __del__
    《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门!解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界在Python中,魔法方法(MagicMethods)是一些特殊的方法,它们允许开发者定制对象的行为。这些方法前后由双下划线包围,如__init__、__str__、__call_......
  • 【金融资产组合模型进化论】4.1 对MPT+Fama-French五因子优化方案实现Backtrader量化
    目录0.承前1.汇总代码2.近4年量化回测2.1获取近4年资产组合数据2.2对近4年资产组合数据进行量化回测3.启后3.1待优化点0.承前本篇博文是对文章,链接:【金融资产组合模型进化论】4.马科维茨资产组合模型+Fama-French五因子优化方案(理论+Python实战)实现量......
  • 【华为OD-E卷 - 最大花费金额 100分(python、java、c++、js、c)】
    【华为OD-E卷-最大花费金额100分(python、java、c++、js、c)】题目双十一众多商品进行打折销售,小明想购买自己心仪的一些物品,但由于受购买资金限制,所以他决定从众多心仪商品中购买三件,而且想尽可能的花完资金。现在请你设计一个程序帮助小明计算尽可能花费的最大资金数......
  • 【华为OD-E卷 - 一种字符串压缩表示的解压 100分(python、java、c++、js、c)】
    【华为OD-E卷-一种字符串压缩表示的解压100分(python、java、c++、js、c)】题目有一种简易压缩算法:针对全部由小写英文字母组成的字符串,将其中连续超过两个相同字母的部分压缩为连续个数加该字母,其他部分保持原样不变。例如:字符串“aaabbccccd”经过压缩成为字符串“3ab......
  • 2025毕设python在线小说阅读系统程序+论文
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、选题背景关于在线小说阅读系统的研究,现有研究主要集中在系统的基本功能实现和用户体验优化方面,如一些商业在线阅读平台的开发与改进。专门针对......