首页 > 其他分享 >selenium 反反爬-淘宝,美团

selenium 反反爬-淘宝,美团

时间:2024-08-09 14:52:07浏览次数:12  
标签:webdriver 反反 selenium 美团 driver Chrome cdp navigator

1. 反爬
有时候,我们利用 Selenium 自动化爬取某些网站时,极有可能会遭遇反爬。

实际上,我们使用默认的方式初始化 WebDriver 打开一个网站,下面这段 JS 代码永远为 true,而手动打开目标网站的话,则为:undefined

# 通过这段 JS 脚本区分是爬虫还是人工操作 window.navigator.webdriver

2.解决方法 cdp 命令
cdp 全称是:Chrome Devtools-Protocol

通过 addScriptToEvaluateOnNewDocument() 方法可以在页面还未加载之前,运行一段脚本。

如此,我们只需要提前设置:

window.navigator.webdriver 的值为 undefined 即可。

 1 from selenium.webdriver import Chrome
 2 from selenium.webdriver import ChromeOptions
 3  
 4 option = ChromeOptions()
 5  
 6 # 打开参数
 7 # option.add_argument("--proxy-server=http://127.0.0.1:8888")
 8 # driver = Chrome(options=option)
 9  
10 driver = Chrome()
11 driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
12   "source": """
13     Object.defineProperty(navigator, 'webdriver', {
14       get: () => undefined
15     })
16   """
17 })
18  
19 driver.implicitly_wait(10)
20 driver.get("http://www.google.com")

 


————————————————

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:https://blog.csdn.net/riwanba/article/details/131801315

标签:webdriver,反反,selenium,美团,driver,Chrome,cdp,navigator
From: https://www.cnblogs.com/yrxns/p/18350746

相关文章

  • python使用selenium和PyPDF2保存多个html页面为pdf
    检索资料时看到比较完备的资料,想着要把所有页面保存下来。正好使用下requests和BeautifulSoup库获取和解析所有的静态页,把静态页保存为单个pdf文件,然后再把所有的pdf文件合并起来生成1个PDF文档。本来想使用python子进程调用wkhtmltopdf工具把静态页生成为单个pdf,然而如此一来pdf......
  • Python & Selenium 4 & Edge 浏览器 |加载个人浏览器配置文件(包括cookie)
    使用Selenium4,我尝试加载我的个人浏览器配置文件(包括cookie),以便它可以加载到我之前登录过的网站。我正在使用边缘浏览器。在测试我的代码片段时,它似乎没有加载我的浏览器配置文件,而是创建一个新的(配置文件1)。我已确保配置文件的路径是正确的。我的代码片段:edge_opt......
  • Selenium 4 的用法
    Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaFirefox,Safari,GoogleChrome,Opera,Edge等。这个工具的主要功能包括:测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在......
  • 2024美团官方霸王餐API接口
    在数字化日益深入的今天,餐饮行业正经历着一场前所未有的变革。作为行业内的领军企业,美团不断推出创新服务以优化用户体验,提升商家运营效率。其中,2024年美团官方推出的霸王餐API接口便是这一趋势下的重要产物。本文将从接口的背景、功能、优势、应用场景以及未来展望等方面,深入剖析......
  • HarmonyOS SDK助力美团单车提供便捷流畅扫码新体验
    背景在使用美团单车前,用户需要进行一系列的操作------打开美团App,点击"骑车"进入界面后,再点击"扫码用车",完成扫码后点击"确认开锁",才能最终完成单车开锁。一个简单的动作涉及5个步骤,在远距离或光线过暗等情况下,甚至还需要进行多次扫码才能开锁。策略作为国内头部的科技零售企业......
  • 如何在selenium python中访问电子邮件中的所有文件夹
    我使用imaplib库,但有时无法访问某些帐户,我使用poplib但它只支持访问主邮箱,但不支持访问其他文件夹,如垃圾邮件我想使用imaplib,但不会出现有时甚至无法访问的错误尽管我有一个帐户,但我仍然可以访问它,或者是否有另一个库可以快速支持该帐户?你想要使用Selenium和Python......
  • selenium webdriver出现Element is not currently visible and so may not be interac
    问题分析可能是没有加载完成,元素找不到。元素加载完成,但是元素需要点击按钮,才会触发元素插入进来元素加载完成,看到的值和实际后台传输的值是不一致的元素加载完成,本质是只有属性,是没有值的。看到的都是临时函数调用显示出来的解决方案针对第一种可以适当延长休眠时间来......
  • selenium的应用
    前言在工作中,遇到了指纹认证很强,hook等逆向的性价比不高的时候。一般我会考虑使用使用selenium一般我们会默认安装selenium,但是很多机构都会禁止掉selenium。这个时候就建议使用undetected-chromedriver安装和使用pipinstallundetected_chromedriverimportundetected_c......
  • selenium复习之---原理+基础用法
    简介1.是什么selenium是用来进行页面元素定位的第三方库,用来进行web自动化测试的工具,可以直接运行在浏览器中。2.原理:selenium在工作过程中有三个角色,selenium客户端、webdriver和浏览器selenium客户端是开发者与selenium的交互接口,它会发送指令给webdriver浏览器则接收来自......
  • 使用Python 和 Selenium 抓取 酷狗 音乐专辑 附源码
    在这篇博客中,我将分享如何使用Python和Selenium抓取酷狗音乐网站上的歌曲信息。我们将使用BeautifulSoup解析HTML内容,并提取歌曲和专辑信息。依赖库requestsbeautifulsoup4selenium准备工作首先,我们需要安装一些必要的库:pipinstallrequestsbeautifulsoup4selenium......