首页 > 其他分享 >新人站长,使用雷池社区版WAF对抗防爬

新人站长,使用雷池社区版WAF对抗防爬

时间:2024-12-04 13:31:02浏览次数:9  
标签:浏览器 雷池 WAF 验证 爬虫 HTML 防爬 识别

反爬虫思路

  1. 请求签名:绑定客户端和 SESSION,随意修改 IP、User-Agent、浏览器指纹等信息后 SESSION 自动吊销

  2. 识别行为:检测鼠标键盘的使用习惯,检测浏览器窗口的拜访位置,综合判断是不是真人行为

  3. 识别无头浏览器:识别本地浏览器的客户端特征,禁止无头浏览器访问

  4. 识别自动化调用:识别本地浏览器是不是被自动化程序控制,禁止自动化控制的浏览器访问

  5. 交互识别:让用户参与网页交互验证码,比如滑动验证、识别图片、识别文字等

  6. 算力验证:注入算力验证脚本,消耗 CPU 资源,抬高客户端的访问成本,让原本每秒可以访问 1000 次的设备,在被雷池保护后每秒只能访问 1 次

  7. 防止请求重放:增加一次性验证,让 HTTP 请求脱离浏览器后无法重复发送,让复制后的 Cookie 失效

  8. 打乱 HTML 结构:对 HTML 代码结构进行动态打乱,让爬虫无法识别网页特征

  9. 混淆 JS 代码:对 JS 代码进行动态混淆,让攻击者无法识别有效的网页逻辑

怎么用雷池防爬虫

雷池 WAF 包含了市面上绝大部分的反爬虫技术,而且可以随意使用

安装好雷池 WAF 以后开启防爬虫相关的功能即可生效,如下图:

图片

图片

不出意外的话,1 分钟就能完成配置。完成配置以后,访问被雷池 WAF 防护的网站,就会看到雷池正在检查客户端环境的安全性。

图片

合法用户等待两三秒以后真正的网页内容会自动载入,恶意用户则会被阻拦。

如果检测到本地客户端被自动化程序控制,访问依然会被阻止,如下图:

图片

验证通过后查看网页源代码,会发现 HTML 和 JS 代码也都做了动态加密保护,虽然是相同的网页,但每次刷新看到的 HTML 代码结构都不同。

看一个例子,服务端的 HTML 文件如下图:

图片

经过雷池动态防护以后,浏览器里看到的 HTML 文件如下图:

图片

这里要说一下,雷池的人机识别采用的是云端验证方式,每一次验证都会调用长亭的云端 API 来辅助验证,结合长亭的 IP 威胁画像数据,浏览器指纹数据,最终对于爬虫的识别率超过 99.9%。与此同时,云端的算法和 JS 逻辑会持续自动更新,即使被厉害的大佬破解,破解的也只是过去的版本,我们永远跑在攻击者的前面。

看着这么高的识别率,网站站长们肯定会担心这会不会影响 SEO,会不会影响搜索引擎对于网站页面的收录情况。

答案当然是 “不会”,雷池贴心的提供了各大搜索引擎的爬虫 IP 列表,如果对 SEO 有需求,只需要对这些 IP 加白即可。

图片

标签:浏览器,雷池,WAF,验证,爬虫,HTML,防爬,识别
From: https://blog.csdn.net/2404_89164415/article/details/144142255

相关文章

  • 雷池社区版WAF中SQL注入的拦截测试
    很多雷池社区版用户听说雷池的防护能力很不错,但是平时也感知不到防护怎么样那是不是最好有一个防护能力的测试呢?为大家整理一个SQL攻击请求的演示,涉及到的攻击命令,仅用于学习与参考。关于SQL攻击原理解释主要针对使用结构化查询语言(SQL)进行数据库操作的应用程序。通过利用......
  • 【web安全】waf部署模式
    一、dns解析模式图中意思就说,咱给要防护的网站设置一个cname记录,比如www指向我们的WAFip1.1.1.1,这样www网站的流量会解析到WAF那里。这种模式下,找到真实ip可能直接绕过检测。二、串联模式像串葫芦一样串起来这种模式当数据溢出WAF临界值,WAF可能就无法检测了。注意:不能超......
  • 教学,WAF 雷池社区版的在线安装
    作为小站长,最近看到雷池社区版很火,各大技术群都在讨论简单介绍什么是雷池引用官网文档的一段话:SafeLine,中文名"雷池",是一款简单好用,效果突出的 Web应用防火墙(WAF),可以保护Web服务不受黑客攻击。雷池通过过滤和监控Web应用与互联网之间的HTTP流量来保护Web服务......
  • 雷池docker env 配置说明
    雷池dockerenv配置说明当通过安装命令安装完雷池之后,在安装目录下面会生成一个.env文件,该文件是雷池的安装配置,样例如下SAFELINE_DIR=/data/safelineIMAGE_TAG=latestMGT_PORT=9443POSTGRES_PASSWORD=qazxswedcSUBNET_PREFIX=172.22.222ARCH_SUFFIX=-armIMAGE_......
  • 一看就会,雷池社区版数据迁移教程
    一看就会,雷池社区版数据迁移教程数据迁移的步骤大致步骤:1.准备好接受迁移的雷池环境,版本保持和原环境一致如果原版版本过低,尝试更新后再迁移确认两个环境的雷池版本一致环境1 需要迁移的环境环境2 ,接受迁移的环境2.两个环境都停止容器在雷池的安装目录下使用do......
  • 雷池社区版自动化拉黑ip,使用OPEN API实现
    老版本使用雷池社区版的时候都需要在界面操作,但是网络攻击往往都是无规律的,每次都手动操作非常累前一段时间雷池社区版刚好开放了OPENAPI功能,可以支持大家使用API的方式进行管理了但是没有相关文档非常难受,一直没有使用相关功能 前几天的7.2版本又公开api文档,诚意满满这次......
  • 如何在雷池 WAF 通过文件更新 SSL 证书
    有些用户在使用雷池WAF的证书管理功能时,觉得手动申请的证书需要去界面上传一次略显繁琐,想通过一个固定的目录存储证书文件,覆盖后让雷池自动检测并更新,这样可以通过一些自动化工具来完成整个流程。相关的ISSUE有:[建议]证书增加使用路径导入方式[Bug]手动更新证书文件并重......
  • 雷池社区版有多个防护站点监听在同一个端口上,匹配顺序是怎么样的
    如果域名处填写的分别为IP与域名,那么当使用进行IP请求时,则将会命中第一个配置的站点以上图为例,如果用户使用IP访问,命中example.com。如果域名处填写的分别为域名与泛域名,除非准确命中域名,否则会命中泛域名,不论泛域名第几个配置。以上图为例,如果用户使用a.examp......
  • aws waf 特定链接不能访问
    "GET/en/stores?page=185&country=US&sort=default&alpha=HTTP/1.1"200227757"-""Mozilla/5.0(WindowsNT10.0;Win64;x64;rv:124.0)Gecko/20100101Firefox/124.0"翻页功能禁止使用:/stores?page=1/stores?page=2/stores?p......
  • 雷池+frp 批量设置proxy_protocol实现真实IP透传
    需求内网部署safeline,通过frp让外网访问内部web网站服务,让safeline记录真实外网攻击IPsafeline跟frp都部署在同一台服务器:192.168.2.103frpclient配置frpc只需要在https上添加transport.proxyProtocolVersion="v2"即可,例如root@safeline:~#cat/etc/frp/frpc.to......