Amazoncaptcha 95%成功率绕过亚马逊IP验证码

时间：2022-10-19 16:35:59浏览次数：77

标签：获取 IP 验证码亚马逊 captcha Amazoncaptcha amzn 95% 页面

这次又来折腾亚马逊了。

之前有介绍亚马逊的商品获取和评论获取。但是在批量获取和多次访问的情况下出现了需要验证码的情况：

Amazoncaptcha 95%成功率绕过亚马逊IP验证码_数据

当然，出现这种情况你是肯定获取不到数据的。但是，你离你想要的数据，真的很近了。所以本次的目的就是绕过这个验证码，获取验证码背后的数据。

一、Amazoncaptcha

git地址：https://github.com/a-maliarov/amazoncaptch

Amazoncaptcha这个包就是在你出现这个页面的时候使用的，可以通过selenium获取当前的验证码页面，使用Amazoncaptcha包的fromdriver这个方法返回验证码的str格式：

1. from amazoncaptcha import AmazonCaptcha  
2. from selenium import webdriver  
3.    
4. driver = webdriver.Chrome() # This is a simplified example  
5. driver.get('https://www.amazon.com/errors/validateCaptcha')  
6.    
7. captcha = AmazonCaptcha.fromdriver(driver)  
8. solution = captcha.solve()

还有一种方式那就是将验证码页面的验证码图片链接通过Amazoncaptcha.fromlink方法获取：

1. from amazoncaptcha import AmazonCaptcha  
2.    
3. link = 'https://images-na.ssl-images-amazon.com/captcha/usvmgloq/Captcha_kwrrnqwkph.jpg'  
4.    
5. captcha = AmazonCaptcha.fromlink(link)  
6. solution = captcha.solve()

二、亚马逊验证码认证和 Amazoncaptcha具体使用

首先打开亚马逊的验证码页面（实在没法复现错误，把之前的报错的html存到本地了，也不是不能凑合看），根据图片输入验证码之后发送验证，查看网络请求：

Amazoncaptcha 95%成功率绕过亚马逊IP验证码_ide_02

在这我们能发现这个链接除了我们输入的验证码eld-keywords之外，还有amzn和amzn-r这两个参数。

那么着两个参数是从哪来的呢？

回到输入验证码的那个页面，检查元素，在这个页面有两个隐藏于，这两个参数的value值就在这里：

Amazoncaptcha 95%成功率绕过亚马逊IP验证码_数据_03

当然，验证码图片的链接也捎带手获取了，然后将所有的参数凑成链接：

1. imgUrl = sel.css(".a-spacing-double-large .a-section form .a-spacing-large .a-text-center img::attr(src)").extract_first()  
2. captcha = AmazonCaptcha.fromlink(imgUrl)  
3. solution = captcha.solve()  
4. amzn = sel.xpath("//input[@name='amzn']/@value").extract_first()  
5. amznr = sel.xpath("//input[@name='amzn-r']/@value").extract_first()  
6. validUrl = f"https://www.amazon.com/errors/validateCaptcha?amzn={amzn}&amzn-r={amznr}&field-keywords={solution}"

Amazoncaptcha 95%成功率绕过亚马逊IP验证码_ide_04

这样就获取到发送验证码的链接了。

加入当你在请求一个亚马逊商品页的时候，突然返回了验证码的页面，按照上面的思路，获取到验证码的验证链接，然后进行get请求，你会发现这个链接返回的就是你想要的东西，不需要重定向：

Amazoncaptcha 95%成功率绕过亚马逊IP验证码_ide_05

不过有一点，无论是亚马逊的各种请求还有Amazoncaptcha需要请求验证码图片链接，是无法正常请求的，实在需要的话，还是需要代理去辅助请求。

我这里使用的是ipidea的代理，好的代理能帮助你更好的获取数据，高质量低延迟，而且新用户可以白嫖哦！

地址：www.ipidea.net

以上就是

标签：获取,IP,验证码,亚马逊,captcha,Amazoncaptcha,amzn,95%,页面
From： https://blog.51cto.com/u_15811883/5775946

做题记录整理图论/dfs P5022 [NOIP2018 提高组] 旅行（2022/10/19）
P5022[NOIP2018提高组]旅行我只想出了部分分的解法。。。https://fzy.blog.luogu.org/solution-p5022#include<bits/stdc++.h>#definefor1(i,a,b)for(inti=a;i......
做题记录整理图论/最短路/dp/记忆化搜索 P3953 [NOIP2017 提高组] 逛公园（2022/10/19）
P3953[NOIP2017提高组]逛公园https://122720.blog.luogu.org/p3953-ti-xie-ji-yi-hua-sou-suo大佬讲得挺好的，我就不写了#include<bits/stdc++.h>#definefor1(i,a,b......
#打卡不停更#【ELT.ZIP】啃论文俱乐部——统计压缩编码机理分析
本文出自ELT.ZIP团队，ELT<=>Elite(精英)，.ZIP为压缩格式，ELT.ZIP即压缩精英。成员：上海工程技术大学大三学生合肥师范学院大三学生成都信息工程大学大二学生黑龙江大......
[Typescript] 57. Medium - FlattenDepth
Recursivelyflattenarrayuptodepthtimes.Forexample:typea=FlattenDepth<[1,2,[3,4],[[[5]]]],2>//[1,2,3,4,[5]].flattern2timestypeb=Fl......
易基因｜典型案例：MeRIP-seq综合分析肺腺癌中的转录组m6A甲基化组
大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。2022年8月11日，南方科技大学王玉琨教授团队以“ComprehensiveAnalysisoftheTranscriptome-widem6AMeth......
阿里巴巴 Noslate 正式开源 - 面向云原生的 JavaScript 容器方案
继 2019 年开源 Midway 框架之后，阿里一直在 Node.js 的前沿进行深度研究，除了加入 TC39 参与标准化建设，向上游 Node.js 项目持续贡献，与龙蜥社区合作优化之外，也在......
JavaScript字符串一些方法使用charAt、charCodeAt、replace、split、substr
charAt():根据下标返回字符1<script>2letstr='abcde';3console.log(str.charAt(1));//返回结果：b4</script> charCodeAt():根据下标返回字......
Classical Cipher
[NPUCTF2020]ClassicalCipher难得做到一道古典密码的题目，打开后有一个flag.zip和一个提示。解密后的flag请用flag{}包裹压缩包密码：gsv_pvb_rh_zgyzhs对应明文：***......
JavaScript数组常用数组函数
constarr=[1,12,13,4,5,6,7,8];//找出符合条件的第一个元素，并返回。否返回undefinedconstfount=arr.find((x)=>{returntypeof(x)==="number";})consol......
VS控件-Toolstrip
1.工具栏TooIStrip概述Windows窗体中的工具栏控件用于显示一系列菜单选项的位图按钮。这样单击工具栏中的一个按钮，就相当于选择了一个菜单项。工具栏上的按钮通常包含......

Amazoncaptcha 95%成功率绕过亚马逊IP验证码

一、Amazoncaptcha

二、亚马逊验证码认证和 Amazoncaptcha具体使用

相关文章

赞助商

阅读排行

Amazoncaptcha 95%成功率绕过亚马逊IP验证码

一、Amazoncaptcha

二、亚马逊验证码认证 和 Amazoncaptcha具体使用

相关文章

赞助商

阅读排行

二、亚马逊验证码认证和 Amazoncaptcha具体使用