网上有很多大佬为了帮助渣渣爬虫提升,都有搭建爬虫练习平台网站,这种网站的好处是可以练习爬取,同时网上也有很多参考教程,尤其适合学习练手使用。
爬虫练习网站,镀金的天空-GlidedSky,爬虫-基础1,爬取网页上的数据,计算求和。
爬虫-基础1
“爬虫的目标很简单,就是拿到想要的数据。这里有一个网站,里面有一些数字。把这些数字的总和,输入到答案框里面,即可通过本关。”
http://glidedsky.com/level/web/crawler-basic-1
第一关还是比较简单的,数据的获取也有很多种方法和形式,这里本渣渣抛砖引玉,使用了正则获取数据,可惜网站本身的邮箱验证出错,获取到的计算答案无法验证,以及进入到下一关。
难道是本渣渣ip还是操作有问题?!
这里介绍了一下两种计算方法:
方法一
循环加
numbers=0
for div in divs:
numbers=numbers+int(div.strip())
print(numbers)
方法二
sun 函数
numbers=[]
for div in divs:
number=int(div.strip())
#print(number)
numbers.append(number)
print(numbers)
num=sum(numbers)
写的比较粗糙,仅供学习参考,如需完整源码,可关注本渣渣公众号
后台回复:“爬虫基础1”
获取完整源码
·················END·················
你好,我是二大爷,
革命老区外出进城务工人员,
互联网非早期非专业站长,
喜好python,写作,阅读,英语
不入流程序,自媒体,seo . . .