循环爬取页面信息

时间：2022-12-04 21:12:36浏览次数：41

#循环爬取起点中文网
import requests
from lxml import etree
ua={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36'}
z = 1;
for i in range(2,5):
    res=requests.get('https://www.qidian.com/all/page{}/'.format(i),headers=ua)
    res.encoding='utf-8'
    t=etree.HTML(res.text)
    biaoti=t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/h2/a/text()')
    zuozhe=t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[1]/a[1]/text()')
    leixing=t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[1]/a[2]/text()')
    lianzai=t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[1]/span/text()')
    jianjie=t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[2]/text()')
    for a,b,c,d,e in zip(biaoti,zuozhe,leixing,lianzai,jianjie):
        print(str(z)+" "+a+" "+b+" "+c+" "+d+" "+e+"\n")
        z=z+1

标签：img,text,li,爬取,ul,循环,div,id,页面
From： https://www.cnblogs.com/txa2003/p/16950789.html

循环爬取页面并存储
#循环爬取起点中文网并存储importrequestsfromlxmlimportetreeua={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko......
while 循环和until 循环
格式：格式一、whileCOMMANDS;doCOMMANDS;done格式二、whileCONDITION;do循环体done无限循环：whiletrue;do循环体donefor写发：for((:for((exp1;exp2;exp3......
【JAVA】基于thymeleaf+bootstrap的页面嵌套
网站中对于公共元素（如导航栏等）的使用，可以在页面使用th:insert标签嵌入对应的div等元素，以下展示一个简单的嵌套demo。即将导航栏、登入登出模态对话框作为公共元素引入，代码如......
Vue中优雅的更改iframe嵌入页面的样式
通过外部引入css文件来控制嵌入页面的样式公共iframe组件封装传入属性：嵌入页面路径css文件名称（默认放在/static/css/下），默认css文件名可以自己定义，在确定嵌入页面不多，相......
【Spring系列】- Spring循环依赖
Spring循环依赖......
【vue-router 4.x】使用addRoute加载动态路由时，刷新页面后出现空白页和控制台报错 [Vu
"vue-router":"^4.1.6"遇到的问题动态路由刷新后，出现空白页动态路由刷新后，控制报错[VueRouterwarn]:Nomatchfoundforlocationwithpath"/***/index"1.动态......
网站域名被QQ拦截提示：当前网页非官方页面拦截的解决办法
今天网友提醒，星空站长网的链接被QQ屏蔽拦截了。提示：当前页面非官方页面，请复制到浏览器打开。如图：原因：这是因为QQ方面的诈骗信息特别多，所以腾讯官方索性就直接屏蔽了所有的......
MUI关闭指定页面之外的其余页面
有兴趣可以关注公众号：图计算与算法问题：最近在写一个类似微信的APP，基于mui来在android端以及ios端呈现，但是有个问题是在退出登录切换账号的时候发现app会加载之前的缓存......
JS_登录页面
<!DOCTYPEhtml><html> <head> <metacharset="UTF-8"> <title>登录界面</title> <scripttype="text/javascript"src="js/login.js"></script> </head> <body>......
Spring循环依赖问题
说明: 1.本文基于Spring-Framework5.1.x版本讲解 2.建议读者对创建对象部分源码有一定了解概述这篇讲讲Spring循环依赖的问题，网上讲循环依赖的帖子太多太......

循环爬取页面信息

相关文章

赞助商

阅读排行