首页 > 其他分享 >csv文件保存

csv文件保存

时间:2022-12-04 21:11:06浏览次数:32  
标签:文件 img text 保存 li ul div csv

#爬取起点中文网的书名作者并用csv文件保存
import requests
import csv
from lxml import etree
ua={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36'}
f=open('qidian.csv','w',encoding="gbk",newline='') #注意newline和gbk
for i in range(2,5):
res=requests.get('https://www.qidian.com/all/page{}/'.format(i),headers=ua) #formit补全
res.encoding='utf-8' #设置编码格式
t=etree.HTML(res.text) #构造树结构
biaoti = t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/h2/a/text()')
zuozhe = t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[1]/a[1]/text()')
leixing = t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[1]/a[2]/text()')
lianzai = t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[1]/span/text()')
jianjie = t.xpath('//*[@id="book-img-text"]/ul/li/div[2]/p[2]/text()')
for a, b, c, d, e in zip(biaoti, zuozhe, leixing, lianzai, jianjie):
wt = csv.writer(f) #写入csv文件当中
wt.writerow([a+' '+b+' '+c+' '+d+' '+e+'\n']) #需注意中括号,否则会有逗号
f.close()

标签:文件,img,text,保存,li,ul,div,csv
From: https://www.cnblogs.com/txa2003/p/16950792.html

相关文章