首页 > 其他分享 >下载小说

下载小说

时间:2022-10-22 10:23:42浏览次数:49  
标签:www url text content book tw 小说 下载

点击查看代码
# @Author: 昊阳
# _*_ coding : utf-8 _*_
# @Time:2022/10/21 0021 20:26
# @File : xiaoshuo
# @Project : MyCase
import parsel
import requests
from lxml import etree #这个是xpath解析
import  re #这个是正则解析
# https://www.qb5.tw/book_991/ #完美世界
# https://www.qb5.tw/book_115322/ #大奉打更人
# https://www.qb5.tw/book_8227/ #斗破苍穹
# 正文
url = "https://www.qb5.tw/book_8227/"
headers = {
    'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
}
response = requests.get(url=url).text

list_url = re.findall('<dd><a href="(.*?)">(.*?)</a></dd>',response)
for book_url in list_url:
    # print(book_url)
    # 章节地址
    urls = url + book_url[0]
    # 章节名称

    text = book_url[1]
    name = re.sub('[,;;youle: :.;,$*#/ ]', "", text)
    # print(urls)
    # print(name)
    data = requests.get(url=urls).text
    content = etree.HTML(data)
    bookcontent = content.xpath('//div[@id="content"]/text()')
    # 字符串拼接
    book_content = '\n'.join(bookcontent).replace(' ','').replace('全本小说网 www.qb5.tw,最快更新\n最新章节!','')


    #下载小说
    with open(r'斗破苍穹/'+name+'.txt',mode='a',encoding='utf-8')as f:
        f.write(book_content)
    print(name,'小说下载成功')

# print(response)

标签:www,url,text,content,book,tw,小说,下载
From: https://www.cnblogs.com/lzp110119/p/16815445.html

相关文章

  • ​Win11 22H2【10月累积更新镜像下载+Moment 1更新】
    大版本号:22H2​内部版本号:22621.674​另外微软于本月已向部分用户推送Moment1更新【内部版本号是:22621.675】,它是一次小型的功能性更新,没有集成到镜像里,可手动安装升级。​......
  • 下载插件失败? pom.xml
    parent标签下加,表示直接去远程仓库下载<relativePath/>比如<parent><artifactId>spring-boot-dependencies</artifactId><groupId>org.springfra......
  • div 内容生成图片并下载
    <!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metahttp-equiv="X-UA-Compatible"content="IE=edge"><metaname="v......
  • 前端:解决项目下载依赖本地服务以及打包白屏问题
    下载依赖本地服务奇怪报错:打包后奇怪报错:1.改变node版本2.把packjson-lock.json删除重新下载依赖问题解决......
  • 轻松下载k8s.gcr.io,gcr.io,quay.io镜像
    目录一.系统环境二.前言三.使用现成的镜像代理仓库下载镜像3.1使用阿里云镜像仓库3.2使用lank8s.cn镜像仓库3.3使用中科大镜像一.系统环境服务器版本docker软件版......
  • 【Jmeter】Jmeter插件下载
    0、插件下载地址: https://jmeter-plugins.org/install/Install/  1、将插件放在Jmeter文件夹内/lib/etc文件夹下    2、重启Jmeter   3、点击插件管......
  • 下载plsql
    plsql各版本官网下载地址 官网版本列表https://www.allroundautomations.com/registered-plsqldev/ plsql11.0.6https://www.allroundautomations.com/files/pl......
  • react下载兼容浏览器
    //导出模板exportfunctionexportTemplateExcel(url,params,config={}){returnnewPromise((resolve,reject)=>{axios.get(url,{params:pa......
  • ​Win10_22H2最新年度正式版下载
    大版本号:22H2​内部版本号:19045.2006​版本说明​大版本号:每年发布一次,如2021年21H2、2022年22H2​小版本号:每年提供若干次ISO镜像,大版本号不变,变化的是小版本号(内部版本号......
  • 爬取起点小说信息存入excel
    点击查看代码importurllib.requestfromlxmlimportetreeimportxlwt#请求地址url='https://www.qidian.com/all/action1-page1'#用户代理headers={......