下载小说

下载小说

时间：2022-10-22 10:23:42浏览次数：55

标签：www url text content book tw 小说下载

点击查看代码

# @Author: 昊阳
# _*_ coding : utf-8 _*_
# @Time:2022/10/21 0021 20:26
# @File : xiaoshuo
# @Project : MyCase
import parsel
import requests
from lxml import etree #这个是xpath解析
import  re #这个是正则解析
# https://www.qb5.tw/book_991/ #完美世界
# https://www.qb5.tw/book_115322/ #大奉打更人
# https://www.qb5.tw/book_8227/ #斗破苍穹
# 正文
url = "https://www.qb5.tw/book_8227/"
headers = {
    'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
}
response = requests.get(url=url).text

list_url = re.findall('<dd><a href="(.*?)">(.*?)</a></dd>',response)
for book_url in list_url:
    # print(book_url)
    # 章节地址
    urls = url + book_url[0]
    # 章节名称

    text = book_url[1]
    name = re.sub('[，;；youle: ：.;,$*#/ ]', "", text)
    # print(urls)
    # print(name)
    data = requests.get(url=urls).text
    content = etree.HTML(data)
    bookcontent = content.xpath('//div[@id="content"]/text()')
    # 字符串拼接
    book_content = '\n'.join(bookcontent).replace(' ','').replace('全本小说网 www.qb5.tw，最快更新\n最新章节！','')


    #下载小说
    with open(r'斗破苍穹/'+name+'.txt',mode='a',encoding='utf-8')as f:
        f.write(book_content)
    print(name,'小说下载成功')

# print(response)

标签：www,url,text,content,book,tw,小说,下载
From： https://www.cnblogs.com/lzp110119/p/16815445.html

Win11 22H2【10月累积更新镜像下载+Moment 1更新】
大版本号：22H2内部版本号：22621.674另外微软于本月已向部分用户推送Moment1更新【内部版本号是：22621.675】，它是一次小型的功能性更新，没有集成到镜像里，可手动安装升级。......
下载插件失败? pom.xml
parent标签下加，表示直接去远程仓库下载<relativePath/>比如<parent><artifactId>spring-boot-dependencies</artifactId><groupId>org.springfra......
div 内容生成图片并下载
<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metahttp-equiv="X-UA-Compatible"content="IE=edge"><metaname="v......
前端：解决项目下载依赖本地服务以及打包白屏问题
下载依赖本地服务奇怪报错：打包后奇怪报错：1.改变node版本2.把packjson-lock.json删除重新下载依赖问题解决......
轻松下载k8s.gcr.io，gcr.io，quay.io镜像
目录一.系统环境二.前言三.使用现成的镜像代理仓库下载镜像3.1使用阿里云镜像仓库3.2使用lank8s.cn镜像仓库3.3使用中科大镜像一.系统环境服务器版本docker软件版......
【Jmeter】Jmeter插件下载
0、插件下载地址： https://jmeter-plugins.org/install/Install/ 1、将插件放在Jmeter文件夹内/lib/etc文件夹下 2、重启Jmeter 3、点击插件管......
下载plsql
plsql各版本官网下载地址官网版本列表https://www.allroundautomations.com/registered-plsqldev/ plsql11.0.6https://www.allroundautomations.com/files/pl......
react下载兼容浏览器
//导出模板exportfunctionexportTemplateExcel(url,params,config={}){returnnewPromise((resolve,reject)=>{axios.get(url,{params:pa......
Win10_22H2最新年度正式版下载
大版本号：22H2内部版本号：19045.2006版本说明大版本号：每年发布一次，如2021年21H2、2022年22H2小版本号：每年提供若干次ISO镜像，大版本号不变，变化的是小版本号（内部版本号......
爬取起点小说信息存入excel
点击查看代码importurllib.requestfromlxmlimportetreeimportxlwt#请求地址url='https://www.qidian.com/all/action1-page1'#用户代理headers={......

相关文章

赞助商

阅读排行