首页 > 其他分享 >爬取剑来小说

爬取剑来小说

时间:2024-08-05 20:59:26浏览次数:5  
标签:__ title resp herf async import 小说 取剑来

此程序需要安装这些模块

一定要先创建一个叫做 ‘剑来’ 的文件夹

import asyncio
import requests
import re
import aiohttp
import aiofiles

async def aiodownload(herf,title):
    headers = {
        "User - Agent":
            "Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 121.0.0.0Safari / 537.36Edg / 121.0.0.0"
    }
    async with aiohttp.ClientSession() as session:
        async with session.get(herf,headers=headers) as resp:
            data = await resp.text()

            #print(data)

            obj = re.compile(r'<div id="chaptercontent" class="Readarea ReadAjax_content">(?P<content>.*?)请收藏本站:https://www.bqgui.cc')
            novels = obj.finditer(data)
            for i in novels:
                novel = i.group("content").replace('<br /><br />', "")
                async with aiofiles.open('剑来/' + title, mode='w', encoding='utf-8') as f:
                    await f.write(novel)


async def getherf(url):
    resp = requests.get(url)
    obj = re.compile(r"<dd><a href =(?P<herf>.*?)>(?P<title>.*?)</a></dd>")
    results = obj.finditer(resp.text)
    tasks = []
    for result in results:
        herf = 'https://www.bqgui.cc'+str(result.group("herf")).replace('"',"")
        title = result.group("title")
        print(herf,title)

        d = asyncio.create_task(aiodownload(herf,title))
        tasks.append(d)

    await asyncio.wait(tasks)

if __name__ == '__main__':
    url = 'https://www.bqgui.cc/book/1031/'
    asyncio.run(getherf(url))

爬取结果

标签:__,title,resp,herf,async,import,小说,取剑来
From: https://blog.csdn.net/m0_74823576/article/details/140936521

相关文章

  • 起点小说w_tsfp
    ​声明:本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!wxa15018601872       本文章未经许可禁止转载,禁止任何修改后二次传播,......
  • A086-基于SpringBoot+vue实现的在线小说阅读平台(源码+数据库+部署文档+包运行)
    (=======如需源码请查看博主个人信息介绍,可联系博主获取源码=============)开发语言和框架:JDK版本:确保使用JDK1.8,以支持SpringBoot的最新特性和性能优化。服务器:使用Tomcat7作为您的应用程序的服务器,提供可靠的运行环境和良好的性能。数据库:选择MySQL5.7作为......
  • 学会用Python爬取小说网站,想看什么就爬什么,广告也不用看了~
    今天以爬取笔趣阁小说网站为例,练习Python爬虫技术。通过这个爬虫,可以完成批量爬取一本小说的所有章节,并将所有章节内容按顺序保存到一个txt文档内,下面我们就开始吧。首先,百度搜索“笔趣阁”,发现有很多网站都叫笔趣阁。我们可以随便挑选一个网站尝试,本文我以‘https://......
  • 毕业设计:基于Springboot的在线小说阅读平台【代码+论文+PPT】
    全文内容包括:1、采用技术;2、系统功能;3、系统截图;4、配套内容。索取方式见文末微信号,欢迎关注收藏!一、采用技术语言:Java1.8框架:SpringBoot数据库:MySQL5.7、8.0开发工具:IntelliJIDEA旗舰版其他:Maven3.8以上二、系统功能会员管理:负责用户注册、登录、会员等级划分及用户信......
  • SSM小说阅读网站-计算机毕业设计源码11362
    摘 要本文介绍了一个基于SSM框架和MySQL数据库的小说阅读网站的设计与实现。该网站旨在为用户提供一个方便、舒适的在线小说阅读平台。该小说阅读网站具有以下主要功能:用户注册与登录、小说分类浏览、小说搜索、阅读历史记录、小说畅听等。通过该网站,用户可以根据自己的兴......
  • 计算机毕业设计Python+Tensorflow小说推荐系统 K-means聚类推荐算法 深度学习 Kears
    2、基于物品协同过滤推荐算法2.1、基于⽤户的协同过滤算法(UserCF)该算法利⽤⽤户之间的相似性来推荐⽤户感兴趣的信息,个⼈通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的⽬的进⽽帮助别⼈筛选信息,回应不⼀定局限于特别感兴趣的,特别不感兴趣信息的纪录也相......
  • 【Python爬虫实战入门】:笔趣阁小说爬取,一篇教你爬虫入门
    文章目录......
  • 小说推文可以用哪些素材?
    小说推文可以使用的素材多种多样,以下是一些常见的素材类型及其特点:解压类素材内容:包括美食制作(如蛋糕烘焙)、手工艺(如捏橡皮、修马蹄、太空沙)、日常生活场景(如洗地毯、绘画、切肥皂等)。特点:这些素材能够带给观众放松和愉悦感,适用于营造轻松氛围的小说推文。我分享了「60......
  • 知乎小说推文怎么授权?
    知乎推文的授权过程,对于许多初入此道的朋友来说可能略显复杂,但只要按步骤操作,就能顺利获得授权。以下是一个简明扼要且富有创新的授权指南:一、了解现状目前,知乎官方对于个人直接申请推文授权的渠道已经较为封闭,个人难以直接获得授权。不过,别担心,这并不意味着你无法参与推......
  • 怎么才能申请小说推文授权?
    申请小说推文授权,是许多希望在社交媒体平台上推广小说内容的朋友所关心的问题。下面,我将以一种通俗易懂且富有创新的方式,为大家详细解析申请小说推文授权的步骤和注意事项。一、了解授权渠道首先,你需要明确哪些渠道可以提供小说推文的授权。当前,个人直接从小说平台官方申......