爬取剑来小说

爬取剑来小说

时间：2024-08-05 20:59:26浏览次数：5

标签：__ title resp herf async import 小说取剑来

此程序需要安装这些模块

一定要先创建一个叫做 ‘剑来’ 的文件夹

import asyncio
import requests
import re
import aiohttp
import aiofiles

async def aiodownload(herf,title):
    headers = {
        "User - Agent":
            "Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 121.0.0.0Safari / 537.36Edg / 121.0.0.0"
    }
    async with aiohttp.ClientSession() as session:
        async with session.get(herf,headers=headers) as resp:
            data = await resp.text()

            #print(data)

            obj = re.compile(r'<div id="chaptercontent" class="Readarea ReadAjax_content">(?P<content>.*?)请收藏本站：https://www.bqgui.cc')
            novels = obj.finditer(data)
            for i in novels:
                novel = i.group("content").replace('<br /><br />', "")
                async with aiofiles.open('剑来/' + title, mode='w', encoding='utf-8') as f:
                    await f.write(novel)


async def getherf(url):
    resp = requests.get(url)
    obj = re.compile(r"<dd><a href =(?P<herf>.*?)>(?P<title>.*?)</a></dd>")
    results = obj.finditer(resp.text)
    tasks = []
    for result in results:
        herf = 'https://www.bqgui.cc'+str(result.group("herf")).replace('"',"")
        title = result.group("title")
        print(herf,title)

        d = asyncio.create_task(aiodownload(herf,title))
        tasks.append(d)

    await asyncio.wait(tasks)

if __name__ == '__main__':
    url = 'https://www.bqgui.cc/book/1031/'
    asyncio.run(getherf(url))

爬取结果

标签：__,title,resp,herf,async,import,小说,取剑来
From： https://blog.csdn.net/m0_74823576/article/details/140936521

起点小说w_tsfp
声明:本文章中所有内容仅供学习交流使用，不用于其他任何目的，不提供完整代码，抓包内容、敏感网址、数据接口等均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！wxa15018601872 本文章未经许可禁止转载，禁止任何修改后二次传播，......
A086-基于SpringBoot+vue实现的在线小说阅读平台（源码+数据库+部署文档+包运行）
（=======如需源码请查看博主个人信息介绍，可联系博主获取源码=============）开发语言和框架：JDK版本：确保使用JDK1.8，以支持SpringBoot的最新特性和性能优化。服务器：使用Tomcat7作为您的应用程序的服务器，提供可靠的运行环境和良好的性能。数据库：选择MySQL5.7作为......
学会用Python爬取小说网站，想看什么就爬什么，广告也不用看了~
今天以爬取笔趣阁小说网站为例，练习Python爬虫技术。通过这个爬虫，可以完成批量爬取一本小说的所有章节，并将所有章节内容按顺序保存到一个txt文档内，下面我们就开始吧。首先，百度搜索“笔趣阁”，发现有很多网站都叫笔趣阁。我们可以随便挑选一个网站尝试，本文我以‘https://......
毕业设计：基于Springboot的在线小说阅读平台【代码+论文+PPT】
全文内容包括：1、采用技术；2、系统功能；3、系统截图；4、配套内容。索取方式见文末微信号，欢迎关注收藏！一、采用技术语言：Java1.8框架：SpringBoot数据库：MySQL5.7、8.0开发工具：IntelliJIDEA旗舰版其他：Maven3.8以上二、系统功能会员管理：负责用户注册、登录、会员等级划分及用户信......
SSM小说阅读网站-计算机毕业设计源码11362
摘要本文介绍了一个基于SSM框架和MySQL数据库的小说阅读网站的设计与实现。该网站旨在为用户提供一个方便、舒适的在线小说阅读平台。该小说阅读网站具有以下主要功能：用户注册与登录、小说分类浏览、小说搜索、阅读历史记录、小说畅听等。通过该网站，用户可以根据自己的兴......
计算机毕业设计Python+Tensorflow小说推荐系统 K-means聚类推荐算法深度学习 Kears
2、基于物品协同过滤推荐算法2.1、基于⽤户的协同过滤算法（UserCF）该算法利⽤⽤户之间的相似性来推荐⽤户感兴趣的信息，个⼈通过合作的机制给予信息相当程度的回应（如评分）并记录下来以达到过滤的⽬的进⽽帮助别⼈筛选信息，回应不⼀定局限于特别感兴趣的，特别不感兴趣信息的纪录也相......
【Python爬虫实战入门】：笔趣阁小说爬取，一篇教你爬虫入门
文章目录......
小说推文可以用哪些素材？
小说推文可以使用的素材多种多样，以下是一些常见的素材类型及其特点：解压类素材内容：包括美食制作（如蛋糕烘焙）、手工艺（如捏橡皮、修马蹄、太空沙）、日常生活场景（如洗地毯、绘画、切肥皂等）。特点：这些素材能够带给观众放松和愉悦感，适用于营造轻松氛围的小说推文。我分享了「60......
知乎小说推文怎么授权?
知乎推文的授权过程，对于许多初入此道的朋友来说可能略显复杂，但只要按步骤操作，就能顺利获得授权。以下是一个简明扼要且富有创新的授权指南：一、了解现状目前，知乎官方对于个人直接申请推文授权的渠道已经较为封闭，个人难以直接获得授权。不过，别担心，这并不意味着你无法参与推......
怎么才能申请小说推文授权？
申请小说推文授权，是许多希望在社交媒体平台上推广小说内容的朋友所关心的问题。下面，我将以一种通俗易懂且富有创新的方式，为大家详细解析申请小说推文授权的步骤和注意事项。一、了解授权渠道首先，你需要明确哪些渠道可以提供小说推文的授权。当前，个人直接从小说平台官方申......

相关文章

赞助商

阅读排行