首页 > 编程语言 >python下载小说

python下载小说

时间:2025-01-16 22:03:35浏览次数:3  
标签:headers python url bs4 import div 小说 requests 下载

# https://url/kan/45458/1.html
import time
from asyncio import threads

# 1.单章节下载url.bq02.cc
# 2.数据解析(静态数据 xpath re正则 bs4 css)
from bs4 import BeautifulSoup
#
# 请求url 数据类型 字符串
import threading
import requests
from bs4 import BeautifulSoup

def getbook(i):

    # 这是有20个活
    # for i in range(1,21):

        book_url = requests.get(f"url/{i}.html")
        headers = {
            'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36'
            }
        # 静态提取页面数据  动态用点json
        # respuest = requests.get(url = book_url.url,headers=headers).text
        respuest = requests.get(url=book_url.url).text
        # 数据解析  bs4解析
        soup = BeautifulSoup(respuest, 'html.parser')
        # div_element = soup.find('div', attrs={'class': 'kan'})
        div_element = (soup.find('div',id='

标签:headers,python,url,bs4,import,div,小说,requests,下载
From: https://blog.csdn.net/qq_30863945/article/details/145192622

相关文章

  • python 按时间戳删除32×32数组的前2列和后9列(批量处理多个txt)
    前面是单个txt这次批量处理多个txt将所得结果保存到另一个文件夹Python首先处理一个txt内容中多个时间戳,每个时间戳\d{4}-\d{2}-\d{2}\d{2}:\d{2}:\d{2}$对应32行×32列数组,删除数组前2列和后9列。其次采用第一步方法,批量处理某文件夹内所有txt文件,将结果批量存到另一个文件......
  • 从零开始的python之旅(day4)
    从零开始的python之旅(day4)  昨天博客园好像崩了,所以昨天晚上没写,就挪到今天来补了,昨天主要是文件操作,话不多说,上代码  addressBookdefmain():file1=open('TeleAddressBook.txt','rb')file2=open('EmailAddressBook.txt','rb')file1.readline()fil......
  • 【ArcGIS】基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化
    目录第一章、ChatGPT大语言模型提示词与地质灾害基础及平台介绍第二章、空间信息数据库建设第三章、ChatGPT支持下地质灾害风险评价模型与方法第四章、ChatGPT支持下地质灾害风险性、易损性、易发性评价第五章、基于ChatGPT、Python数据预处理与分析【进阶篇】第六章、Ch......
  • Python-基础-列表(list)
    目录1、列表1.1列表的定义1.2列表的特点2、列表的常用语法2.1常用操作2.2列表常用的方法2.3列表常用的函数3、列表推导式1、列表1.1列表的定义列表(List)是一种用于存储多个项目的可变数据结构。它允许你将不同类型的元素(如数字、字符串、甚至其他列表)组织在......
  • Python+Django的社区爱心捐赠(Pycharm Flask Django Vue mysql)
    收藏关注不迷路,防止下次找不到!文章末尾有惊喜项目介绍Python+Django的社区爱心捐赠(PycharmFlaskDjangoVuemysql)项目展示详细视频演示请联系我获取更详细的演示视频,相识就是缘分,欢迎合作!!!所用技术栈前端vue.js框架支持:django数据库:mysql5.7数据库......
  • Python+Django的老年群体安全用药管理系统(角色:用户、医生、药师、管理员)(Pycharm Flas
    收藏关注不迷路,防止下次找不到!文章末尾有惊喜项目介绍Python+Django的老年群体安全用药管理系统(角色:用户、医生、药师、管理员)(PycharmFlaskDjangoVuemysql)项目展示详细视频演示请联系我获取更详细的演示视频,相识就是缘分,欢迎合作!!!所用技术栈前端......
  • 基于粒子群优化算法的计及需求响应的风光储能微电网日前经济调度(Python代码实现)
    目录0引言1计及风光储能和需求响应的微电网日前经济调度模型1.1风光储能需求响应都不参与的模型1.2风光参与的模型1.3风光和储能参与模型1.4风光和需求响应参与模型1.5风光储能和需求响应都参与模型 2需求侧响应评价2.1 负载率2.2可再生能源消纳率2.3用户......
  • python中的列表和元组
    列表(List)可变性:列表是可变的(mutable),这意味着你可以在创建列表后添加、删除或更改其中的元素。定义方式:使用方括号[]来定义一个列表my_list=[1,2,3,"apple","banana"]操作:可以对列表执行多种操作,如追加、插入、删除等。追加元素:my_list.append(4)插入元素:my_list.ins......
  • 使用 Python 实现验证码自动识别
    验证码在防止自动化攻击中扮演了重要角色,而使用OCR(光学字符识别)技术可以实现对验证码内容的自动解析和提取。在本文中,我们将使用Python结合TesseractOCR来完成英文数字验证码的识别任务。环境配置安装Python和依赖库首先,确保您已经安装了Python。若尚未安装,请访问Pyt......
  • 使用 Python 实现验证码识别的简单教程
    验证码是用于验证用户是否为机器人的重要工具。在本教程中,我们将利用Python和TesseractOCR引擎编写一个程序,用于识别英文和数字组成的验证码。通过适当的图像预处理,我们可以有效地提高识别的准确性。环境配置更多内容访问ttocr.com或联系1436423940安装Python和必需库......