首页 > 编程语言 >用Python下载第一次陷入小说

用Python下载第一次陷入小说

时间:2023-01-22 13:00:50浏览次数:50  
标签:陷入 Python list re html result url response 下载

# -*- coding: utf-8 -*-
import requests
import re
import os

# 判断有没有该文件夹,没有加创建一个 if not os.path.exists('青春无悔'): os.mkdir('青春无悔') url = 'https://www.yibige.cc/110006/index.html' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3877.400 QQBrowser/10.8.4506.400' } response_1 = requests.get(url=url, headers=headers) # 自动转码 response_1.encoding = response_1.apparent_encoding html_data = response_1.text # 获取小说章节列表 result_list = re.findall('<dd><a href="(.*?)">.*?</a></dd>', html_data, re.S) # result_list: 获取第一次提取的链接,方便第二次提取 result_list = result_list[:308] for result_name in result_list[:308]: # 链接拼接 all_url = 'https://www.yibige.cc/110006/' + result_name # 发送网络请求 response_2 = requests.get(all_url) response = requests.get(url=url, headers=headers) # 自动转码 response_2.encoding = response.apparent_encoding html_data_2 = response_2.text # 标题 title = re.findall('<h1>(.*?)</h1>', html_data_2, re.S)[0] # 文章的内容 result = re.findall('<div id="content" class="contentjs">(.*?)</div>', html_data_2, re.S) txt = result[0].replace(' ', ' ').replace('</p><p>', '\n').replace('<p>', '').replace("</p><script>site_con_ad('亿笔阁','https://www.yibige.cc');</script>", '') # 保存 with open('青春无悔\\' + title + '.txt', mode='w', encoding='utf-8') as f: f.write(txt) print('下载成功:', title)

  

标签:陷入,Python,list,re,html,result,url,response,下载
From: https://www.cnblogs.com/Clx23977/p/17064380.html

相关文章

  • Python运行时CPU占用不同的问题
    提问: 同一个Python文件,双击运行和在IDLE里Run所占用的CPU资源相差很多    如上图,一个是双击运行的,另一个是IDLE里运行的,CPU资源占用的区别很明显解答: 它们的......
  • Python入门之bool类型
    """bool运算符比较运算符><>=<===结果是:bool类型逻辑运算符:判断两个bool值关系与......
  • Python入门之数据转换练习
    #练习3#古代的秤一斤的16两,33=2斤1两#练习:在控制台中获取两,计算是几斤零几两#显示几斤零几两weight_liang=int(input("请输入多少两:"))jin=weight_lia......
  • python异常处理
    Python的异常机制主要依赖try、except、else、finally和raise五个关键字,其中在try关键字后缩进的代码块简称try块,它里面放置的是可能引发异常的代码;在except后对应的是......
  • Python-实现逻辑回归
    Python-实现逻辑回归1逻辑回归感知器的缺点是只能做线性可分的分类任务,如果任务不是完全可以线性可分的,那么感知器是永远不能收敛的,因为每次更新都会有至少一个错误。现......
  • 学习笔记——SpringMVC文件上传与下载
    2023-01-21一、文件下载1、实现文件下载步骤(1)准备文件下载相关步骤(2)将ResponseEntity<T>对象,作为方法返回值(3)为ResponseEntity<T>对象,设置三个参数 2、示例代码@R......
  • QML与python互相通信
    解决python与QML的通信问题:QML中直接调用python函数python发送信号,QML响应信号并进行相应处理py文件#ThisPythonfileusesthefollowingencoding:utf-8impor......
  • 什么是 Python 中的装饰器?
    装饰器是Python中最强大的设计模式之一。装饰器用于向已创建的对象添加新功能,而无需修改其结构。使用装饰器,您可以轻松包装另一个函数以扩展包装的函数行为,并且无需永久修......
  • Python——01.环境及安装
    Python介绍--Python是解释型,面向对象的语言,程序结构简洁,清晰--Python解释器分类:CPython(官方解释器):用C语言编写的Python解释器PyPy:用Python语言编写的Python......
  • 用Python写一个模拟过年礼花的程序
    介绍过年了,好不容易熬到疫情放开,也该放烟花放鞭炮庆祝下了,祝大家新年快乐,身体健康,万事如意,希望新的一年诸邪退散,春暖花开~主程序importpygame,math,time,random,......