用Python下载第一次陷入小说

时间：2023-01-22 13:00:50浏览次数：51

标签：陷入 Python list re html result url response 下载

# -*- coding: utf-8 -*-
import requests
import re
import os

# 判断有没有该文件夹，没有加创建一个
if not os.path.exists('青春无悔'):
    os.mkdir('青春无悔')

url = 'https://www.yibige.cc/110006/index.html'

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3877.400 QQBrowser/10.8.4506.400'
}

response_1 = requests.get(url=url, headers=headers)
# 自动转码
response_1.encoding = response_1.apparent_encoding
html_data = response_1.text
# 获取小说章节列表
result_list = re.findall('<dd><a href="(.*?)">.*?</a></dd>', html_data, re.S)
# result_list: 获取第一次提取的链接，方便第二次提取
result_list = result_list[:308]
for result_name in result_list[:308]:
    # 链接拼接
    all_url = 'https://www.yibige.cc/110006/' + result_name
    # 发送网络请求
    response_2 = requests.get(all_url)
    response = requests.get(url=url, headers=headers)
    # 自动转码
    response_2.encoding = response.apparent_encoding
    html_data_2 = response_2.text
    # 标题
    title = re.findall('<h1>(.*?)</h1>', html_data_2, re.S)[0]
    # 文章的内容
    result = re.findall('<div id="content" class="contentjs">(.*?)</div>', html_data_2, re.S)
    txt = result[0].replace('    ', '  ').replace('</p><p>', '\n').replace('<p>', '').replace("</p><script>site_con_ad('亿笔阁','https://www.yibige.cc');</script>", '')
    # 保存
    with open('青春无悔\\' + title + '.txt', mode='w', encoding='utf-8') as f:
        f.write(txt)
        print('下载成功:', title)

标签：陷入,Python,list,re,html,result,url,response,下载
From： https://www.cnblogs.com/Clx23977/p/17064380.html

Python运行时CPU占用不同的问题
提问：同一个Python文件，双击运行和在IDLE里Run所占用的CPU资源相差很多如上图，一个是双击运行的，另一个是IDLE里运行的，CPU资源占用的区别很明显解答：它们的......
Python入门之bool类型
"""bool运算符比较运算符><>=<===结果是：bool类型逻辑运算符:判断两个bool值关系与......
Python入门之数据转换练习
#练习3#古代的秤一斤的16两，33=2斤1两#练习：在控制台中获取两，计算是几斤零几两#显示几斤零几两weight_liang=int(input("请输入多少两:"))jin=weight_lia......
python异常处理
Python的异常机制主要依赖try、except、else、finally和raise五个关键字，其中在try关键字后缩进的代码块简称try块，它里面放置的是可能引发异常的代码；在except后对应的是......
Python-实现逻辑回归
Python-实现逻辑回归1逻辑回归感知器的缺点是只能做线性可分的分类任务，如果任务不是完全可以线性可分的，那么感知器是永远不能收敛的，因为每次更新都会有至少一个错误。现......
学习笔记——SpringMVC文件上传与下载
2023-01-21一、文件下载1、实现文件下载步骤（1）准备文件下载相关步骤（2）将ResponseEntity<T>对象，作为方法返回值（3）为ResponseEntity<T>对象，设置三个参数 2、示例代码@R......
QML与python互相通信
解决python与QML的通信问题：QML中直接调用python函数python发送信号，QML响应信号并进行相应处理py文件#ThisPythonfileusesthefollowingencoding:utf-8impor......
什么是 Python 中的装饰器？
装饰器是Python中最强大的设计模式之一。装饰器用于向已创建的对象添加新功能，而无需修改其结构。使用装饰器，您可以轻松包装另一个函数以扩展包装的函数行为，并且无需永久修......
Python——01.环境及安装
Python介绍--Python是解释型，面向对象的语言，程序结构简洁，清晰--Python解释器分类：CPython（官方解释器）：用C语言编写的Python解释器PyPy：用Python语言编写的Python......
用Python写一个模拟过年礼花的程序
介绍过年了，好不容易熬到疫情放开，也该放烟花放鞭炮庆祝下了，祝大家新年快乐，身体健康，万事如意，希望新的一年诸邪退散，春暖花开~主程序importpygame,math,time,random,......

用Python下载第一次陷入小说

相关文章

赞助商

阅读排行