Python简单爬虫

时间：2022-10-15 13:12:12浏览次数：58

标签：编码 name Python text 爬虫 content 简单小说 response

对大佬的有些修改，用大佬的编码转换那里老是出问题 这个亲测可以

# -*- coding:utf-8 -*-
import requests
import parsel

url = ""#小说网站
response = requests.get(url)
response.encoding = "utf-8"#小说网站编码
responses = response.text
selector = parsel.Selector(responses)
novel_name = selector.css('#info h1::text').get() #小说名
href = selector.css('#list dd a::attr(href)').getall() #小说章节
for link in href:
    link_url = '' + link #小说网站
    response_1 = requests.get(link_url)
    response_1.encoding='gbk'#小说网站编码
    responses_1 = response_1.text
    selecter_1 = parsel.Selector(responses_1)
    title_name = selecter_1.css('.bookname h1::text').get() #小说章节
    content_list = selecter_1.css('#content::text').getall() #小说内容
    content = '\n'.join(content_list)


    # 保存
    with open(novel_name + '.txt',mode = 'a',encoding = 'utf-8',) as f:
        f.write(title_name)
        f.write('\n')
        f.write(content)
        f.write('\n')
        print(title_name)
print(novel_name)

当返回头里面有content_type 的时候，

1 如果有charset=xxx，则encoding的编码为chatset的值。

2 如果只是text/html,则编码为ISO-8859-1

3 如果什么都没有,就自动识别编码,很准的

标签：编码,name,Python,text,爬虫,content,简单,小说,response
From： https://www.cnblogs.com/python-xiaopang/p/16793955.html

python提效小工具-统计xmind用例数量
问题：做测试的朋友们经常会用到xmind这个工具来梳理测试点或写测试用例，但是xmind8没有自带的统计测试用例，其他版本的xmind有些自带节点数量统计功能，但也也不会累计最终的数......
aardio 调用 python将图片放上界面
在aardio中显示图片目录在aardio中显示图片显示图片的控件使用IO库在aardio中使用plus显示图片的控件在aardio中我们显示图片也有对应的控件，这个空间就是高......
FreeBSD下开发Python插件并使用nuitka打包
承接前面的文章https://www.cnblogs.com/passedbylove/p/16759512.htmlhttps://www.cnblogs.com/passedbylove/p/16756063.html自定义Python插件的setup.pyfromdistu......
MySQL的简单安装配置
一.简单了解MySQL1.在了解MySQL之前因该了解的东西数据库（Database）指长期存储在计算机内的、有组织的、可共享的数据集合。数据库实际上就是一个文件集合，是一个存储数据......
[oeasy]python0007-Guido的简历
Guido的简历......
[oeasy]python0007-Guido的简历
执行esc退回到正常模式编辑esc退出插入模式准备底行命令模式运行当前py文件保存执行:w|!python3%保存并用python3解释当前程序(%)......
# yyds干货盘点 #怎么把这两行Python代码写成一行代码？
大家好，我是皮皮。一、前言前几天在Python最强王者交流群【刘苏秦......
Python 图片亮度检测和调节
项目上遇到一个问题，图片上的物体识别度较差，尤其是在晚上的图片，画面模糊不清晰，则需要对太暗的图片需要单独提高画面亮度。解法分2步：先检测画面亮度，然后调节画面亮度与对比度......
Python|conda重置环境
前言一般情况下，个人在condabase环境下进行编码，有时新装的包乱了、或者错误的更新，欲重置回滚。或者是本地环境的包太多太杂了，需要回滚到初始状态。解决方案condalist-......
怎么把这两行Python代码写成一行代码？
大家好，我是皮皮。一、前言前几天在Python最强王者交流群【刘苏秦】问了一个Python的问题，提问截图如下：想法还是非常好的。二、实现过程这里【dcpeng】给了一个代码，不......

Python简单爬虫

相关文章

赞助商

阅读排行