首页 > 编程语言 >Python简单爬虫

Python简单爬虫

时间:2022-10-15 13:12:12浏览次数:56  
标签:编码 name Python text 爬虫 content 简单 小说 response

对大佬的有些修改,用大佬的编码转换那里老是出问题 这个亲测可以

# -*- coding:utf-8 -*-
import requests
import parsel

url = ""#小说网站
response = requests.get(url)
response.encoding = "utf-8"#小说网站编码
responses = response.text
selector = parsel.Selector(responses)
novel_name = selector.css('#info h1::text').get() #小说名
href = selector.css('#list dd a::attr(href)').getall() #小说章节
for link in href:
link_url = '' + link #小说网站
response_1 = requests.get(link_url)
response_1.encoding='gbk'#小说网站编码
responses_1 = response_1.text
selecter_1 = parsel.Selector(responses_1)
title_name = selecter_1.css('.bookname h1::text').get() #小说章节
content_list = selecter_1.css('#content::text').getall() #小说内容
content = '\n'.join(content_list)


# 保存
with open(novel_name + '.txt',mode = 'a',encoding = 'utf-8',) as f:
f.write(title_name)
f.write('\n')
f.write(content)
f.write('\n')
print(title_name)
print(novel_name)

当返回头里面有content_type 的时候,

1 如果有charset=xxx,则encoding的编码为chatset的值。

2 如果只是text/html,则编码为ISO-8859-1

3 如果什么都没有,就自动识别编码,很准的

标签:编码,name,Python,text,爬虫,content,简单,小说,response
From: https://www.cnblogs.com/python-xiaopang/p/16793955.html

相关文章

  • python提效小工具-统计xmind用例数量
    问题:做测试的朋友们经常会用到xmind这个工具来梳理测试点或写测试用例,但是xmind8没有自带的统计测试用例,其他版本的xmind有些自带节点数量统计功能,但也也不会累计最终的数......
  • aardio 调用 python将图片放上界面
    在aardio中显示图片目录在aardio中显示图片显示图片的控件使用IO库在aardio中使用plus显示图片的控件在aardio中我们显示图片也有对应的控件,这个空间就是高......
  • FreeBSD下开发Python插件并使用nuitka打包
    承接前面的文章https://www.cnblogs.com/passedbylove/p/16759512.htmlhttps://www.cnblogs.com/passedbylove/p/16756063.html自定义Python插件的setup.pyfromdistu......
  • MySQL的简单安装配置
    一.简单了解MySQL1.在了解MySQL之前因该了解的东西数据库(Database)指长期存储在计算机内的、有组织的、可共享的数据集合。数据库实际上就是一个文件集合,是一个存储数据......
  • [oeasy]python0007-Guido的简历
    Guido的简历......
  • [oeasy]python0007-Guido的简历
    ​ 执行esc退回到正常模式​编辑esc退出插入模式准备底行命令模式运行当前py文件保存执行​:w|!python3%​保存并用python3解释当前程序(%)​......
  • # yyds干货盘点 #怎么把这两行Python代码写成一行代码?
    大家好,我是皮皮。一、前言前几天在Python最强王者交流群【刘苏秦......
  • Python 图片亮度检测和调节
    项目上遇到一个问题,图片上的物体识别度较差,尤其是在晚上的图片,画面模糊不清晰,则需要对太暗的图片需要单独提高画面亮度。解法分2步:先检测画面亮度,然后调节画面亮度与对比度......
  • Python|conda重置环境
    前言一般情况下,个人在condabase环境下进行编码,有时新装的包乱了、或者错误的更新,欲重置回滚。或者是本地环境的包太多太杂了,需要回滚到初始状态。解决方案condalist-......
  • 怎么把这两行Python代码写成一行代码?
    大家好,我是皮皮。一、前言前几天在Python最强王者交流群【刘苏秦】问了一个Python的问题,提问截图如下:想法还是非常好的。二、实现过程这里【dcpeng】给了一个代码,不......