解决python错误 UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8b in position 1: i

时间：2023-08-21 10:22:04浏览次数：51

标签：content 0x8b python illegal gb2312 decode read 报错 page

报错的代码：

url= 'http://kaijiang.500.com/shtml/ssq/19001.shtml'
page =urllib.request.urlopen(url)
content = page.read().decode('gb2312')

报这个错的原因是获取到的网页内容是经过压缩了的，打开url可以看到请求head

Accept-Encoding:gzip, deflate

一种方式是请求时把Accept-Encoding设为空，这样的话网页数据未压缩，会相对比较大，增加网络传输时间

另一种方式就是对请求后的数据解压，显然这个方式处理会更快，如下

content = gzip.decompress(page.read()).decode('gb2312')

可是修改之后发现运行还是报错，这时候发现应该是因为网页中含有编码集之外的字符（网页内容指定charset是gb2312），就算加到更大范围还是报错（PS：汉字字符集范围 gb2312 < gbk < gb18030）

这时候选择忽略这些无法解码的字符

content = gzip.decompress(page.read()).decode('gb2312','ignore')

再运行代码，发现这个问题已经解决了

标签：content,0x8b,python,illegal,gb2312,decode,read,报错,page
From： https://www.cnblogs.com/cxd4321/p/17645302.html

python+allure生成测试报告
#一、allure安装##下载地址：CentralRepository:io/qameta/allure/allure-commandline(apache.org)##下载需要安装的版本，这里我选择的是2.9的版本##图片##下载解压完成后，将bin文件夹所在的目录放入环境变量中，同时需要安装JDK。##完成后，命令行pipinstallallure-pytest安装......
Python程序员Visual Studio Code指南3 编辑代码
3编辑代码VisualStudioCode提供了许多适用于所有编程语言的标准编辑功能。快速修复代码补全定义声明格式化语法重构代码片段这些内置的编辑功能减少了编辑代码所需的手动任务和键入次数，从而节省了时间。Python扩展扩展了代码编辑功能。有了Python扩展，导入库只需极......
Python实现Windows下的视频壁纸
importsysimportwin32guiimportsubprocessimporttimedefpretreatmentHandle():hwnd=win32gui.FindWindow("Progman","ProgramManager")workerW1=Nonewhile1:workerW1=win32gui.FindWindowEx(None,workerW1......
我也来扒一扒python的内存回收机制！
python的内存回收是面试中经常会问到一个问题，今天我来给大家深度剖析下python的内存回收和缓存机制 1、引用计数器我们知道，python是通过引用计数器来做内存回收的，下面我们来重点讲下引用计数器提到引用计数器，我们需要先讲下python中的环状双向链表refchain。1.1双向链表ref......
python学习日记 2023年8月20日
fromPILimportImage##pipinstallpillowimportosim=Image.open('./1.jpg')w,h=im.sizeimage_row=3image_column=5names=os.listdir('./img_f')new_img=Image.new('RGB',(image_column*w,image_row*h))foryinra......
devops之Python编程-类的基础架构
Python中，可以通过关键字class来定义一个类。类是一种自定义数据类型，它可以包含属性（变量）和方法（函数）。下面是一个示例：classMyClass:def__init__(self,name):self.name=namedefsay_hello(self):print("Hello,"+self.name+"!")在上面的......
Python教程(10)——Python变量类型元组tuple的详细用法
在Python中，元组（Tuple）是一种有序且不可变的数据类型。元组可以包含任意数量的元素，用逗号分隔，并用圆括号括起来。与列表（List）不同，元组的元素不能修改。元组与列表一样，可以通过索引访问其中的元素。my_tuple=("apple","banana","cherry")print(my_tuple[0])#输出：apple元组的......
Python教程(10)——Python变量类型元组tuple的详细用法
在Python中，元组（Tuple）是一种有序且不可变的数据类型。元组可以包含任意数量的元素，用逗号分隔，并用圆括号括起来。与列表（List）不同，元组的元素不能修改。元组与列表一样，可以通过索引访问其中的元素。my_tuple=("apple","banana","cherry")print(my_tuple[0])#输出：apple元组......
高效利用Python装饰器优化函数功能与性能
在后端开发领域，Python作为一门广泛应用的编程语言，为开发人员提供了丰富的工具和库。本文将深入探讨Python装饰器的原理、用法以及如何利用装饰器优化函数的功能和性能。通过结合实际示例，为读者提供关于装饰器的深奥知识和实用代码。1.装饰器概述与原理装饰器是Python中一种强大的......
python生成相对于入口文件所在目录的绝对路径
在VSCODE中,如果打开多个python文件夹,则在执行python文件时,有时候当前工作目录会切换到其他文件夹,导致保存和读取文件报错.这时候可以生成文件的绝对路径,就可以避归这个问题.下面是生成绝对路径的代码:importosimport__main__defAbsPath(fileName:str)->str:......

解决python错误 UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8b in position 1: i

相关文章

赞助商

阅读排行