爬虫问题：requests的content和text

通常来说，text获取的是Unicode编码的文本数据，content获取的是byte类型的二进制数据，比如获取图片本身、PDF文件之类的，可以用content。

但是有时候，我们使用text获取文本的时候，会出现一些难以解决的编码问题，这个时候，我们可以使用content.decode("utf-8")。

仅仅使用content，出现很多\x...，要让它正常显示，因为这些内容原本是文本内容，所以可以使用decode以utf-8形式编码

当然，像这个网页比较简单，没什么乱七八糟的东西，用text也没啥问题

那比如我想获得一张图片文件，如果用text的话（肯定是不合理的，因为这个是一张图片，而不是文本）

我们可以用content获取到图片本身的二进制数据，然后利用这些二进制数据写出为图片文件

保存为图片文件

注意：这是别人免费的API，别去爬。

要是你测试的请求一两次吧还可以，但如果你要频繁测试的话最好别用这些小本经营的免费API网站

标签：Python,text,爬虫,content,requests,文本,图片
From： https://www.cnblogs.com/mllt/p/spider-q-request-content-and-text.html

python文字转语音
pip安装pyttsx3pipinstallpyttsx3代码示例importpyttsx3engine=pyttsx3.init()#engine.say("Beautifulisbetterthanugly.")#engine.say("轻轻地，我走了......
[oeasy]教您玩转python - 0005- 勇闯地下城
继续运行......
python-the second week
python-thesecondweek目录python-thesecondweek数据类型数据类型之bool数据类型之tuple数据类型之set用户交互格式化输出基本运算符常用赋值符逻辑运算符成员运算符身......
运算符重载与过度封装的弊病——记一次python debug
注：标题用了C++的说法，实际上python里应该叫运算符对应的魔法方法？不过大致意思一样，而且标题太长估计不好看。久仰pandas包的大名，今天要处理csv文件，便去翻了翻文档，看了下入门......
7、python对文件的读取
1withopen('demo1_lock3.txt','r',encoding='utf-8')asff:2file=ff.read()3sight=file.split()4lihua=[]5foriinsight......
图片转素描风格处理软件详解（Python实现，含UI界面及代码）
摘要：本文主要介绍图片转素描风格的\(\color{#4285f4}{P}\color{#ea4335}{y}\color{#fbbc05}{t}\color{#4285f4}{h}\color{#34a853}{o}\color{#ea4335}{n}\)软件设计，图像......
python3+request 接口登录封装
#-*-coding:utf-8-*-#@Desc:请求的封装importjsonimportreimportrequestsTOKEN='xxx-xxx-xxx-xxx'classMyRequests:def__init__(self,h......
【Python】计算机视觉手掌图片穴位识别（二）
返回至系列文章导航博客1简要介绍看前说明：此方法可能有一定的缺陷，但是我认为有一定的实现可能所以做了这个板块。倘若有专业的中医医生或者相关工作者对此有建议或......
【python-Unet】计算机视觉~舌象舌头图片分割~机器学习（三）
返回至系列文章导航博客1简介舌体分割是舌诊检测的基础，唯有做到准确分割舌体才能保证后续训练以及预测的准确性。此部分真正的任务是在用户上传的图像中准确寻找到......
python进行敏感性分析（SALib库)
什么是敏感性分析敏感性分析（sensitivityanalysis）是指从定量分析的角度研究有关因素发生某种变化对某一个或一组关键指标影响程度的一种不确定分析技术。每个输入的灵敏......

【Python】【爬虫】爬虫问题：requests的content和text

爬虫问题：requests的content和text

相关文章

赞助商

阅读排行