requests模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率高
作用:模拟浏览器发请求
如何使用:(request编码的使用流程)
- 请求url
- 发起请求
- 获取响应数据
- 持久化存储
环境安装:
pip install requests
出现的问题,之前用burp suite的时候把代理服务器改成手动的了
报错:
WARNING: Retrying (Retry(total=2, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ProxyError('Cannot connect to proxy.', NewConnectionError('<pip._vendor.urllib3.connection.HTTPSConnection object at 0x00000278F09891C0>: Failed to establish a new connection: [WinError 10061] 由于目标计算机积极拒绝,无法连接。'))': /simple/pip/
代码部分:
import requests #step1:指定url if __name__=="__main__": url = 'https://www.sogou.com' #step2:发送请求 response = requests.get(url=url) #step3:获取相应数据 page_text = response.text print(page_text) #step4:持久化存储 with open('./sogou.html','w',encoding='utf-8')as fp: fp.write(page_text) print('爬取数据结束!!!')
一开始出现了一个问题,说requests中没有get函数,上网查了一下根据这个https://blog.csdn.net/xqe777/article/details/123356700发现是因为文件包也取名叫requests冲突了,修改文件名就好了
报错:AttributeError: module 'requests' has no attribute 'get'
补充:if __name__=="__main__":表示当py文件直接被运行的时候该句下面的代码将被运行,当以模块形式被导入时则不运行,即改代码不能导入其他代码中使用
运行结果:
标签:__,搜狗,None,url,text,爬取,模块,requests From: https://www.cnblogs.com/L-1906/p/16863242.html