目录
url组成
-
协议
- http
- https
-
主机
- www.baidu.com
-
端口号
- http 80
- https 443
- mysql 3306
- oracle 1521
- redis 6379
- mongodb 27017
-
路径
-
参数
- ?号
-
锚点
#号
第一个反爬 - UA校验
制造一个UA
从浏览器的检查-网络路径中找到一个UA,或者百度UA大全
找到一个UA。
将UA放到header字典当中。
因为urlopen只能够接收string或者Request object,所以我们要进行请求对象的定制。
请求对象的定制
要注意的是,我们在进行请求对象定制的时候,传参应该是
url=url
,headers=headers
这种。要不然会报错的。具体的原因可以看下面的源码,这个传参是有顺序的。
我们是要使用
关键字传参
,不能够使用顺序传参
的。
标签:传参,请求,url,爬虫,urllib,对象,定制,UA,056 From: https://www.cnblogs.com/gnuzsx/p/18014061