1. 目标网页
如果要访问当当网“我的收藏” http://myhome.dangdang.com/myFavorite
,没有登录的情况下访问该URL会跳转到登录页。使用nodejs程序访问,结果如下图所示。
2. 获取伪装登录所需的Cookie信息
我们打开Chrome浏览器,登录当当网。来到“我的收藏夹”页面,仍然在Network中查看该页面的头信息和Cookie。nodejs程序携带Cookie发起请求,那么网页收到请求发现Cookie会认为请求者已经登录,于是就可以直接返回页面。
一个网站可能有多个服务器,不同页面可能编码方式不同(比如当当网首页采用GBK编码,购物车页面则采用UTF8编码,且服务器地址Remote Address和域名都发生变更),因此我们最好更新所有的请求头信息。