「场景」
「思路」
根据题目提示,查看robots文件。
「过程」
查看/robots.txt,文件内容如下:
/fl0g.php 神似flag,访问看看。
cyberpeace{efae3642bb3b3130f3f26fa380a8856b}
得到flag。
「工具」
- Chrome浏览器
「知识拓展」
robots协议也称爬虫协议、爬虫规则等,是指网站可建立一个robots.txt文件来告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取,而搜索引擎则通过读取robots.txt文件来识别这个页面是否允许被抓取。但是,这个robots协议不是防火墙,也没有强制执行力,搜索引擎完全可以忽视robots.txt文件去抓取网页的快照。 [5] 如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据(Metadata,又称元数据)。
robots协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。
标签:GFSJ0162,Training,协议,WWW,抓取,robots,搜索引擎,文件,txt From: https://www.cnblogs.com/stonechen/p/17506872.htmlrobots协议是个君子协议