首页 > 其他分享 >蜘蛛爬取网页

蜘蛛爬取网页

时间:2022-10-21 00:12:18浏览次数:46  
标签:网页 robots 搜索引擎 爬取 蜘蛛 txt

 蜘蛛访问每一个网页时,都会访问网站目录下的robots.txt文件,如果robots.txt文件禁止搜索引擎抓取,搜索引擎将遵循规则。  每个搜索引擎蜘蛛都有自己的身份用户代理名称;为了爬取更多的页面,搜索引擎蜘蛛会跟踪页面上的链接,采用深度优先策略广度优先策略进行逐级进行爬取;

标签:网页,robots,搜索引擎,爬取,蜘蛛,txt
From: https://www.cnblogs.com/cmkbk/p/16812067.html

相关文章