首页 > 其他分享 >robots.txt文件泄漏漏洞

robots.txt文件泄漏漏洞

时间:2022-11-22 18:39:19浏览次数:43  
标签:泄漏 文件 网站 robots 爬取 txt 目录

漏洞原理及危害

网站根目录下存在robots.txt文件,其内容规定了网络爬虫可爬和不可爬的目录文件。​

搜索引擎可以通过robots文件可以获知哪些页面可以爬取,哪些页面不可以爬取。robots.txt文件可能会泄露网站的敏感目录或者文件,比如网站后台路径,从而得知其使用的系统类型,从而有针对性地进行利用。

测试方法

  1. 工具获取。通过工具爬虫扫描等方式得到敏感文件的路径,从而找到robots文件;​
  2. 手工挖掘,直接在域名后输入/robots.txt进行查看。​

robots.txt文件泄漏漏洞_网站后台


修复建议

总体修复方式:不使用robots文件保护或隐藏信息;使用模糊规则实现robots;适度提升网站内容命名复杂度。具体如下 :​

  • 避免在robots规则中包含敏感目录、文件、后台等信息。使用通配符“*”对目标目录或文件范围模糊化;​
  • 避免常规的文件及目录命名规则,避免攻击者可轻易猜测文件目录。​


标签:泄漏,文件,网站,robots,爬取,txt,目录
From: https://blog.51cto.com/u_14079860/5878307

相关文章

  • robots.txt 文件说明
    robots其实就是指Robots协议,Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(RobotsExclusionProtocol),网站通过Robots协议告诉搜索引擎哪些页面可以......
  • 使用GDB检测内存泄漏
    使用GDB在malloc和free函数设置断点,并打印分配和释放时的内存地址以及调用栈,然后通过脚本分析分配和释放是否配对来检测是否存在内存泄露以及发生内存泄漏的位置。mingdu.zh......
  • 使用Regex正则表达式替换.txt文本文件中指定的词
     1///<summary>2///替换文本文件中的词3///</summary>4///<paramname="filePath"></param>5///<paramn......
  • python爬虫实战一、爬取酷我音乐榜单并写入txt文件保存到本地
    python爬虫实战一、爬取酷我音乐榜单并写入txt文件保存到本地一、总代码和运行截图#加载需要的库importrequestsfrombs4importBeautifulSoupfromlxmlimportetreef=......
  • 傅里叶变换频谱图说明能量泄漏
    对模拟信号进行数字处理前,首先要对时域上无限长的模拟信号进行截取。而傅里叶变换会对截取信号进行延拓,当截取的信号并非整周期时,就会出现能量泄露的情况。以sin函数举例原......
  • sed 在行首添加内容 1i中的数字1代表第一行,i为insert的缩写 sed -i "1i pppp" a.
    sed-i"1ipppp"a.txt1i中的数字1代表第一行,i为insert的缩写i后的空格会被忽略,插入文本后,会自动添加一个换行符"\n" sedBSD和GNU通用文件头部插入文本写法sed可以......
  • java读写文件 txt
    java读写文件txtjava读取txt文件importlombok.extern.slf4j.Slf4j;importjava.io.*;importjava.util.ArrayList;/***createbyfzg*2022/11/1715:16*/......
  • python读取文件列表修改txt内容
        importosfilePath='img'path2=r'/config/FHY_gps.txt'path3=r'/config/FHY_gps_new.txt'name=os.listdir(filePath)name.sort(key=lambdax......
  • Python读取写入txt内容
    Python读取、写入txt内容withopen("test.txt","r")asf:#打开文件data=f.read()#读取文件print(data)withopen("test.txt","w")asf:......
  • Window下批处理分割txt、csv等文件
    日常工作中常遇到大文件,无法打开、无法编辑的情况。一般在Linux下可通过split-l-d-afile.txt的命令直接进行分割为多个文件。但有时在Window下也有同样的需求,......