首页 > 其他分享 >robots.txt禁止收录协议写法

robots.txt禁止收录协议写法

时间:2023-12-09 17:02:32浏览次数:37  
标签:robots agent Disallow User txt 写法

1. 什么是robots.txt?

  robots.txt 是网站和搜索引擎的协议的纯文本文件。当一个搜索引擎蜘蛛来访问站点时,它首先爬行来检查该站点根目录下是否存在robots.txt,

如果存在,根据文件内容来确定访问范围,如果没有,蜘蛛就沿着链接抓取。robots.txt 放在项目的根目录下。

2. robots.txt语法


   1) 允许所有搜索引擎访问网站的所有部分

      robots.txt写法如下:

          User-agent:  *

          Disallow:

       或者

         User-agent:  *

         Allow:  /


      注意: 1. 第一个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。


   2) 禁止所有搜索引擎访问网站的所有部分

      robots.txt写法如下:

           User-agent:  *

            Disallow:  /


   3) 只需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引

       robots.txt写法如下:

             User-agent:  *

             Disallow:  /css/

             Disallow:  /admin/

             Disallow:  /images/


         注意:路径后面有斜杠和没有斜杠的区别:比如Disallow: /images/ 有斜杠是禁止抓取images整个文件夹,Disallow: /images 没有斜杠意思是凡是路径里面有/images关键词的都会被屏蔽


        4)屏蔽一个文件夹/templets,但是又能抓取其中一个文件的写法:/templets/main

            robots.txt写法如下:

                 User-agent:   *

                 Disallow:  /templets

                 Allow:  /main


       5)  禁止访问html/目录下的所有以”.php”为后缀的URL(包含子目录)


              robots.txt写法如下:

                    User-agent:  *

                    Disallow: html/*.php


        6) 仅允许访问某目录下某个后缀的文件,则使用“$”

             robots.txt写法如下:

                   User-agent:  *

                   Allow:  .html$

                   Disallow:  /


         7)禁止索引网站中所有的动态页面

                比如这里限制的是有“?”的域名,例如index.php?id=1

                robots.txt写法如下:

                        User-agent:  *

                        Disallow:  /*?*


      8) 禁止搜索引擎抓取我们网站上的所有图片(如果你的网站使用其他后缀的图片名称,在这里也可以直接添加)

          有些时候,我们为了节省服务器资源,需要禁止各类搜索引擎来索引我们网站上的图片,这里的办法除了使用“Disallow: /images/”这样的直接屏蔽文件夹的方式之外,还 可以采取直接屏蔽图片后缀名的方式。

        robots.txt写法如下:

             User-agent: *

             Disallow:  .jpg$

             Disallow:  .jpeg$

             Disallow:  .gif$

             Disallow:  .png$

             Disallow:  .bmp$

写robots.txt要注意的地方

       1. 第一个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。

  2. 斜杠:/ 代表整个网站

  3.如果“/”后面多了一个空格,则屏蔽整个网站

  4.不要禁止正常的内容

  5.生效时间是几天到两个月 

标签:robots,agent,Disallow,User,txt,写法
From: https://blog.51cto.com/ding/8750637

相关文章

  • requirements.txt
    参考Python中的requirement.txtPython中的依赖Python需要维护项目相关的依赖包。通常我们会在项目的根目录下放置一个requirements.txt文件,用于记录所有依赖包和它的确切版本号。requirements.txt的内容长这样:alembic==1.0.10appnope==0.1.0astroid==2.2.5attrs==1......
  • pip 导入导出模块 requirement.txt
    前言全局说明pip导出模块名功能,是为了在其他环境安装方便而产生的。不管是新环境部署,还给他人代码运行,这个都非常实用。一、导出pipfreeze>requirement.txt二、导入模块pipinstall-rrequirements.txt三、导入模块,指定国内安装源doubanpipinstall-rrequirem......
  • [20231204]快速删除大量文件测试(rsync版本)4.txt
    [20231204]快速删除大量文件测试(rsync版本)4.txt--//前个星期做了大量文件测试,发现只要顺着inode节点顺序删除文件效率最高.--//还有一种方式使用rsync,利用建立空目录使用同步功能,删除对应目录里面的全部文件.--//我记忆里以前测试效率不错,今天做具体探究.1.建立测试环境:$mo......
  • httpclient跳过SSL证书验证的写法
    最近在请求https接口的时候,发生了异常:sun.security.validator.ValidatorException:PKIXpathbuildingfailed:sun.security.provider.certpath.SuncertPathBuilderException:unabletofindvalidcertificationpathtorequestedtarget无法找到到请求目标的有效证书路......
  • datax采集txt文件数据到hive
    1、提前创建hive表结构DROPTABLEIFEXISTSods.ods_log_1diu;CREATETABLEIFNOTEXISTSods.ods_log_1diu(SI_NOSTRING,--varchar(10)notnull,主键SEND_TABLESTRING,--varchar(30)notnull,主键SEQSTRING,--varchar(11)notnull,主......
  • 去除数字末尾0正则写法
    letnums=['12.00','12.001','12.100','12.350','12.45'];console.log('nums:',nums);nums.forEach(t=>{console.log('num:',trimZero(t))})functiontrimZero(num){/......
  • fileinput:一个txt文件的Python库
    文件处理和输入流时,Python中的fileinput模块是一个非常有用的工具。fileinput模块允许迭代处理多个文件,同时还可以处理标准输入流。以下是Python中fileinput模块的五个常见用法。1.逐行迭代文件fileinput模块可以用于逐行迭代处理文件中的内容。importfileinputforlinei......
  • MATLAB的SAVE命令动态批量保存TXT文件
    使用save();fori=1:6str=[num2str(i),’.txt’];m=[12;34];save(str,’m’,’-ascii’);%注意m的单引号,一定记得加上,否则出错end 将会得到1.txt,2.txt,3.txt,4.txt,5.txt,6.txt.(注意上段代码只是实例,不可在matlab中直接运行,因为输入可能夹杂中文符号,可能出错,最......
  • 一键生成requirements.txt
    pipfreeze>requirements.txt想把requirements.txt放在哪里就在编译器中进入那个地址例如我想放在根目录下(目前来说requirements.txt都是放在根目录下)   回车后一键生成所有项目中的依赖,别人后续在对你的项目进行操作时,一键安装依赖一键安装命令pipinstall-rrequi......
  • 【Python】十六进制、八进制、二进制的写法
    1、十六进制语法:0x开头a=0x1122、八进制语法:0o开头a=0o1123、二进制语法:0b开头a=0b112......