一.NginxRewrite概述
现在Nginx已经成为很多公司作为前端反向代理服务器的首选,在实际工作中往往会遇到很多跳转(重写URL)的需求。比如:更换域名后需要保持旧的域名能跳转到新的域名上、某网页发生改变需要跳转到新的页面、网站防盗链等等需求。如果在后端使用的Apache服务器,虽然也能做跳转,规则库也很强大,但是用Nginx跳转效率会更高。
1.Rewrite跳转场景
Rewrite跳转场景主要包括:
- 可以调整用户浏览的URL,看起来更规范,合乎开发及产品人员的需求。
- 为了让搜索引擎搜录网站内容及用户体验更好,企业会将动态URL地址伪装成静态地址提供服务。
- 网址换新域名后,让旧的访问跳转到新的域名上,例如:访问京东的360buy.com会跳转到jd.com。
- 根据特殊变量,目录,客户端的信息进行URL调整。
2.Rewrite跳转实现
Nginx是通过ngx_http_rewrite_module模块支持url重写、支持if条件判断,但不支持else。另外该模块需要PCRE支持,应在编译Nginx时指定PCRE支持,默认已经安装。根据相关变量重定向和选择不同的配置,从一个location跳转到另一个location,不过这样的循环最多可以执行10次,超过后Nginx将返回500错误。同时,重写模块包含set指令,来创建新的变量并设其值,这在有些情景下非常有用的,如记录条件标识、传递参数到其他location、记录做了什么等等。rewrite功能就是使用Nginx提供的全局变量或自己设置的变量,结合正则表达式和标志位实现url重写以及重定向。
3.Rewrite实际应用场景
在实际工作的应用中,Nginx跳转需求有三种方式可实现。可以直接用rewrite进行匹配跳转,也可以使用if匹配全局变量后跳转。另外,还可以使用location匹配再跳转。所以rewrite只能放在server{}、f{}、location{}配置段中。例如location只能对域名后边的除去传递的参数外的字符串起作用, 例如http://www.kgc.com/index.php?id=1只对/index.php重写。如果想对域名或参数字符串起作用,可以使用if全局变量匹配,也可以使用proxy_pass反向代理。
4.Nginx正则表达式
常见的正则表达式元字符 | |
字符 | 描述 |
^ | 匹配输入字符串的起始位置 |
$ | 匹配输入字符串的结束位置 |
* | 匹配前面的字符零次或多次 |
+ | 匹配前面的字符一次或多次 |
? | 匹配前面的字符零次或一次 |
. | 匹配除“\n”之外的任何单个字符,若要匹配包括“\n”在内的任意字符,使用“[.\n]”之类的模式 |
\ | 将后面接着的字符标记为一个特殊字符或一个原义字符或向后引用。如“\n”匹配一个换行符,而“\$”则匹配“$” |
\d | 匹配纯数字 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
[c] | 匹配单个字符c |
[a-z] | 匹配a-z小写字母的任意一个 |
[a-zA-Z] | 匹配a-z小写字母后A-Z大写字母的任意一个 |
二.Nginx Rewrite基本操作
1.Rewrite语法
Rewrite命令的语法如下,其中regex表示正则匹配规则,replacement表示跳转后的内容,flag表示rewrite支持的flag标记。
rewrite<regex><replacement>[flag];
flag标记说明
- last:相当于Apache的[L]标记,表示完成rewrite。
- break:本条规则匹配完成即终止,不再匹配后面的任何规则
- redirect:返回302临时重定向,浏览器地址会显示跳转后的URL地址,爬虫不会更新url(因为是临时)
- permanent:返回301永久重定向,浏览器地址栏会显示跳转后的URL地址,爬虫更新url
如果后面不跟flag标记,那么默认是302临时重定向。在实际工作场景中,还有另一种return指定,因为301和302不能简单的只返回状态码,还必须有重定向的URL,这就是 return指令无法返回301和302的原因。
last和break区别是:last一般写在server和if中,而break一般使用在location中。last不终止重写后的url匹配,即新的url会再从server走一遍匹配流程,而break终止重写后的匹配。
2.Location分类
location大致可以分为三类,语法如下:
location = patt{} [精准匹配]
location patt{} [一般匹配]
location~patt [正则匹配]
精准匹配和一般匹配不需要做详细的说明,主要是正则匹配。下面就是正则匹配的一些表达式,需要多加牢记。
- ~ :表示执行一个正则匹配,区分大小写
- ~*:表示执行一个正则匹配,不区分大小写
- !~:表示执行一个正则匹配,区分大小写匹配
- !~*:表示执行一个正则匹配,不区分大小写不匹配
- ^~:表示普通字符匹配,使用前缀匹配,如果匹配成功,则不再匹配其他loaction
- =:进行普通字符精确匹配,也就是完全匹配
- @:它定义一个命名的location,使用在内部定向时,例如error_page,try_files
3.Location优先级
在Nginx的location配置中location的顺序没有太大关系。匹配优先级和location表达式的类型有关:相同类型的表达式,字符串长的会优先匹配。
以下是按优先级排列说明:
- 等号类型(=)的优先级最高。一旦匹配成功,则不再查找其他匹配项
- ^~类型表达式。一旦匹配成功,则不再查找其他匹配项
- 正则表达式类型(~和~*)的优先级次之
- 常规字符串匹配类型。按前缀匹配
- 通用匹配(/),如果没有其它匹配,任何请求都会匹配到
从功能看rewrite和location似乎有点像,都能实现跳转,主要区别在于rewrite是在同域名内更改获取资源的路径,而location是对一类路径做控制访问或反向代理,还可以proxy_pass到其他机器。很多情况下rewrite也会写在location里,它们的执行顺序如下:
(1)执行server块里面的rewrite指令。
(2)执行location匹配。
(3)执行选定的location中的rewrite指令
标签:匹配,rewrite,Rewrite,Nginx,location,跳转 From: https://blog.csdn.net/henanxiaoman/article/details/139799021