正则表达式特性
字符匹配
- 普通字符:匹配字面值。
- 元字符:元字符具有特殊的含义,例如 \d 匹配任意数字字符,\w 匹配任意字母数字字符,. 匹配任意字符(除了换行符)等。
量词
*:匹配前面的模式零次或多次,例如 aa*
+:匹配前面的模式一次或多次, 例如 aa+
?:匹配前面的模式零次或一次, 例如 aa?
{n}:匹配前面的模式恰好 n 次, 例如 aa{2}
{n,}:匹配前面的模式至少 n 次, 例如aa{2,}
{n,m}:匹配前面的模式至少 n 次且不超过 m 次, 例如 aa{2,3}
字符类
[ ]:匹配括号内的任意字符,例如[bac],匹配出所有字符"b"、"a"、"c",不分顺序。
[^ ]:匹配除了括号内的字符以外的任意字符。例如,[^bac] 匹配除了字符 "a"、"b" 或 "c" 以外的任意字符。
边界匹配
^:匹配字符串的开头,例如 ^a
$:匹配字符串的结尾,例如 a$
\b:匹配单词边界, 例如world \b
\B:匹配非单词边界,例如world\B
分组和捕获
( ):用于分组和捕获子表达式。
(?: ):用于分组但不捕获子表达式。
特殊字符
\:转义字符,用于匹配特殊字符本身。
.:匹配任意字符(除了换行符)。
|:用于指定多个模式的选择。