正则表达式
概述
正则表达式是一种用于匹配和处理文本模式的工具。它可以在文本中搜索、替换、分割和提取符合特定模式的字符串。
使用正则表达式时,您可以根据需要构建适合的模式,然后将模式应用到目标文本中进行匹配和处理。正则表达式在文本处理、数据验证、文本分析等方面有着广泛的应用。
常用的工具
很多工具都自带正则表达式搜索,比如notepad++,vscode,如图所示,所有学习正则表达式很有用
另外python也常用到
常用元字符和符号
这里列举常用的,没有列举以后用到的时候也会汇总这里
.
:匹配任意单个字符,除了换行符。
*
:匹配前面的字符零次或多次。
+
:匹配前面的字符一次或多次。
?
:匹配前面的字符零次或一次。
^
:匹配字符串的开头。
$
:匹配字符串的结尾。
\d
:匹配任意数字。
\w
:匹配任意字母、数字或下划线。
\s
:匹配任意空白字符(空格、制表符、换行符等)。
[...]
:匹配方括号中列举的任意一个字符。
[^...]
:匹配除了方括号中列举的字符以外的任意一个字符。
( )
:捕获分组,用于提取匹配的子字符串或应用其他操作。
常用的操作
替换换行
正则可以识别换行符,然后就可以进行操作。如图
识别字符段
\{[^}]*width="([^}]*)"[^}]*\}
这个正则表达式的具体含义如下:
\{
:匹配左大括号{
。[^}]*
:匹配除右大括号}
之外的任意字符。width=
:匹配width=
字符串。([^}]*)
:使用括号捕获分组,匹配除右大括号}
之外的任意字符,即width
的值。[^}]*
:匹配除右大括号}
之外的任意字符。\}
:匹配右大括号}
。