今天在 PHP 中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则:
(.*)
结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,.
点符号匹配的是除了换行符 \n
以外的所有字符。同时手册上还有一句话:要匹配包括 \n
在内的任何字符,请使用像 [.\n]
的模式。于是我将正则表达式的匹配规则修改如下:
([.\n]*)
当然如果是在 PHP 程序中直接写到话,需要改为 ([.\\n]*)
, 结果再次运行程序,发现什么内容也取不到了。我百思不得其解,又将其修改为如下规则:
([.|\n]*)([\n.]*)
结果还是不行,什么内容都取不到。看来点符号和换行符卯上劲了,然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则:
([\s\S]*)
同时也可以用 ([\d\D]*)
、 ([\w\W]*)
来表示。