标签：匹配 python compile re 字符串正则表达式 findall

Python 正则表达式

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。
在python中提供了一个使用正则的模块re。
re模块使 Python 语言拥有全部的正则表达式功能。

re.compile

compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 findall 使用。
compile语法格式：
re.compile(pattern[, flags])

pattern: 一个字符串形式的正则表达式
flags: 可选，表示匹配模式，比如忽略大小写，多行模式等，具体参数为：
1. re.I 忽略大小写
2. re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
3. re.M 多行模式
4. re.S 即为 . 并且包括换行符在内的任意字符（. 不包括换行符）
5. re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
6. re.X 为了增加可读性，忽略空格和 # 后面的注释

例如：

import re
pattern = re.compile(r'\d+')  # 返回一个正则表达式对象，用于匹配至少一个数字
result1  = pattern.findall('abcd123efg')  # 使用上面得到的正则表达对象在字符串中去匹配
print(result1)

输出：['123']

findall

在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果有多个匹配模式，则返回元组列表，如果没有找到匹配的，则返回空列表。
findall语法格式：
pattern.findall(目标字符串,指定匹配的起始位置[可为空，默认为0],指定字符串的结束位置[可为空，默认为字符串长度])

pattern: 一个字符串形式的正则表达式

示例如compile中

re.finditer

和 findall 类似，在字符串中找到正则表达式所匹配的所有子串，并把它们作为一个迭代器返回。
语法：
re.finditer(pattern, string, flags=0)

这个就不多解释了

正则表达式对象

re.RegexObject

re.compile() 返回 RegexObject 对象。

正则表达式模式

模式字符串使用特殊的语法来表示一个正则表达式：

字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。

多数字母和数字前加一个反斜杠时会拥有不同的含义。

标点符号只有被转义时才匹配自身，否则它们表示特殊的含义。

反斜杠本身需要使用反斜杠转义。

由于正则表达式通常都包含反斜杠，所以你最好使用原始字符串来表示它们。模式元素(如 r'\t'，等价于 '\t')匹配相应的特殊字符。
模式示例：

模式	描述
^	匹配字符串的开头
$	匹配字符串的结尾
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符
[...]	用来表示一组字符,单独列出：[amk] 匹配 'a'，'m'或'k'
[^...]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符
(re)	对正则表达式分组并记住匹配文本
re+	匹配一个或者多个的表达式，如 \d只匹配一个数字，\d+则匹配多个数字
re{n}	精确匹配 n 个前面表达式。例如， o{2} 不能匹配 "Bob" 中的 "o"，但是能匹配 "food" 中的两个 o
re{n,}	匹配 n 个前面表达式。例如， o{2,} 不能匹配"Bob"中的"o"，但能匹配 "foooood"中的所有 o。"o{1,}" 等价于 "o+"。"o{0,}" 则等价于 "o*"
re*	匹配0个或者多个的表达式
a\|b	匹配a或b
\w	匹配字母数字及下划线
\W	匹配非字母数字及下划线
\s	匹配任意空白字符，等价于 [ \t\n\r\f]。
\S	匹配任意非空字符
\d	匹配任意数字，等价于[0-9]
\b	匹配一个单词边界，也就是指单词和空格间的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'
\B	匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'

正则表达实例

import re

txt = "hello world!!!666python?!*Pythonabc"

pattern1 = re.compile('[Pp]ython\w+') # 匹配"Python"或者"python" 及后面的数字字母

pattern2 = re.compile('(.*)!!!(\d+)') # 匹配'!!!'前的所有和!!!后的数字

result1 = pattern1.findall(txt)
result2 = pattern2.findall(txt)

print(result1)
print(result2)

输出：
['Pythonabc']
[('hello world', '666')]

除此之外还有re.search方法和re.match方法
简单示例：
re.match('/d+', 'abc123hello')
re.search('/d+', 'abc123hello')
括号中前面为匹配规则，后面为目标字符串
re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match() 就返回 none。
re.search 扫描整个字符串并返回第一个成功的匹配。

标签：匹配,python,compile,re,字符串,正则表达式,findall
From： https://www.cnblogs.com/li-xun/p/16704001.html

python re包正则表达式

Python 正则表达式

re.compile

findall

re.finditer

正则表达式对象

re.RegexObject

正则表达式模式

正则表达实例

相关文章

赞助商

阅读排行

python re包 正则表达式

Python 正则表达式

re.compile

findall

re.finditer

正则表达式对象

re.RegexObject

正则表达式模式

正则表达实例

相关文章

赞助商

阅读排行

python re包正则表达式