分组
# 分组: () --> result.group(1) 获取分组中匹配内容
# 在分组的时候还可以结合 | :
result = re.match(r"(\d{3}|\d{4})-(\d{8})$", phone)
print(result)
# 不需要引用分组的内容:
result = re.match(r"<[0-9a-zA-Z]+>(.+)</[0-9a-zA-Z]+>+", msg)
print(result)
print(result.group(1))
# 引用分组匹配内容:
1. number \number 引用第number组的数据
msg = "<html><h1>abc</h1></html>"
result=re.match(r'<([0-9a-zA-Z]+)><([0-9a-zA-Z]+)>(.+)</\2></\1>$',msg)
print(result)
2. 起名的方式:(?P<名字>正则) (?P=名字)
msg = "<html><h1>abc</h1></html>"
result = re.match(r'<(?P<name1>\w+)><(?P<name2>\w+)>(.+)</(?P=name2)></(?P=name1)>', msg)
print(result)
re模块:
match: 从开头匹配一次
search: 只匹配一次
findall: 查找所有
sub(正则表达式,新内容,string): 替换
split: result = re.split(r'[,:]', "python:99,java:100"),在字符串中搜索如果遇到 , 或者 : 就分割
将分割的内容都保存到列表中
标签:03,标签,re,分组,result,print,match,msg
From: https://www.cnblogs.com/kh-1314/p/16616113.html