正则表达式:规则表达式,文本排列规则的表达式//独立的编程语言
//把自己想输出的统一成一套规则
1.【元字符】//通配符. 字符集「」
re.findall(正则模式,文本)基于正则模式查询所有匹配的文本内容
ret1 = refindall // 通配符. 除换行符以外都能匹配的
字符集 ^ //取反
/d 匹配成功就叭叭
/d+ 重复 + 1多次,更具左边#默认贪婪匹配
取消贪婪匹配:/d+?//+?
*?
\w{6} / /输出6位以内的
^\W+ //从第一位开始是否有连续的
\w+$ //后面开始是否有字符
//re.findall("abc","abc,abcc,abe,ab") //abc abcc ab ab
()具备模式捕获的能力,也就是优先提取数据的能力,通过(?:)可以取消模式捕获
("\w+@(?:163|qq).com")//前面重复才取消贪婪
(,\w{5})//剔除不需要的因数
2.【常用正则表达式】
3.【re模块的方法】
4【正则进阶】
绝对贪婪:ret = re.findall("<.+>".text)
*可以匹配
ret = re.findall("<. *>", text re.S) //识别换行符