首页 > 其他分享 >今日总结

今日总结

时间:2023-06-10 10:55:41浏览次数:33  
标签:总结 www 匹配 python re org 字符串 今日

什么是正则表达式

正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’ 可以匹配字符串’python’ 。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。

 

** 通配符

正则表达式可以匹配多于一个的字符串,你可以使用一些特殊字符创建这类模式。比如点号(.)可以匹配任何字符。在我们用window 搜索时用问号(?)匹配任意一位字符,作用是一样的。那么这类符号就叫 通配符。

 

** 对特殊字符进行转义

通过上面的方法,假如我们要匹配“python.org”,直接用用‘python.org’可以么?这么做可以,但这样也会匹配“pythonzorg”,这可不是所期望的结果。

好吧!我们需要对它进行转义,可以在它前面加上发斜线。因此,本例中可以使用“python\\.org”,这样就只会匹配“python.org”了。

 

** 字符集

我们可以使用中括号([ ])括住字符串来创建字符集。可以使用范围,比如‘[a-z]’能够匹配a到z的任意一个字符,还可以通过一个接一个的方式将范围联合起来使用,比如‘[a-zA-Z0-9]’能够匹配任意大小写字母和数字。

反转字符集,可以在开头使用^字符,比如‘[^abc]’可以匹配任何除了a、b、c之外的字符。

 

** 选择符

有时候只想匹配字符串’python’ 和 ’perl’  ,可以使用选择项的特殊字符:管道符号(|) 。因此, 所需模式可以写成’python|perl’ 。

 

** 子模式

但是,有些时候不需要对整个模式使用选择符---只是模式的一部分。这时可以使用圆括号起需要的部分,或称子模式。 前例可以写成 ‘p(ython | erl)’

 

** 可选项

在子模式后面加上问号,它就变成了可选项。它可能出现在匹配字符串,但并非必须的。

r’(heep://)?(www\.)?python\.org’

只能匹配下列字符:

‘http://www.python.org’

‘http://python.org’

‘www.python.org’

‘python.org’

 

** 重复子模式

(pattern)* : 允许模式重复0次或多次

(pattern)+ : 允许模式重复1次或多次

(pattern){m,n} : 允许模式重复m~ n 次

例如:

r’w * \.python\.org’  匹配 ‘www.python.org’ 、’.python.org’ 、’wwwwwww.python.org’

r’w + \.python\.org’  匹配 ‘w.python.org’ ;但不能匹配 ’.python.org’ 

r’w {3,4}\.python\.org’  只能匹配‘www.python.org’ 和‘wwww.python.org’ 

 

re模块的内容

 

re模块中一些重要的函数:

  re.compile 将正则表达式转换为模式对象,可以实现更有效率的匹配。

  re.search 会在给定字符串中寻找第一个匹配给正则表式的子字符串。找到函数返回MatchObject(值为True),否则返回None(值为False) 。因为返回值的性质,所以该函数可以用在条件语句中:

if re.serch(pat, string):

print ‘found it !’

 

  re.math 会在给定字符串的开头匹配正则表达式。因此,re.math(‘p’ , ‘python’)返回真,re.math(‘p’ , ‘www.python’) 则返回假。

  re.split 会根据模式的匹配项来分割字符串。

>>> import re
>>> some_text = 'alpha , beta ,,,gamma delta '
>>> re.split('[,]+',some_text)
['alpha ', ' beta ', 'gamma delta ']

 

  re. findall以列表形式返回给定模式的所有匹配项。比如,要在字符串中查找所有单词,可以像下面这么做:

>>> import re
>>> pat = '[a-zA-Z]+'
>>> text = '"Hm...err -- are you sure?" he said, sounding insecure.'
>>> re.findall(pat,text)
['Hm', 'err', 'are', 'you', 'sure', 'he', 'said', 'sounding', 'insecure']

 

  re.sub的作用在于:使用给定的替换内容将匹配模式的子符串(最左端并且重叠子字符串)替换掉。

>>> import re
>>> pat = '{name}'
>>> text = 'Dear {name}...'
>>> re.sub(pat, 'Mr. Gumby',text)
'Dear Mr. Gumby...'

 

  re.escape 函数,可以对字符串中所有可能被解释为正则运算符的字符进行转义的应用函数。

如果字符串很长且包含很多特殊字符,而你又不想输入一大堆反斜线,可以使用这个函数:

>>> re.escape('www.python.org')
'www\\.python\\.org'
>>> re.escape('but where is the ambiguity?')
'but\\ where\\ is\\ the\\ ambiguity\\?'

 

 

 

匹配对象和组

 

简单来说,组就是放置在圆括号里内的子模块,组的序号取决于它左侧的括号数。组0就是整个模块,所以在下面的模式中:

‘There  (was a (wee) (cooper)) who (lived in Fyfe)’

包含组有:

0  There  was a  wee cooper  who  lived in Fyfe

1  was a  wee  cooper

2  wee

3  cooper

4  lived in Fyfe

 

re 匹配对象的重要方法

下面看实例:

复制代码
>>> import re
>>> m = re.match(r'www\.(.*)\..{3}','www.python.org')
>>> m.group()
'www.python.org'
>>> m.group(0)
'www.python.org'
>>> m.group(1)
'python'
>>> m.start(1)
4
>>> m.end(1)
10
>>> m.span(1)
(4, 10)
复制代码

  group方法返回模式中与给定组匹配的字符串,如果没有组号,默认为0 ;如上面:m.group()==m.group(0) ;如果给定一个组号,会返回单个字符串。

  start 方法返回给定组匹配项的开始索引,

  end方法返回给定组匹配项的结束索引加1;

  span以元组(start,end)的形式返回给组的开始和结束位置的索引。

标签:总结,www,匹配,python,re,org,字符串,今日
From: https://www.cnblogs.com/ysl666/p/17470894.html

相关文章

  • 信道容量与香农定理、信源编码、信道编码总结
    1信道容量定义1.1信道容量:信道中平均每个符号所能传递的最大互信息量$I(X;Y)$$C=\mathop{max}\limits_{p(x)}{I(X;Y)}$单位:bit/符号1.2单位时间t内信道容量:$C_t=\frac{C}{t}$单位:bit/s1.3最佳输入概率$p(x)$分布时,传输的信息能达到信道容量1.4信道容量反映信道特性,表示信......
  • 第八周总结
    获取当前时间,用到date函数,但是时间的格式需要提前统一,否则在进行时间运算时会报错。publicList<book>select2(intid){Stringsql="select*fromjieyuewhereidr='"+id+"'";Connectionconnection=DBUtil_reader.getConnection();PreparedStatementst=nul......
  • 第五周总结
    对servlet的用途以及关联页面和dao层有了更清楚的认识,servlet层对于大项目的提高效率有很显著的效果privatevoidselect(HttpServletRequestreq,HttpServletResponseresp)throwsIOException,Exception{req.setCharacterEncoding("utf-8");List<studentid>list=newAr......
  • 每周总结第九周
    本周进行了团队作业的二阶段任务:任务很多,要完成对于一阶段的后端的功能实现:展示sevlet代码添加packagecom.itheima.web.servlet;importcom.alibaba.fastjson.JSON;importcom.itheima.pojo.Brand;importcom.itheima.service.BrandService;importcom.itheima.service......
  • 第六周总结
    今天写了第二个自测题,其中遇到了错误拦截的问题,对结构流程还是不够熟练publicbooleanInsert(studentstu){booleanf=false;Connectionconnection=DBUtil.getConnection();PreparedStatementpreparedStatement=null;try{Stringsql="insertintostudent(id,name,......
  • 第一周总结
    本周为软件工程开课第一周,学习mvc框架做信息征集系统,收获很大某个文本文件中存储了60W条记录,以\r\n作为分隔符,现在需要从文本中一次性取出所有值并存放到一个string[]数组中。StreamReadersr=newStreamReader(strFilePath,System.Text.UnicodeEncoding.GetEncoding("utf-......
  • 第二周总结
    本周进行课程介绍,完成代码--返回一个整数数组中最大子数组的和(一)packageyiweishuzu;importjava.util.Scanner;/***贪心算法*@authorLenovo**/publicclassshuzu_3{privatestaticScannerscan;publicstaticvoidmain(String[]args){//确定......
  • 第三周总结
    完成代码--返回一个整数数组中最大子数组的和(二)这次,在上次的情况下增加了一些新的要求。· 要求数组从文件读取。·  如果输入的数组很大, 并且有很多大的数字, 就会产生比较大的结果(考虑一下数的溢出),请保证你的程序能正常输出。好,下面就是对代码的构......
  • 第四周总结
    完成代码--返回一个整数数组中最大子数组的和(三)--环形这次,在上次的要求中又多了一个条件——要求这个数组是环形的。 在上次的基础上,将这个代码进行改进,得到以下结果。下面把代码贴出来。packageyiweishuzu;importjava.util.Scanner;publicclassshuzu_3{priv......
  • 每周总结第八周
    本周进行了期末一些学科的复习。如数据库,数学建模。学习了数据库基础知识,sql语句的基础运行,授权和权限管理,x锁和s锁等等数据库知识。数学建模完成了对初等数学建模,线性规划建模,动态规划建模以及概率建模进行了复习。......