首页 > 其他分享 >正则表达式

正则表达式

时间:2023-10-02 10:11:43浏览次数:44  
标签:regex 字符 匹配 正则表达式 pattern 字符串

一、正则表达式的应用领域

1. 文本搜索和替换

  在文本编辑器、编程语言或命令行中,我们经常需要进行字符串匹配和替换操作。使用正则表达式,我们可以快速地找到符合特定模式的字符串,并进行相应的替换。例如,在文本编辑器中使用正则表达式查找所有的电子邮件地址,并将其替换为其他内容。

2. 表单验证

  在Web开发中,我们经常需要验证用户输入的数据是否符合特定的格式要求,如电子邮件地址、手机号码等。使用正则表达式,我们可以轻松实现这些验证规则,确保用户输入的数据符合我们的要求。

3. 数据提取和分析

  正则表达式可以从文本中提取特定信息,如抓取网页中的链接或提取日志文件中的关键信息。此外,在数据分析中,正则表达式也可以用于从原始数据中提取有用的信息,如从日志文件中提取错误信息等。

4. 数据清洗和处理

  在处理大量文本数据时,我们经常需要对数据进行筛选、过滤和清理。使用正则表达式,我们可以轻松地删除无关内容、替换错误数据或者格式化文本等。

5. URL路由和路由匹配

  在Web开发中,我们可以使用正则表达式来定义URL路由规则和进行路由匹配。例如,使用正则表达式匹配不同的URL路径,并将请求转发给相应的处理程序。

二、正则表达式的基本语法

1. 字符匹配

使用普通字符直接匹配,例如匹配字符串 "hello"。

示例代码:

// 匹配字符串 "hello"
regex pattern = regex("hello");
bool isMatch = regex_match("hello world", pattern);

2. 元字符和字符类

使用元字符(如\d、\w、\s等)和字符类(如[]、[^]等)匹配不同类型的字符。例如,使用\d匹配数字,使用[a-z]匹配小写字母。

示例代码:

// 匹配一个数字
regex pattern = regex("\\d");
bool isMatch = regex_match("123", pattern);
 
// 匹配一个字母或数字
regex pattern = regex("[a-zA-Z0-9]");
bool isMatch = regex_match("A", pattern);

3. 量词和边界

使用量词(如*、+、?等)和边界(如^、等)控制字符出现次数和位置。例如,使用∗匹配重复字符,使用和匹配字符串的开头和结尾。

示例代码:

// 匹配一个或多个数字
regex pattern = regex("\\d+");
bool isMatch = regex_match("123", pattern);
 
// 匹配以 "hello" 开头的字符串
regex pattern = regex("^hello");
bool isMatch = regex_match("hello world", pattern);

4. 转义字符

使用反斜杠\来转义特殊字符,例如匹配正则表达式中的元字符本身。例如,使用.匹配实际的句号字符。

示例代码:

// 匹配包含 "." 的字符串
regex pattern = regex("\\.");
bool isMatch = regex_match("example.com", pattern);

三、常见正则表达式示例

这里有一些常见的正则表达式示例:

1. 邮箱验证

以下正则表达式可以用来验证一个字符串是否符合邮箱的格式:

^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

  这个正则表达式会匹配以一个或多个字母数字字符(包括一些特殊字符,如点、百分号等)开始,然后是“@”符号,接着是另一个或多个字母数字字符(包括一些特殊字符,如点、减号等),最后是点号和一个或多个字母字符的字符串。

2. 手机号码提取

以下正则表达式可以用来从文本中提取手机号码:

1[3456789]\d{9}

  这个正则表达式会匹配以数字1开始,第二位为3、4、5、6、7、8、9中的一个数字,然后是9个数字的字符串。例如,它会匹配13812345678这样的手机号码。

3. URL路由匹配

以下正则表达式可以用来匹配URL路径:

^/api/(\w+)/(\w+)$

  这个正则表达式会匹配以“/api/”开始,然后是两个单词字符(\w+),然后是“/”符号,最后是另一个单词字符的字符串。例如,它会匹配“/api/users/123”,其中“users”和“123”是被捕获的组。

标签:regex,字符,匹配,正则表达式,pattern,字符串
From: https://www.cnblogs.com/visioning/p/17739739.html

相关文章

  • 使用正则表达式判断日期字符串格式是否合法遇到的问题(解决)
    引言我们在使用SpringMVC从前端接受传递过来的日期数据时,默认传递过来的数据是String类型,如果我们从前端传递过来的数据格式是yyyy/MM/dd,SpringMVC有内置类型转化器会将String类型自动转化成Date类型。但如果我们从前端传递过来的数据格式是yyyy-MM-dd,SpringMVC的内置转化器就不......
  • C#正则表达式整理备忘
    有一段时间,正则表达式学习很火热很潮流,当时在CSDN一天就能看到好几个正则表达式的帖子,那段时间借助论坛以及WroxPress出版的《C#字符串和正则表达式参考手册》学习了一些基础的知识,同时也为我在CSDN大概赚了1000分,今天想起来,去找《C#字符串和正则表达式参考手册》时,已经不知所踪了......
  • 解读C#正则表达式
    多少年来,许多的编程语言和工具都包含对正则表达式的支持,.NET基础类库中包含有一个名字空间和一系列可以充分发挥规则表达式威力的类,而且它们也都与未来的Perl5中的规则表达式兼容。   此外,regexp类还能够完成一些其他的功能,例如从右至左的结合模式和表达式的编辑......
  • c++正则表达式汇总
    一、校验字符的表达式1汉字:^[\u4e00-\u9fa5]{0,}$2英文和数字:^[A-Za-z0-9]+或[A−Za−z0−9]4,403长度为3-20的所有字符:^.{3,20}$4由26个英文字母组成的字符串:^[A-Za-z]+$5由26个大写英文字母组成的字符串:^[A-Z]+$6由26个小写英文字母组成的字符串:^[a-z]+$7由数字......
  • MySQL正则表达式:模式匹配、中文匹配、替换、提取字符串
    在MySQL中,使用REGEXP或RLIKE操作符进行正则表达式匹配,而使用NOTREGEXP或NOTRLIKE操作符进行不匹配。一些常用的MySQL正则表达式语法:匹配字符:.:匹配任意字符(除了换行符)。[]:匹配方括号中的任意字符。[^]:匹配不在方括号中的任意字符。匹配重复:*:匹配零个或多个前面的字符。+:匹配一个......
  • jmeter正则表达式提取
    参考:https://www.cnblogs.com/uncleyong/p/10779268.html正则表达式提取器:后置处理器-正则表达式提取器Applyto:一般保持默认选择Mainsampleonly,这个用得最多,如果有sub-samples,可以选择第一个选项要检查的响应字段:用得最多的是主体,即header+body,可以从响应头,也可以从响应体......
  • 正则表达式输入中文英文名
    请输入正确的姓名,支持中文或者英文(20位字符内),例如:杨颖/^([\u4e00-\u9fa5]{1,20}|[a-zA-Z\.\s]{1,20})$/如果想要支持名字中间输入·和.这样写,例如:迪丽热巴·迪力木拉提/^[\u4e00-\u9fa5a-zA-Z·.]+$/......
  • 正则表达式
    #按照邮件地址的格式(用户名@域名.后缀)来编写正则表达式#该正则表达式中包含了四个部分:#1.用户名:由一个或多个字母、数字、下划线、点、减号组成,且必须以字母或数字开头(用于描述用户名的部分用小括号括起来)#2.@符号:该部分只包含一个@符号#3.域名:由一个或多个字母、数字......
  • Bash-正则表达式
    一.正则表达式与通配符通配符:用来匹配符合条件的文件名(完全匹配),ls、find、cp这些命令不支持正则表达式,所以只能用通配符正则表达式:用来匹配符合条件的字符串(包含匹配),grep、awk、sed等命令支持正则表达式常用通配符:*(任意字符重复任意多次)、?、[]二.基础正则表达式*(匹配前一个......
  • Python 正则表达式
    正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。re模块使Python语言拥有全部的正则表达式功能。compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象......