首页 > 其他分享 >正则表达式(Regular Expression)

正则表达式(Regular Expression)

时间:2024-08-26 19:54:26浏览次数:16  
标签:Regex 字符 匹配 string 正则表达式 Regular 字符串 Expression

正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),可以用来描述和匹配字符串的特定模式,是一种用于模式匹配和搜索文本的工具,提供了一种灵活且强大的方式来查找、替换、验证和提取文本数据。

概括:正则表达式是制定特定的规则(模式),其中文本(如:字符串)满足了这种规则,表达就匹配了此种正则表达式。

一般用来进行数据校验,数据匹配(爬虫),进而进行数据分析

private void button1_Click(object sender, EventArgs e)
{
    //定义正则表达式对象,有对象才能操作
    //pattern模式
    Regex regex = new Regex("[0-9]+");//查找0-9的数字,+ 是一个量词,表示[0-9]可以出现一次或多次。
    int num = 123;
    //IsMath判断某个字符串是否匹配某个正则表达式,匹配返回true,否则返回false。
    //regex.IsMatch();
    bool result =Regex.IsMatch(num.ToString(), "[0-9]+");//返回true
    MessageBox.Show(result.ToString());

}

c#正则表达式的API

Regex 类

这是正则表达式的主要类,提供编译正则表达式模式、与字符串进行匹配、替换、拆分等操作的方法。

​Regex(string pattern)​ - 构造函数,用于创建一个新的Regex对象,其中 pattern​ 是正则表达式的字符串表示。

​Matches(string input)​ - 返回一个包含所有匹配项的 MatchCollection​。

​Match(string input)​ - 返回输入字符串中的第一个匹配项。

​Replace(string input, string replacement)​ - 替换字符串中所有匹配正则表达式的子串。

​Split(string input)​ - 根据正则表达式指定的模式拆分字符串。

Match 类表示正则表达式引擎找到的单个匹配项。

​Groups​ - 包含所有捕获组的集合。

​Success​ - 指示匹配是否成功的布尔值。

​Value​ - 匹配的字符串。

MatchCollection 类 - 表示所有匹配项的集合。
Group 类表示正则表达式中的一个捕获组。
Capture 类

表示捕获组中的单个捕获。

RegexOptions

枚举 - 定义了一组选项,可以影响正则表达式的编译和行为。

​Compiled​ - 指示应编译该正则表达式模式以便更快地执行。

​IgnoreCase​ - 指示应忽略模式和输入中的字母大小写差异。

​Multiline​ - 指示.​ 特殊字符应该匹配每一行的开始和结束,而不仅仅是整个字符串的开始和结束。

使用 Regex.Matches​ 方法来查找所有连续的数字,并打印它们。每个 Match​ 对象都包含了一个匹配的数字。

using System;
using System.Text.RegularExpressions;
using System.Windows.Forms;

namespace 正则表达式
{
    internal static class Program
    {
        /// <summary>
        /// 应用程序的主入口点。
        /// </summary>
        [STAThread]
        static void Main()
        {
            string pattern = "[0-9]+";
            string input = "有123个苹果, 456 个橙子, 和789根香蕉";
            MatchCollection matches = Regex.Matches(input, pattern);

            foreach (Match match in matches)
            {
                Console.WriteLine("数量: " + match.Value);
            }
        }
    }
}

字符转义

正则表达式中的反斜杠字符(\)指示其后跟的字符是特殊字符,或应按原义解释该字符。

(此表来自菜鸟教程)

转义字符描述模式匹配
\a与报警 (bell) 符 \u0007 匹配。\a"Warning!" + '\u0007' 中的 "\u0007"
\b在字符类中,与退格键 \u0008 匹配。[\b]{3,}"\b\b\b\b" 中的 "\b\b\b\b"
\t与制表符 \u0009 匹配。(\w+)\t"Name\tAddr\t" 中的 "Name\t" 和 "Addr\t"
\r与回车符 \u000D 匹配。(\r 与换行符 \n 不是等效的。)\r\n(\w+)"\r\nHello\nWorld." 中的 "\r\nHello"
\v与垂直制表符 \u000B 匹配。[\v]{2,}"\v\v\v" 中的 "\v\v\v"
\f与换页符 \u000C 匹配。[\f]{2,}"\f\f\f" 中的 "\f\f\f"
\n与换行符 \u000A 匹配。\r\n(\w+)"\r\nHello\nWorld." 中的 "\r\nHello"
\e与转义符 \u001B 匹配。\e"\x001B" 中的 "\x001B"
\ nnn使用八进制表示形式指定一个字符(nnn 由二到三位数字组成)。\w\040\w"a bc d" 中的 "a b" 和 "c d"
\x nn使用十六进制表示形式指定字符(nn 恰好由两位数字组成)。\w\x20\w"a bc d" 中的 "a b" 和 "c d"
\c X \c x匹配 X 或 x 指定的 ASCII 控件字符,其中 X 或 x 是控件字符的字母。\cC"\x0003" 中的 "\x0003" (Ctrl-C)
\u nnnn使用十六进制表示形式匹配一个 Unicode 字符(由 nnnn 表示的四位数)。\w\u0020\w"a bc d" 中的 "a b" 和 "c d"
\在后面带有不识别的转义字符时,与该字符匹配。\d+[\+-x\*]\d+\d+[\+-x\*\d+"(2+2) * 3*9" 中的 "2+2" 和 "3*9"

定位点

定位点或原子零宽度断言会使匹配成功或失败,具体取决于字符串中的当前位置,但它们不会使引擎在字符串中前进或使用字符。

(此表来自菜鸟教程)

断言描述模式匹配
^匹配必须从字符串或一行的开头开始。^\d{3}"567-777-" 中的 "567"
$匹配必须出现在字符串的末尾或出现在行或字符串末尾的 \n 之前。-\d{4}$"8-12-2012" 中的 "-2012"
\A匹配必须出现在字符串的开头。\A\w{4}"Code-007-" 中的 "Code"
\Z匹配必须出现在字符串的末尾或出现在字符串末尾的 \n 之前。-\d{3}\Z"Bond-901-007" 中的 "-007"
\z匹配必须出现在字符串的末尾。-\d{3}\z"-901-333" 中的 "-333"
\G匹配必须出现在上一个匹配结束的地方。\G\(\d\)"(1)(3)(5)[7](9)" 中的 "(1)"、 "(3)" 和 "(5)"
\b匹配一个单词边界,也就是指单词和空格间的位置。er\b匹配"never"中的"er",但不能匹配"verb"中的"er"。
\B匹配非单词边界。er\B匹配"verb"中的"er",但不能匹配"never"中的"er"。

具体查看C# 正则表达式 | 菜鸟教程 (runoob.com)

标签:Regex,字符,匹配,string,正则表达式,Regular,字符串,Expression
From: https://blog.csdn.net/2302_77639120/article/details/141571900

相关文章

  • 【8.2 python中的使用re模块实现正则表达式操作】
    python中的使用re模块实现正则表达式操作Python中的re模块提供了对正则表达式的支持。正则表达式(RegularExpression,简称regex或regexp)是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为"元字符")。正则表达式使用单个字符串来描述、匹配一系列符合某个句法......
  • MybatisPlus Caused by: org.apache.ibatis.builder.BuilderException: Error evalua
    报错信息:org.mybatis.spring.MyBatisSystemException:nullatorg.mybatis.spring.MyBatisExceptionTranslator.translateExceptionIfPossible(MyBatisExceptionTranslator.java:97)atorg.mybatis.spring.SqlSessionTemplate$SqlSessionInterceptor.invoke(SqlSessi......
  • Python正则表达式提取车牌号
    在Python中使用正则表达式(RegularExpressions)来提取车牌号是一个常见的任务,尤其是在处理车辆信息或进行图像识别后的文本处理时。中国的车牌号格式多种多样,但通常包含省份简称、英文字母和数字。以下是一个使用Python正则表达式来提取常见中国车牌号(包括新能源车牌)的示例代码。1......
  • python怎么用正则表达式筛选网页内容
    一、正则表达式简述:什么是正则表达式?正则表达式就是可以匹配文本片段的模式,最简单的正则表达式就是一个字符串,用于在文本中匹配到此字符串自身。二、常用正则表达式:设计正则表达式的时候有几个注意点如下:a.特殊符号需要加转移符:如要匹配'china.com',则正则表达式格式应为'......
  • jmeter中提取token值(正则表达式,)
    jmeter中提取token值(正则表达式)一、接口前准备案例链接:http://shop.duoceshi.com/uiid接口:http://manage.duoceshi.com/auth/codeget请求登录接口:http://manage.duoceshi.com/auth/loginPOST请求请求参数:{"username":"admin","password":"tlHpvw2zZLz1xL3+LF......
  • 正则表达式可以匹配正确的字符串但是不能匹配小美的心
    高情商:省流极简版低情商:怎么连个例子都没有正则表达式常用元字符:. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线\s 四配任意的空白符\d 匹配数字\n 匹配一个换行符\t 匹配一个制表符^ 匹配字符串的开始$ 匹配字符串的结......
  • Python 正则表达式详解 带例题演示
    Python正则表达式正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。re模块使Python语言拥有全部的正则表达式功能。compile函数根据一个模式字符串和可选的标志......
  • 正则表达式入门:Python ‘ re ‘ 模块详解
    正则表达式(RegularExpression,简称re)是一种强大而灵活的工具,广泛用于字符串匹配、替换和分割等操作,尤其在处理网页爬虫数据时非常有用。Python提供了"re" 模块来支持正则表达式的使用,本文将结合常见的用法和示例,带你快速入门。正则表达式的常用方法匹配字符串1.'sea......
  • 正则表达式
    正则表达式Java正则表达式是Java语言中用于匹配字符串中字符组合的模式。Java提供了java.util.regex包,其中包含了用于正则表达式操作的主要类:Pattern:表示正则表达式的编译表示形式。Pattern类是不可变的,所以可以安全地共享。Matcher:是正则表达式引擎的结果,用于与输入字......
  • JavaScript-正则表达式入门指南-全-
    JavaScript正则表达式入门指南(全)原文:IntroducingRegularExpressions协议:CCBY-NC-SA4.0一、正则表达式简介为了开始介绍正则表达式,我将从一个例子开始。这是一个你已经经历了几百次的问题。当您在线输入客户数据时,许多web表单会要求您提供电子邮件地址。为了避免输入......