首页 > 编程语言 >JavaScript 正则表达式

JavaScript 正则表达式

时间:2023-05-09 16:56:02浏览次数:38  
标签:字符 匹配 正则表达式 JavaScript let test match

正则表达式 Regular Expression

在编程语言中,正则表达式用于匹配指定的字符串。

如果想要在字符串 The dog chased the cat 中匹配到 the 这个单词,可以使用如下正则表达式:/the/注意,正则表达式中不需要引号。

使用测试方法 Test Method

JavaScript 中有多种使用正则表达式的方法。 测试正则表达式的一种方法是使用 .test() 方法。 .test() 方法会把编写的正则表达式和字符串(即括号内的内容)匹配,如果成功匹配到字符,则返回 true,反之,返回 false

let testStr = "freeCodeCamp";
let testRegex = /Code/;
testRegex.test(testStr) // true

多种模式匹配 Match

使用 alternationOR 操作符搜索多个模式: |。此操作符匹配操作符前面或后面的字符。 例如,如果想匹配 yesno,你需要的正则表达式是 /yes|no/

let petString = "James has a pet cat.";
let petRegex = /dog|cat|bird|fish/; 
let result = petRegex.test(petString); // true

忽略大小写 Ignore Case

有时候,并不关注匹配字母的大小写。

可以使用标志(flag)来匹配这两种情况。忽略大小写的标志——i。 可以通过将它附加到正则表达式之后来使用它。

let myString = "freeCodeCamp";
let fccRegex = /freeCodeCamp/i; 
let result = fccRegex.test(myString); // 匹配 freeCodeCamp 忽略大小写

提取匹配项 Extract

使用 .match() 方法来提取找到的实际匹配项。

可以使用字符串来调用 .match() 方法,并在括号内传入正则表达式。

"Hello, World!".match(/Hello/);
let ourStr = "Regular expressions";
let ourRegex = /expressions/;
ourStr.match(ourRegex);
// 这里第一个 match 将返回 ["Hello"] 第二个将返回 ["expressions"]。

请注意, .match 语法是目前为止一直使用的 .test 方法中的“反向”:

'string'.match(/regex/);
/regex/.test('string');

全局匹配 Global

若要多次搜寻或提取模式匹配,可以使用 g 标志。

let testStr = "Repeat, Repeat, Repeat";
let repeatRegex = /Repeat/g;
testStr.match(repeatRegex); 
// match 返回值 `["Repeat", "Repeat", "Repeat"]`

注意:
在正则表达式上可以有多个标志,比如 /search/gi

用通配符匹配任何内容 Wildcard Period

有时不(或不需要)知道匹配模式中的确切字符。 如果要精确匹配到完整的单词,那出现一个拼写错误就会匹配不到。 幸运的是,可以使用通配符 . 来处理这种情况。

通配符 . 将匹配任何一个字符。 通配符也叫 dotperiod。 可以像使用正则表达式中任何其他字符一样使用通配符。 例如,如果想匹配 hughuhhuthum,可以使用正则表达式 /hu./ 匹配以上四个单词。

let humStr = "I'll hum a song";
let hugStr = "Bear hug";
let huRegex = /hu./;
huRegex.test(humStr); // true
huRegex.test(hugStr); // true

多种可能匹配 Multiple Possbilities

文字匹配模式(/literal/)和通配符(/./)。 这是正则表达式的两种极端情况,一种是精确匹配,而另一种则是匹配所有。 在这两种极端情况之间有一个平衡选项。

可以使用字符集 (character classes)更灵活的匹配字符。 可以把字符集放在方括号([])之间来定义一组需要匹配的字符串。

例如,如果想要匹配 bagbigbug,但是不想匹配 bog。 可以创建正则表达式 /b[aiu]g/ 来执行此操作。 [aiu] 是只匹配字符 ai 或者 u 的字符集。

let bigStr = "big";
let bagStr = "bag";
let bugStr = "bug";
let bogStr = "bog";
let bgRegex = /b[aiu]g/;
bigStr.match(bgRegex); // ["big"]
bagStr.match(bgRegex); // ["bag"]
bugStr.match(bgRegex); // ["bug"]
bogStr.match(bgRegex); // null

匹配字母表 Alphabet

有时需要匹配大量字符(例如,字母表中的每个字母)。在字符集中,可以使用连字符(-)来定义要匹配的字符范围。例如,要匹配小写字母 ae,可以使用 [a-e]

let catStr = "cat";
let batStr = "bat";
let matStr = "mat";
let bgRegex = /[a-e]at/;
catStr.match(bgRegex); // ["cat"]
batStr.match(bgRegex); // ["bat"]
matStr.match(bgRegex); // null

匹配数字和字母 Letters and Numbers

使用连字符(-)匹配字符范围并不仅限于字母。 它还可以匹配一系列数字。在单个字符集中组合一系列字母和数字。

let jennyStr = "Jenny8675309";
let myRegex = /[a-z0-9]/ig;
jennyStr.match(myRegex);

匹配单个未指定字符 Not Specified

创建一个不想匹配的字符集合。 这些类型的字符集称为否定字符集(negated character sets)。

要创建否定字符集,需要在开始括号后面和不想匹配的字符前面放置脱字符(即^)。

例如,/[^aeiou]/gi 匹配所有非元音字符。 注意,字符 .![@/ 和空白字符等也会被匹配,该否定字符集仅排除元音字符。

let quoteSample = "3 blind mice.";
let myRegex = /[^0-9aeiou]/gi; 
let result = quoteSample.match(myRegex);
// 匹配所有非数字和非元音字符

匹配出现一次或多次的字符

有时,需要匹配出现一次或者连续多次的的字符(或字符组)。 这意味着它至少出现一次,并且可能重复出现。

可以使用 + 符号来检查情况是否如此。 记住,字符或匹配模式必须一个接一个地连续出现。 这就是说,字符必须一个接一个地重复。

例如,/a+/g 会在 abc 中匹配到一个匹配项,并且返回 ["a"]。 因为 + 的存在,它也会在 aabc 中匹配到一个匹配项,然后返回 ["aa"]

如果它是检查字符串 abab,它将匹配到两个匹配项并且返回["a", "a"],因为a字符不连续,在它们之间有一个b字符。 最后,因为在字符串 bcd 中没有 a,因此找不到匹配项。

let difficultSpelling = "Mississippi";
let myRegex = /s+/g;
let result = difficultSpelling.match(myRegex);
// 匹配 Mississippi 中出现的 s

匹配出现零次或多次的字符

匹配出现零次或多次的字符。

执行该操作的字符叫做星号,即*

let soccerWord = "gooooooooal!";
let gPhrase = "gut feeling";
let oPhrase = "over the moon";
let goRegex = /go*/;
soccerWord.match(goRegex); // ["goooooooo"]
gPhrase.match(goRegex); // ["g"]
oPhrase.match(goRegex); // null

惰性匹配 Lazy Matching

在正则表达式中,贪心(greedy)匹配会匹配到符合正则表达式匹配模式的字符串的最长可能部分,并将其作为匹配项返回。 另一种方案称为懒惰(lazy)匹配,它会匹配到满足正则表达式的字符串的最小可能部分。

可以将正则表达式 /t[a-z]*i/ 应用于字符串 "titanic"。 这个正则表达式是一个以 t 开始,以 i 结束,并且中间有一些字母的匹配模式。

正则表达式默认是贪心匹配,因此匹配返回为 ["titani"]。 它会匹配到适合该匹配模式的最大子字符串。

但是,使用 ? 字符来将其变成懒惰匹配。 调整后的正则表达式 /t[a-z]*?i/ 匹配字符串 "titanic" 返回 ["ti"]

注意:应该避免使用正则表达式解析 HTML,但是可以用正则表达式匹配 HTML 字符串。

let text = "<h1>Winter is coming</h1>";
let myRegex = /<.*?>/; // 修改这一行
let result = text.match(myRegex);
// 匹配 h1

匹配字符串开头 Beginning

使用字符集中前插入符号(^)来创建一个否定字符集,形如 [^thingsThatWillNotBeMatched]。 除了在字符集中使用之外,脱字符还用于匹配字符串的开始位置。

let firstString = "Ricky is first and can be found.";
let firstRegex = /^Ricky/;
firstRegex.test(firstString); // true
let notFirst = "You can't find Ricky now.";
firstRegex.test(notFirst); // false

匹配字符串末尾 Ending

可以使用正则表达式的美元符号 $ 来搜寻字符串的结尾。

let theEnding = "This is a never ending story";
let storyRegex = /story$/;
storyRegex.test(theEnding); // true
let noEnding = "Sometimes a story will have to end";
storyRegex.test(noEnding); // false

匹配所有字母和数字 \w

JavaScript 中与字母表匹配的最接近的元字符是\w。 这个缩写等同于[A-Za-z0-9_]。 此字符类匹配大写字母和小写字母以及数字。 注意,这个字符类也包含下划线字符 (_)。

let longHand = /[A-Za-z0-9_]+/;
let shortHand = /\w+/;
let numbers = "42";
let varNames = "important_var";
longHand.test(numbers); // true
shortHand.test(numbers); // true
longHand.test(varNames); // true
shortHand.test(varNames); // true

这些元字符缩写也被称为短语元字符 shorthand character classes。

匹配除了数字和字母之外所有的符号 \W

可以使用 \W 搜寻和 \w 相反的匹配模式。 注意,相反匹配模式使用大写字母。 此缩写与 [^A-Za-z0-9_] 是一样的。

let shortHand = /\W/;
let numbers = "42%";
let sentence = "Coding!";
numbers.match(shortHand); // ["%"]
sentence.match(shortHand); // ["!"]

匹配所有数字 \d

查找数字字符的缩写是 \d,注意是小写的 d。 这等同于元字符 [0-9],它查找 0 到 9 之间任意数字的单个字符。

let movieName = "2001: A Space Odyssey";
let numRegex = /\d/g; 
let result = movieName.match(numRegex).length;

匹配所有非数字 \D

也可以使用类似的缩写来搜寻非数字,该缩写使用大写的 D

查找非数字字符的缩写是 \D。 这等同于字符串 [^0-9],它查找不是 0 - 9 之间数字的单个字符。

let movieName = "2001: A Space Odyssey";
let noNumRegex = /\D/g; 
let result = movieName.match(noNumRegex).length;

匹配空白字符 \s

可以匹配字符之间的空格。

可以使用 \s 搜寻空格,其中 s 是小写。 此匹配模式将匹配空格、回车符、制表符、换页符和换行符。 可以认为这类似于元字符 [ \r\t\f\n\v]

let whiteSpace = "Whitespace. Whitespace everywhere!"
let spaceRegex = /\s/g;
whiteSpace.match(spaceRegex); // [" ", " "]

匹配非空白字符 \S

使用 \S 搜寻非空白字符,其中 s 是大写。 此匹配模式将不匹配空格、回车符、制表符、换页符和换行符。 可以认为这类似于元字符 [^ \r\t\f\n\v]

let whiteSpace = "Whitespace. Whitespace everywhere!"
let nonSpaceRegex = /\S/g;
whiteSpace.match(nonSpaceRegex).length // 32

指定匹配的上下限 Upper and Lower

使用数量说明符(quantity specifiers)指定匹配模式的上下限。 数量说明符与花括号({})一起使用。 可以在花括号之间放两个数字,这两个数字代表匹配模式的上限和下限。

例如,要匹配出现 35 次字母 a 的在字符串 ah,正则表达式应为/a{3,5}h/

let A4 = "aaaah";
let A2 = "aah";
let multipleA = /a{3,5}h/;
multipleA.test(A4); // true
multipleA.test(A2); // false

只指定匹配的下限 Only Lower

有时候只想指定匹配模式的下限而不需要指定上限。为此,在第一个数字后面跟一个逗号即可。

例如,要匹配至少出现 3 次字母 a 的字符串 hah,正则表达式应该是/ha{3,}h/

let A4 = "haaaah";
let A2 = "haah";
let A100 = "h" + "a".repeat(100) + "h";
let multipleA = /ha{3,}h/;
multipleA.test(A4); // t
multipleA.test(A2); // false
multipleA.test(A100);
// true

指定匹配的确切数量 Exact Number

要指定一定数量的匹配模式,只需在大括号之间放置一个数字。

例如,要只匹配字母 a 出现 3 次的单词hah,正则表达式应为/ha{3}h/

let A4 = "haaaah";
let A3 = "haaah";
let A100 = "h" + "a".repeat(100) + "h";
let multipleHA = /ha{3}h/;
multipleHA.test(A4); // false
multipleHA.test(A3); // true
multipleHA.test(A100); // false

检查全部或无 ?

为此,可以使用问号 ? 指定可能存在的元素。 这将检查前面的零个或一个元素。 可以将此符号视为前面的元素是可选的。

例如,美式英语和英式英语略有不同,可以使用问号来匹配两种拼写。

let american = "color";
let british = "colour";
let rainbowRegex= /colou?r/;
rainbowRegex.test(american); // true
rainbowRegex.test(british); // true

正向先行断言和负向先行断言 Positive and Negative Loadahead

先行断言 (Lookaheads)是告诉 JavaScript 在字符串中向前查找的匹配模式。 当想要在同一个字符串上搜寻多个匹配模式时,这可能非常有用。

有两种先行断言:正向先行断言(positive lookahead)和负向先行断言(negative lookahead)。

正向先行断言会查看并确保搜索匹配模式中的元素存在,但实际上并不匹配。 正向先行断言的用法是 (?=...),其中 ... 就是需要存在但不会被匹配的部分。

另一方面,负向先行断言会查看并确保搜索匹配模式中的元素不存在。 负向先行断言的用法是 (?!...),其中 ... 是希望不存在的匹配模式。 如果负向先行断言部分不存在,将返回匹配模式的其余部分。

尽管先行断言有点儿令人困惑,但是这些示例会有所帮助。

let quit = "qu";
let noquit = "qt";
let quRegex= /q(?=u)/;
let qRegex = /q(?!u)/;
quit.match(quRegex); // true
noquit.match(qRegex); // true

检查混合字符 Mixed

使用正则表达式里的括号 () 来检查字符组。

如果想在字符串找到 PenguinPumpkin,可以用这个正则表达式:/P(engu|umpk)in/g

然后使用 test() 方法检查 test 字符串里面是否包含字符组。

let testStr = "Pumpkin";
let testRegex = /P(engu|umpk)in/;
testRegex.test(testStr); // true

使用捕获组重用模式 Capture Group

捕获组可以用于找到重复的子字符串。捕获组是通过把要捕获的正则表达式放在括号中来构建的。 在这个例子里, 目标是捕获一个包含字母数字字符的词,所以捕获组是将 \w+ 放在括号中:/(\w+)/

分组匹配的子字符串被保存到一个临时的“变量”, 可以使用同一正则表达式和反斜线及捕获组的编号来访问它(例如:\1)。 捕获组按其开头括号的位置自动编号(从左到右),从 1 开始。

下面的示例是匹配被空格隔开的两个相同单词:

let repeatRegex = /(\w+) \1 \1/;
repeatRegex.test(repeatStr); // Returns true
repeatStr.match(repeatRegex); // Returns ["row row row", "row"]

使用捕获组搜索和替换

可以在字符串上使用 .replace() 方法来搜索并替换字符串中的文本。 .replace() 的输入首先是想要搜索的正则表达式匹配模式。 第二个参数是用于替换匹配的字符串或用于执行某些操作的函数。

let wrongText = "The sky is silver.";
let silverRegex = /silver/;
wrongText.replace(silverRegex, "blue");
// The sky is blue

还可以使用美元符号($)访问替换字符串中的捕获组。

"Code Camp".replace(/(\w+)\s(\w+)/, '$2 $1');
// Camp Code

删除结尾和开头的空白 Remove whitespace

字符串的典型处理是删除字符串开头和结尾处的空格。

String.prototype.trim() 方法在这里也可以实现同样的效果。

let hello = "   Hello, World!  ";
let wsRegex = /^\s+|\s+$/g; // 
let result = hello.replace(wsRegex, "");

标签:字符,匹配,正则表达式,JavaScript,let,test,match
From: https://www.cnblogs.com/risejl/p/17385602.html

相关文章

  • 正则表达式和String类有关方法
    正则表达式介绍正则表达式,又被称为规则表达式(RegularExpression,在代码中常简写为regex、regexp或RE),包括普通字符(例如:a到z之间的字符等)和特殊字符(称为元字符)。正则表达式使用单个字符串来描述、匹配一系列匹配某个语法规则的字符串,被广泛运用于于Scala、PHP、C#、Java、C+......
  • 学习JavaScript数据结构与算法 第五章
    五,队列和双端队列我们已经学习了栈。队列和栈非常类似,但是使用了与后进先出不同的原则。双端队列是一种将栈的原则和队列的原则混合在一起的数据结构。5.1队列数据结构队列是遵循先进先出(FIFO,也称为先来先服务)原则的一组有序的项。队列在尾部添加新元素,并从顶部移除元素。最......
  • 正则表达式
    用正则表达式查找文本模式importrephoneNumRegex=re.compile(r'\d\d\d-\d\d\d\-\d\d\d\d')mo=phoneNumRegex.search('Mynumberis415-555-4242.')print(mo.group())用importre导入正则表达式模块;用re.compile()函数创建一个Regex对象;向Regex对象的search()方......
  • JavaScript
    JavaScript概述ECMAScript和JavaScript的关系1996年11月,JavaScript的创造者--Netscape公司,决定将JavaScript提交给国际标准化组织ECMA,希望这门语言能够成为国际标准。次年,ECMA发布262号标准文件(ECMA-262)的第一版,规定了浏览器脚本语言的标准,并将这种语言称为ECMAScript,这个版本就......
  • Javascript异步编程的4种方法
    你可能知道,Javascript语言的执行环境是"单线程"(singlethread)。所谓"单线程",就是指一次只能完成一件任务。如果有多个任务,就必须排队,前面一个任务完成,再执行后面一个任务,以此类推。这种模式的好处是实现起来比较简单,执行环境相对单纯;坏处是只要有一个任务耗时很长,后面的任务都必须......
  • JavaScript: XMLHTTPRequest
     XMLHttpRequest(javascript.info)<body><script>//CreateanewXMLHTTPRequestobjectletxhr=newXMLHttpRequest()xhr.timeout=5000//timeoutinmsleturl=newURL('https://cursive.winch.io/......
  • Python 和 JavaScript 的区别是什么?
    Python和JavaScript是两门非常流行的编程语言,它们各自有着独特的特点和应用场景。Python和JavaScript是两种不同的编程语言,它们的设计目标和应用场景有所不同。Python是一种多用途、高级、解释型的编程语言,可用于开发各种应用程序,包括Web开发、数据分析、人工智能、科学计算......
  • JavaScript原生兼容大全-持续更新
    JavaScript兼容-持续更新1.css非行内样式操作//currentStyle用于IE低版本getComputed用于主流浏览器//element目标元素attribute目标属性functiongetStyle(element,attribute){returnelement.currentStyle?element.currentStyle(attribute):getComputed(el......
  • JavaScript fromCharCode() 方法
    fromCharCode()方法返回指定的Unicode编码对应的字符。语法格式:String.fromCharCode(n1,n2,...)参数:n1,n1,..表示指定的Unicode编码。示例:(1)返回指定Unicode编码的字符:<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8">&......
  • 正则表达式?表示匹配前一个字符0次或者1次
     001、[root@PC1test]#lsa.txt[root@PC1test]#cata.txt33ackkddadebckkadabcuyddgg88[root@PC1test]#grep-E"ab?c"a.txt##"ab?c"等价与ac+abc33ackkadabcuy[root@PC1test]#grep"ab?c"a.txt##在g......