Java正则操作类Pattern和Matcher
Pattern类
Pattern位于java.util.regex包中,是正则表达式的编译表示形式,此类的实例是不可变的,可供多个并发线程安全使用。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态compile方法,它返回一个
Pattern.split(CharSequence input)
split(CharSequence input)方法,用于分割字符串,返回一个String[]数组。如下:
public static void main(String[] args) {
Pattern p = Pattern.compile("\\d+");
String[] split = p.split("我的车牌号是京A123456这个车牌是我第100个靓号,我很喜欢。");
for (String s : split) {
System.out.println(s);
}
}
输出结果:
我的车牌号是京A
这个车牌是我第
个靓号,我很喜欢。
Pattern.matches(String regex,CharSequence input)
该静态方法用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串。该方法与String对象的matches方法一致,如下:
System.out.println("12345".matches("\\d+")); // true
System.out.println("车牌号12345".matches("\\d+")); // false
System.out.println("123d45".matches("\\d+")); // false
System.out.println(Pattern.matches("\\d+", "123456")); // true
System.out.println(Pattern.matches("\\d+", "车牌号123456")); // false
System.out.println(Pattern.matches("\\d+", "123abc456")); // false
Pattern.matcher(CharSequence input)
返回一个Matcher对象。Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作。Matcher对象的没有公开的构造器,需要通过Pattern.mathcer方法创建实例,Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持。
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("4348东aldkf45赛发送");
matcher.pattern();//返回pattern 也就是返回创建本Matcher对象的Pattern对象
Matcher类
Matcher 对象是对输入字符串进行正则解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
Matcher的matches()、lookingAt()和find()方法
Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false。但需要注意的是matches()方法对整个字符串进行匹配,只有当整个字符串都匹配正则规则时才返回true。
lookingAt()对从字符串的开始位置进行匹配,只有匹配到的字符串在最前面才返回true。代码如下:
Pattern p2 = Pattern.compile("\\d+");
Matcher m2 = p2.matcher("123abc456");
System.out.println(m2.lookingAt()); // true
Matcher m3 = p2.matcher("abc1234");
System.out.println(m3.lookingAt()); // false
find()对字符串进行匹配,匹配到的子字符串可以在子字符串的任何位置。该方法表示是否存在与该模式匹配的下一个子字符串。简单来说就是在字符某部分匹配上模式就会返回true,同时匹配位置会记录到当前位置,再次调用时从该处匹配下一个位置,因此一般使用find配合循环和group方法获取全部的匹配子串。
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("abc123de456fg");
System.out.println(matcher.find()); // true
循环获取字串:
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("abc123de456fg");
//System.out.println(matcher.find()); // true
while (matcher.find()){
System.out.println(matcher.group());
}
输出:
123
456
Mathcer类的start()、end()和group()方法
当使用matches(),lookingAt(),find()执行匹配操作后,可以利用以上三个方法得到更详细的信息。
- start()返回匹配到的子字符串的第一个字符在字符串中的起始索引位置.
- end()返回匹配到的子字符串的最后一个字符在字符串中的索引位置。
- group()返回匹配到的子字符串
因此下面这段代码:
String src = "abc123de456fg";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(src);
while (matcher.find()){
System.out.println(src.substring(matcher.start(), matcher.end()));
}
等价于:
String src = "abc123de456fg";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(src);
while (matcher.find()){
System.out.println(matcher.group());
}
start(),end(),group()均有一个对应的重载方法,分别是start(int i),end(int i),group(int i),它们专用于分组操作,Mathcer类还有一个groupCount()方法用于返回有多少组。
捕获分组
捕获组是把多个字符当一个独立单元进行处理的方法,它通过对括号内的字符分组来创建。组号按照左括号来数,只认左括号。
例如,正则表达式(dog)创建了单一分组,组里包含"d","o",和"g"。
捕获组是通过从左至右计算其开括号来编号,数左括号,依次数左括号的数量。例如,在表达式((A)(B(C))),有四个这样的组:
((A)(B(C)))
(A)
(B(C))
(C)
可以通过调用matcher对象的groupCount方法来查看表达式有多少个分组。groupCount方法返回一个int值,表示matcher对象当前有多个捕获组。还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在groupCount的返回值中。
Pattern p = Pattern.compile("(\\D+)(\\d+)(\\D+)");
Matcher m = p.matcher("somewords123顶发动");
if (m.find()){
System.out.println("分组个数:" + m.groupCount());
System.out.println(m.group(0));
System.out.println(m.group(1));
System.out.println(m.group(2));
System.out.println(m.group(3));
}
//////////////输出//////////////
分组个数:3
somewords123顶发动
somewords
123
顶发动