淺談Java正則表達(dá)式中的Pattern類(lèi)與Matcher類(lèi)
Pattern類(lèi)說(shuō)明
指定為字符串的Java正則表達(dá)式必須首先被編譯為pattern類(lèi)的實(shí)例。然后,可將得到的模式用于創(chuàng)建 Matcher 對(duì)象,依照J(rèn)ava正則表達(dá)式,該對(duì)象可以與任意字符序列匹配。執(zhí)行匹配所涉及的所有狀態(tài)都駐留在匹配器中,所以多個(gè)匹配器可以共享同一模式。
因此,典型的調(diào)用順序是
- Pattern p = Pattern.compile("a*b");
- Matcher m = p.matcher("aaaaab");
- boolean b = m.matches();
在僅使用一次正則表達(dá)式時(shí),可以方便地通過(guò)pattern類(lèi)定義 matches 方法。此方法編譯表達(dá)式并在單個(gè)
調(diào)用中將輸入序列與其匹配。語(yǔ)句
boolean b = Pattern.matches("a*b", "aaaaab");
等效于上面的三個(gè)語(yǔ)句,盡管對(duì)于重復(fù)的匹配而言它效率不高,因?yàn)樗辉试S重用已編譯的模式。
此類(lèi)的實(shí)例是不可變的,可供多個(gè)并發(fā)線程安全使用。Matcher 類(lèi)的實(shí)例用于此目的則不安全。
Matcher類(lèi)說(shuō)明
通過(guò)調(diào)用模式的 matcher 方法從模式創(chuàng)建匹配器。創(chuàng)建匹配器后,可以使用它執(zhí)行三種不同的匹配操作:
1 matches 方法嘗試將整個(gè)輸入序列與該模式匹配。
(注:當(dāng)調(diào)用String的matches()方法時(shí),實(shí)際上是調(diào)用Pattern的靜態(tài)方法matches().也就是相當(dāng)于調(diào)Matcher的matches(),所以是整個(gè)輸入序列與模式匹配.)
2 lookingAt 嘗試將輸入序列從頭開(kāi)始與該模式匹配。
3 find 方法掃描輸入序列以查找與該模式匹配的下一個(gè)子序列。
此類(lèi)的實(shí)例用于多個(gè)并發(fā)線程是不安全的。
測(cè)試代碼
package test;
- import java.util.regex.Matcher;
- import java.util.regex.Pattern;
- /**
- * java中運(yùn)用正則表達(dá)式的兩個(gè)重要類(lèi):Pattern與Matcher
- * @author fhd001
- */
- public class PatternAndMatcherTest {
- public static void main(String[] args) {
- /*
- * 常用的調(diào)用
- */
- Pattern p1 = Pattern.compile("a*b");
- String str1 = "aaaab";
- Matcher m1 = p1.matcher(str1);
- boolean b1 = m1.matches();
- System.out.println(b1);
- String str2 = "b";
- Matcher m2 = p1.matcher(str2);
- boolean b2 = m2.matches();
- System.out.println(b2);
- /*
- * 另一種調(diào)用
- * 等效于上面的語(yǔ)句,盡管對(duì)于重復(fù)的匹配而言它效率不高,因?yàn)樗辉试S重用已編譯的模式。
- * 但它可供多個(gè)并發(fā)線程安全使用,而上面的調(diào)用則就不是安全的.
- */
- boolean b3 = Pattern.matches("a*b", "aaab");
- System.out.println(b3);
- //Pattern類(lèi)的pattern方法:從pattern類(lèi)的實(shí)例中返回匹配模式的字符串表示
- String pattern1 = p1.pattern();
- System.out.println(pattern1);
- //Pattern類(lèi)的split方法
- String[]arr1 = p1.split("rrrrraaabccccaaaaab");
- for (String string : arr1) {
- System.out.println(string+">>>>");
- }
- /*
- * Matcher類(lèi)
- *
- * matches方法: 方法嘗試將整個(gè)輸入序列與該模式匹配
- * lookingAt方法: 嘗試將輸入序列從頭開(kāi)始與該模式匹配,與 matches 方法類(lèi)似,
- * 此方法始終從區(qū)域的開(kāi)頭開(kāi)始;與之不同的是,它不需要匹配整個(gè)區(qū)域。
- * find方法: 方法掃描輸入序列以查找與該模式匹配的下一個(gè)子序列
- */
- String str3 = "aabbcccaaaaaeeeaaaaaaaaagggga";
- Pattern p3 = Pattern.compile("a+");
- Matcher m3 = p3.matcher(str3);
- boolean bo4 = m3.matches();
- System.out.println("matches方法: "+bo4);
- /*
- * lookingAt方法,從開(kāi)頭***個(gè)字符進(jìn)行匹配,匹配成功了不再繼續(xù)匹配,
- * 從***個(gè)字符開(kāi)始,匹配失敗了,也不繼續(xù)匹配.不需要匹配整個(gè)序列
- */
- boolean bo5 = m3.lookingAt();
- if(bo5){
- //group方法(不帶參數(shù))返回的就是匹配的子字符串.
- System.out.println("lookingAt方法: "+m3.group());
- }
- //find方法:找到一個(gè)匹配的子串,還會(huì)繼續(xù)找下一個(gè)子串.
- while(m3.find()){
- System.out.println("find方法: "+m3.group());
- }
- /*
- * 帶參數(shù)的group方法與不帶參數(shù)的group方法區(qū)別
- * 不帶參數(shù)的group方法:find方法與lookingAt方法匹配出來(lái)的子序列(上面有演示)
- * 帶參數(shù)的group方法: 返回在以前匹配操作期間由給定組捕獲的輸入子序列。
- */
- String str6 = "aaabbbccc";
- Pattern p5 = Pattern.compile("(a+)(b+)(c+)");
- Matcher m5 = p5.matcher(str6);
- boolean boo = m5.matches();
- if(boo){
- int k = m5.groupCount()+1;//加1就是把0下標(biāo)的整個(gè)字符序列加上,它也作為一組放在0下標(biāo)的位置.
- if(k>0){
- for(int i=0;i System.out.println(m5.group(i));
- }
- }
- }
- }
- }
- package test;
- import java.util.regex.Matcher;
- import java.util.regex.Pattern;
- /**
- * java中運(yùn)用正則表達(dá)式的兩個(gè)重要類(lèi):Pattern與Matcher
- * @author fhd001
- */
- public class PatternAndMatcherTest {
- public static void main(String[] args) {
- /*
- * 常用的調(diào)用
- */
- Pattern p1 = Pattern.compile("a*b");
- String str1 = "aaaab";
- Matcher m1 = p1.matcher(str1);
- boolean b1 = m1.matches();
- System.out.println(b1);
- String str2 = "b";
- Matcher m2 = p1.matcher(str2);
- boolean b2 = m2.matches();
- System.out.println(b2);
- /*
- * 另一種調(diào)用
- * 等效于上面的語(yǔ)句,盡管對(duì)于重復(fù)的匹配而言它效率不高,因?yàn)樗辉试S重用已編譯的模式。
- * 但它可供多個(gè)并發(fā)線程安全使用,而上面的調(diào)用則就不是安全的.
- */
- boolean b3 = Pattern.matches("a*b", "aaab");
- System.out.println(b3);
- //Pattern類(lèi)的pattern方法:從pattern類(lèi)的實(shí)例中返回匹配模式的字符串表示
- String pattern1 = p1.pattern();
- System.out.println(pattern1);
- //Pattern類(lèi)的split方法
- String[]arr1 = p1.split("rrrrraaabccccaaaaab");
- for (String string : arr1) {
- System.out.println(string+">>>>");
- }
- /*
- * Matcher類(lèi)
- *
- * matches方法: 方法嘗試將整個(gè)輸入序列與該模式匹配
- * lookingAt方法: 嘗試將輸入序列從頭開(kāi)始與該模式匹配,與 matches 方法類(lèi)似,
- * 此方法始終從區(qū)域的開(kāi)頭開(kāi)始;與之不同的是,它不需要匹配整個(gè)區(qū)域。
- * find方法: 方法掃描輸入序列以查找與該模式匹配的下一個(gè)子序列
- */
- String str3 = "aabbcccaaaaaeeeaaaaaaaaagggga";
- Pattern p3 = Pattern.compile("a+");
- Matcher m3 = p3.matcher(str3);
- boolean bo4 = m3.matches();
- System.out.println("matches方法: "+bo4);
- /*
- * lookingAt方法,從開(kāi)頭***個(gè)字符進(jìn)行匹配,匹配成功了不再繼續(xù)匹配,
- * 從***個(gè)字符開(kāi)始,匹配失敗了,也不繼續(xù)匹配.不需要匹配整個(gè)序列
- */
- boolean bo5 = m3.lookingAt();
- if(bo5){
- //group方法(不帶參數(shù))返回的就是匹配的子字符串.
- System.out.println("lookingAt方法: "+m3.group());
- }
- //find方法:找到一個(gè)匹配的子串,還會(huì)繼續(xù)找下一個(gè)子串.
- while(m3.find()){
- System.out.println("find方法: "+m3.group());
- }
- /*
- * 帶參數(shù)的group方法與不帶參數(shù)的group方法區(qū)別
- * 不帶參數(shù)的group方法:find方法與lookingAt方法匹配出來(lái)的子序列(上面有演示)
- * 帶參數(shù)的group方法: 返回在以前匹配操作期間由給定組捕獲的輸入子序列。
- */
- String str6 = "aaabbbccc";
- Pattern p5 = Pattern.compile("(a+)(b+)(c+)");
- Matcher m5 = p5.matcher(str6);
- boolean boo = m5.matches();
- if(boo){
- int k = m5.groupCount()+1;//加1就是把0下標(biāo)的整個(gè)字符序列加上,它也作為一組放在0下標(biāo)的位置.
- if(k>0){
- for(int i=0;i System.out.println(m5.group(i));
- }
- }
- }
- }
- }
結(jié)果代碼
- true
- true
- true
- a*b
- rrrrr>>>>
- cccc>>>>
- matches方法: false
- lookingAt方法: aa
- find方法: aaaaa
- find方法: aaaaaaaaa
- find方法: a
- aaabbbccc
- aaa
- bbb
- ccc
【編輯推薦】