C#正則表達(dá)式經(jīng)驗(yàn)總結(jié)
到目前為止,許多的編程語言和工具都包含對(duì)正則表達(dá)式的支持,當(dāng)然.NET也不例外,.NET基礎(chǔ)類庫中包含有一個(gè)名稱空間和一系列可以充分發(fā)揮規(guī)則表達(dá)式威力的類。
正則表達(dá)式的知識(shí)可能是不少編程人員最煩惱的事兒了。如果你還沒有規(guī)則表達(dá)式方面的知識(shí)的話,建議從正則表達(dá)式的基礎(chǔ)知識(shí)入手。前參見 正則表達(dá)式語法。
下面就來研究C#正則表達(dá)式,C#正則表達(dá)式包含在.NET基礎(chǔ)雷庫的一個(gè)名稱空間下,這個(gè)名稱空間就是System.Text.RegularExpressions。該名稱空間包括8個(gè)類,1個(gè)枚舉,1個(gè)委托。他們分別是:
◆Capture: 包含一次匹配的結(jié)果;
◆CaptureCollection: Capture的序列;
◆Group: 一次組記錄的結(jié)果,由Capture繼承而來;
◆GroupCollection:表示捕獲組的集合
◆Match: 一次表達(dá)式的匹配結(jié)果,由Group繼承而來;
◆MatchCollection: Match的一個(gè)序列;
◆MatchEvaluator: 執(zhí)行替換操作時(shí)使用的委托;
◆Regex:編譯后的表達(dá)式的實(shí)例。
◆RegexCompilationInfo:提供編譯器用于將正則表達(dá)式編譯為獨(dú)立程序集的信息
◆RegexOptions 提供用于設(shè)置正則表達(dá)式的枚舉值
Regex類中還包含一些靜態(tài)的方法:
◆Escape: 對(duì)字符串中的regex中的轉(zhuǎn)義符進(jìn)行轉(zhuǎn)義;
◆IsMatch: 如果表達(dá)式在字符串中匹配,該方法返回一個(gè)布爾值;
◆Match: 返回Match的實(shí)例;
◆Matches: 返回一系列的Match的方法;
◆Replace: 用替換字符串替換匹配的表達(dá)式;
◆Split: 返回一系列由表達(dá)式?jīng)Q定的字符串;
◆Unescape:不對(duì)字符串中的轉(zhuǎn)義字符轉(zhuǎn)義。
下面介紹他們的用途:
先看一個(gè)簡單的匹配例子,我們首先從使用Regex、Match類的簡單表達(dá)式開始學(xué)習(xí)?!atch m = Regex.Match("abracadabra", "(a|b|r)+"); 我們現(xiàn)在有了一個(gè)可以用于測(cè)試的Match類的實(shí)例,例如:if (m.Success){},如果想使用匹配的字符串,可以把它轉(zhuǎn)換成一個(gè)字符串: MesaageBox.Show("Match="+m.ToString()); 這個(gè)例子可以得到如下的輸出: Match=abra。這就是匹配的字符串了。
Regex 類表示只讀正則表達(dá)式類。它還包含各種靜態(tài)方法(在下面的實(shí)例中將逐一介紹),允許在不顯式創(chuàng)建其他類的實(shí)例的情況下使用其他正則表達(dá)式類。
以下代碼示例創(chuàng)建了 Regex 類的實(shí)例并在初始化對(duì)象時(shí)定義一個(gè)簡單的正則表達(dá)式。聲明一個(gè)Regex對(duì)象變量:Regex objAlphaPatt;,接著創(chuàng)建Regex對(duì)象的一個(gè)實(shí)例,并定義其規(guī)則:objAlphaPatt=new Regex("[^a-zA-Z]");
IsMatch方法指示 Regex 構(gòu)造函數(shù)中指定的正則表達(dá)式在輸入字符串中是否找到匹配項(xiàng)。這是我們使用C#正則表達(dá)式時(shí)最常用的方法之一。下面的例子說明了IsMatch方法的使用:
- if( !objAlphaPatt.IsMatch("testisMatchMethod"))
- lblMsg.Text = "匹配成功";
- else
- lblMsg.Text = "匹配不成功";
- 這段代碼執(zhí)行的結(jié)果是“匹配成功”
- if( ! objAlphaPatt.IsMatch("testisMatchMethod7654298"))
- lblMsg.Text = "匹配成功";
- else
- lblMsg.Text = "匹配不成功";
Split方法是把由正則表達(dá)式匹配項(xiàng)定義的位置將輸入字符串拆分為一個(gè)子字符串?dāng)?shù)組。例如:
- Regex r = new Regex("-"); // Split on hyphens.
- string[] s = r.Split("first-second-third");
- for(int i=0;i<s.Length;i++)
- {
- Response.Write(s[i]+"<br>");
- }
看上去和String的Split方法一樣,但string的Split方法在由正則表達(dá)式而不是一組字符確定的分隔符處拆分字符串。
Match方法是在輸入字符串中搜索正則表達(dá)式的匹配項(xiàng),并Regex 類的 Match 方法返回 Match 對(duì)象,Match 類表示正則表達(dá)式匹配操作的結(jié)果。
【編輯推薦】