C#.NET regexp類(lèi)
C#.NET還是比較常見(jiàn)的東西,這里我們主要介紹C#.NET regexp類(lèi),包括介紹基于過(guò)程和基于表達(dá)式方法的比較等方面。
多少年來(lái),許多的編程語(yǔ)言和工具都包含對(duì)規(guī)則表達(dá)式的支持,.NET基礎(chǔ)類(lèi)庫(kù)中包含有一個(gè)名字空間和一系列可以充分發(fā)揮規(guī)則表達(dá)式威力的類(lèi),而且它們也都與未來(lái)的Perl 5中的規(guī)則表達(dá)式兼容。
此外,C#.NET regexp類(lèi)還能夠完成一些其他的功能,例如從右至左的結(jié)合模式和表達(dá)式的編輯等。
在這篇文章中,我將簡(jiǎn)要地介紹System.Text.RegularExpression中的類(lèi)和方法、一些字符串匹配和替換的例子以及組結(jié)構(gòu)的詳細(xì)情況,***,還會(huì)介紹一些你可能會(huì)用到的常見(jiàn)的表達(dá)式。
應(yīng)該掌握的基礎(chǔ)知識(shí)
規(guī)則表達(dá)式的知識(shí)可能是不少編程人員“常學(xué)常忘”的知識(shí)之一。在這篇文章中,我們將假定你已經(jīng)掌握了規(guī)則表達(dá)式的用法,尤其是Perl 5中表達(dá)式的用法。C#.NET regexp類(lèi)是Perl 5中表達(dá)式的一個(gè)超集,因此,從理論上說(shuō)它將作為一個(gè)很好的起點(diǎn)。我們還假設(shè)你具有了C#的語(yǔ)法和.NET架構(gòu)的基本知識(shí)。
如果你沒(méi)有規(guī)則表達(dá)式方面的知識(shí),我建議你從Perl 5的語(yǔ)法著手開(kāi)始學(xué)習(xí)。在規(guī)則表達(dá)式方面的權(quán)威書(shū)籍是由杰弗里·弗雷德?tīng)柧帉?xiě)的《掌握表達(dá)式》一書(shū),對(duì)于希望深刻理解表達(dá)式的讀者,我們強(qiáng)烈建議閱讀這本書(shū)。
RegularExpression組合體
regexp規(guī)則類(lèi)包含在System.Text.RegularExpressions.dll文件中,在對(duì)應(yīng)用軟件進(jìn)行編譯時(shí)你必須引用這個(gè)文件,例如,csc r:System.Text.RegularExpressions.dll foo.cs命令將創(chuàng)建foo.exe文件,它就引用了System.Text.RegularExpressions文件。
基于過(guò)程和基于表達(dá)式方法的比較
一般情況下,使用規(guī)則表達(dá)式的用戶(hù)可以分為以下二大類(lèi):***類(lèi)用戶(hù)盡量不使用規(guī)則表達(dá)式,而是使用過(guò)程來(lái)執(zhí)行一些需要重復(fù)的操作;第二類(lèi)用戶(hù)則充分利用規(guī)則表達(dá)式處理引擎的功能和威力,而盡可能少地使用過(guò)程。
對(duì)于我們大多數(shù)用戶(hù)而言,***的方案莫過(guò)于二者兼而用之了。我希望這篇文章能夠說(shuō)明C#.NET regexp類(lèi)的作用以及它在性能和復(fù)雜性之間的優(yōu)、劣點(diǎn)。
基于過(guò)程的模式
我們?cè)诰幊讨薪?jīng)常需要用到的一個(gè)功能是對(duì)字符串中的一部分進(jìn)行匹配或其他一些對(duì)字符串處理,下面是一個(gè)對(duì)字符串中的單詞進(jìn)行匹配的例子:
- string text = "the quick red fox jumped over the lazy brown dog.";
- System.Console.WriteLine("text=[" + text + "]");
- string result = "";
- string pattern = @"\w+|\W+";
- foreach (Match m in Regex.Matches(text, pattern))
- {
- // 取得匹配的字符串
- string x = m.ToString();
- // 如果***個(gè)字符是小寫(xiě)
- if (char.IsLower(x[0]))
- // 變成大寫(xiě)
- x = char.ToUpper(x[0]) + x.Substring(1, x.Length-1);
- // 收集所有的字符
- result += x;
- }
- System.Console.WriteLine("result=[" + result + "]");
【編輯推薦】