VB.NET正則表達(dá)式應(yīng)用經(jīng)驗(yàn)分享
作為一個(gè)優(yōu)秀的程序員來說,掌握一兩門編程語言并不算什么。而能夠把所掌握的語言達(dá)到一種熟練運(yùn)用的地步就是一個(gè)相當(dāng)?shù)碾y的高度了。對于VB.NET的學(xué)習(xí)同樣也是需要我們循序漸進(jìn)的慢慢積累經(jīng)驗(yàn)才能達(dá)到自己預(yù)期的目標(biāo)。先來了解一下VB.NET正則表達(dá)式的相關(guān)介紹吧。#t#
1、引言
在通常的程序設(shè)計(jì)中,對字符串的操作是不可缺少的部分。例如,我們經(jīng)常需要從字符串中尋找特定的部分,或者對某一部分進(jìn)行替換、刪除等等。使用傳統(tǒng)的靜態(tài)字符串操作方法只能查找字符串中固定不變的部分,缺乏靈活性。而用VB.NET正則表達(dá)式則可以規(guī)定待查找字符串的模式,查找同一類型的字符串,例如要在EMAIL格式的字符串(如lzcarl@126.com)中分解出用戶名和服務(wù)器名,可以定義如下的正則表達(dá)式(?<user>[^@]+)@(?<host>.+),然后使用相應(yīng)的解析器進(jìn)行解析,得到兩個(gè)分組user組和host組,user組里存儲(chǔ)用戶名lzcarl,host組里存放服務(wù)器名126.com,而用傳統(tǒng)的方法是很難實(shí)現(xiàn)這種分解的。
由此可見,作為一種字符串處理方式,正則表達(dá)式的靈活與強(qiáng)大確實(shí)是傳統(tǒng)字符串處理方式無法相比的。
2、VB.NET正則表達(dá)式處理類
在VB.NET中使用正則表達(dá)式必須先引入命名空間System.Text.RegularExpressions,該命名空間包含一下七個(gè)類:Regex、Match、MatchCollection、GroupCollection、CaptureCollection、Group、Capture。
Regex類表示不可變(只讀)正則表達(dá)式類,設(shè)置待匹配字符串的模式。Match 類表示正則表達(dá)式匹配操作的結(jié)果。MatchCollection 類表示成功的非重疊匹配的序列,即匹配后得到的字符串集合。在正則表達(dá)式中應(yīng)用最多的就是這三個(gè)類。
使用正則表達(dá)式類的通用方法是:
首先生成一個(gè)Regex類的實(shí)例,并在傳入?yún)?shù)中輸入正則表達(dá)式的模式,然后使用Regex類的相應(yīng)方法,如IsMatch(判斷是否
匹配)、Match(返回匹配得到的字符串)等等。
當(dāng)然也可以使用Regex類的共享方法而不實(shí)例化Regex類——IsMatch、Match等等(即上述方法的共享版本)獲得所需要的結(jié)果。這種方法適于匹配模式不固定,匹配次數(shù)不多的情況。
接下來給出一個(gè)VB.NET正則表達(dá)式的應(yīng)用。
3、時(shí)間解析程序
該程序讀取用戶輸入的時(shí)間長度字符串(如XX小時(shí)XX分鐘XX秒),把它解析,***用秒表示該時(shí)間長度(XX秒)。
當(dāng)用戶在文本框中輸入時(shí)間值后,點(diǎn)計(jì)算后就會(huì)在“結(jié)果”后面得到用秒表示的時(shí)間值。
該程序首先從文本框中讀入時(shí)間值,然后分別查找其中的小時(shí)、分鐘、秒部分,在這里就使用了正則表達(dá)式對時(shí)間表達(dá)式進(jìn)行解析。如小時(shí)數(shù)的正則表達(dá)式可表示為“[0-9]+小時(shí)”。“[0-9]”表示0到9間的任意數(shù)字都可以被匹配,“+”表示該字符可以出現(xiàn)一次或更多,因此“[0-9]+”即可以匹配任意長度整數(shù)(關(guān)于正則表達(dá)式的語法可以參見MSDN的相應(yīng)部分),用這個(gè)字符串模式就可以查找出表達(dá)式中的小時(shí)部分。在分別匹配得到小時(shí)數(shù)、分鐘數(shù)和秒數(shù)后計(jì)算得到總的秒數(shù),并顯示在“結(jié)果”后面。
程序包括一個(gè)計(jì)算時(shí)間的正則表達(dá)式工具類TimeRegex,及Form1界面類。
TimeRegex類代碼如下:
- Imports System.Text.RegularExpressions
- Public Class TimeRegex
- Private hour As Integer = 0
- Private minute As Integer = 0
- Private second As Integer = 0
- Private totalTime As Integer = 0
- Private exp As String '時(shí)間表達(dá)式
- Sub New()
- End Sub
- '根據(jù)時(shí)間文本解析出其中的數(shù)字部分
- Private Function getTime(ByVal
timeKind As String) As String- Dim timeMatch As Match
- Dim time As String
- '先從中解析出包含數(shù)字和中文的部分
- timeMatch = Regex.Match(exp, timeKind)
- If timeMatch.Success = True Then
- time = timeMatch.Value
- '然后從得到的文本中解析出數(shù)字
- Return Regex.Match(time, "[0-9]+").Value
- Else
- Return "0"
- End If
- End Function
- '根據(jù)傳入的表達(dá)式計(jì)算總時(shí)間
- Public Function getTotalTime(ByVal
_exp As String) As Integer- exp = _exp
- '分別計(jì)算出小時(shí),分鐘,秒,然后得到總時(shí)間
- hour = Integer.Parse(getTime("[0-9]+小時(shí)"))
- minute = Integer.Parse(getTime("[0-9]+分鐘"))
- second = Integer.Parse(getTime("[0-9]+秒"))
- totalTime = hour * 3600 + minute * 60 + second
- Return totalTime
- End Function
- End Class
- Form1類代碼如下:
- Public Class Form1
- Inherits System.Windows.Forms.Form
- Private regex As New TimeRegex
Windows窗體設(shè)計(jì)器生成代碼省略
- Private Sub Button1_Click
(ByVal sender As System.Object,
ByVal e As System.EventArgs)
Handles Button1.Click- SecondTime.Text = regex.
getTotalTime- (timeExp.Text).ToString & "秒"
- End Sub
- End Class
用戶輸入1小時(shí)1分鐘1秒后點(diǎn)計(jì)算,得到結(jié)果3661秒,證明結(jié)果正確。
4、結(jié)論
合理的使用VB.NET正則表達(dá)式對于簡化程序代碼、提高程序的復(fù)用性與健壯性有著很大的幫助。可以說正則表達(dá)式是程序員必須掌握的幾種武器之一。而.NET中對正則表達(dá)式也有較好的支持,以后在處理字符串的時(shí)候,不妨使用一下正則表達(dá)式,一定可以起到事半功倍的效果。