Flex正則表達式高級規(guī)則中預搜索和反向預搜索用法指導
上節(jié)我們介紹了Flex正則表達式的簡單規(guī)則,本文向大家介紹一下Flex正則表達式高級規(guī)則中預搜索和反向預搜索,首先我們來看一下Flex正則表達式的概念和作用。
引言
Flex正則表達式(regularexpression)就是用一個“字符串”來描述一個特征,然后去驗證另一個“字符串”是否符合這個特征。比如表達式“ab+”描述的特征是“一個'a'和任意個'b'”,那么'ab','abb','abbbbbbbbbb'都符合這個特征。
Flex正則表達式可以用來:
(1)驗證字符串是否符合指定特征,比如驗證是否是合法的郵件地址。
(2)用來查找字符串,從一個長的文本中查找符合指定特征的字符串,比查找固定字符串更加靈活方便。
(3)用來替換,比普通的替換更強大。
Flex正則表達式學習起來其實是很簡單的,不多的幾個較為抽象的概念也很容易理解。之所以很多人感覺Flex正則表達式比較復雜,一方面是因為大多數(shù)的文檔沒有做到由淺入深地講解,概念上沒有注意先后順序,給讀者的理解帶來困難;另一方面,各種引擎自帶的文檔一般都要介紹它特有的功能,然而這部分特有的功能并不是我們首先要理解的。
預搜索,不匹配;反向預搜索,不匹配
前面的章節(jié)中,我講到了幾個代表抽象意義的特殊符號:"^","$","\b"。它們都有一個共同點,那就是:它們本身不匹配任何字符,只是對"字符串的兩頭"或者"字符之間的縫隙"附加了一個條件。理解到這個概念以后,本節(jié)將繼續(xù)介紹另外一種對"兩頭"或者"縫隙"附加條件的,更加靈活的表示方法。
◆Flex正則表達式正向預搜索:"(?=xxxxx)","(?!xxxxx)"
格式:"(?=xxxxx)",在被匹配的字符串中,它對所處的"縫隙"或者"兩頭"附加的條件是:所在縫隙的右側(cè),必須能夠匹配上xxxxx這部分的表達式。因為它只是在此作為這個縫隙上附加的條件,所以它并不影響后邊的表達式去真正匹配這個縫隙之后的字符。這就類似"\b",本身不匹配任何字符。"\b"只是將所在縫隙之前、之后的字符取來進行了一下判斷,不會影響后邊的表達式來真正的匹配。
舉例1:表達式"Windows(?=NT|XP)"在匹配"Windows98,WindowsNT,Windows2000"時,將只匹配"WindowsNT"中的"Windows",其他的"Windows"字樣則不被匹配。
舉例2:表達式"(\w)((?=\1\1\1)(\1))+"在匹配字符串"aaaffffff999999999"時,將可以匹配6個"f"的前4個,可以匹配9個"9"的前7個。這個表達式可以讀解成:重復4次以上的字母數(shù)字,則匹配其剩下最后2位之前的部分。當然,這個表達式可以不這樣寫,在此的目的是作為演示之用。
格式:"(?!xxxxx)",所在縫隙的右側(cè),必須不能匹配xxxxx這部分表達式。
舉例3:表達式"((?!\bstop\b).)+"在匹配"fdjkaljfdlstopfjdslafdj"時,將從頭一直匹配到"stop"之前的位置,如果字符串中沒有"stop",則匹配整個字符串。
舉例4:表達式"do(?!\w)"在匹配字符串"done,do,dog"時,只能匹配"do"。在本條舉例中,"do"后邊使用"(?!\w)"和使用"\b"效果是一樣的。
◆Flex正則表達式反向預搜索:"(?<=xxxxx)","(?<!xxxxx)"
這兩種格式的概念和正向預搜索是類似的,反向預搜索要求的條件是:所在縫隙的"左側(cè)",兩種格式分別要求必須能夠匹配和必須不能夠匹配指定表達式,而不是去判斷右側(cè)。與"正向預搜索"一樣的是:它們都是對所在縫隙的一種附加條件,本身都不匹配任何字符。
舉例5:表達式"(?<=\d{4})\d+(?=\d{4})"在匹配"1234567890123456"時,將匹配除了前4個數(shù)字和后4個數(shù)字之外的中間8個數(shù)字。由于JScript.RegExp不支持反向預搜索,因此,本條舉例不能夠進行演示。很多其他的引擎可以支持反向預搜索,比如:Java1.4以上的java.util.regex包,.NET中System.Text.RegularExpressions命名空間,以及本站推薦的最簡單易用的DEELX正則引擎。
【編輯推薦】
- Flex正則表達式的高級規(guī)則
- FlexBuilder4十大新特性閃亮登場
- 解析AS3中Flex正則表達式的使用
- 揭開Flex正則表達式的神秘面紗
- FlexBuilder開發(fā)方法及特點解析