Perl正則表達式語法解析
本文和大家重點討論一下Perl正則表達式的概念,Perl正則表達式,就是一串特別設(shè)計過的字符串,相信通過本文的學(xué)習(xí)你對Perl正則表達式的概念有初步的認識。
1.Perl正則表達式語法
所謂Perl正則表達式,就是一串特別設(shè)計過的字符串,可以按照你的意圖用匹配操作尋找你要求的目標。我這里不是Perl手冊,也不是教科書,所以我從例子開始,具體的完整說明還請查手冊。
1.1轉(zhuǎn)義符號\
前面說過缺省情況下Perl正則表達式要用/包起來,那么現(xiàn)在要尋找一個字符串里面有沒有/怎么辦?不是有歧義了么那個表達式。換你設(shè)計Perl語言該咋辦?玩過C語言的人看到這里一定在嘿嘿笑,因為在C里面簡單,要寫/必須寫成\/,要寫\必須寫成\\。說Perl在語法上是C的表弟是很不錯的,Perl規(guī)定的轉(zhuǎn)義符號也是\.常用的特殊符號有回車\n,跳格\t,斜杠\\和\/,引號\'和\",方括號\[和\],圓括號\(和\),美元號\$,上尖號\^,星號\*,點號\.,問號\?,加號\+。我都是隨手寫的,建議拿不定主意的話,非51個字母的符號都去查查手冊吧。舉例:查一個字符串里有沒有美元號
my$szValue='$6580.90';
$szValue=~/\$/;
1.2或操作
Perl的Perl正則表達式缺省是區(qū)別大小寫的。什么,前面早該告訴你?真可憐,又一個從Windows世界來的小孩,就和我想當(dāng)然以為在美國商店應(yīng)該在復(fù)活節(jié)大做生意創(chuàng)造GDP一樣,可是人家不開門。為了串即匹配"Apple"又匹配"apple",你可以這樣:
$szProductType=~/[Aa]pple/;
在方括號里的字母是"或"的關(guān)系,擊中其中一個就可以了。在一個Perl正則表達式中可以用任意多個方括號,但是不要嵌套。常常能見到的一種表達式
[0-9]
表示0到9這十個字母,也可以用\d來代替。\D則表示非數(shù)字字符。
[a-zA-Z]
表示51個字母。
順便在這里把反義也講了吧,[^0-9]代表非數(shù)字的其它字符,[^a]代表非a的其它字符。^在這里是反義的意思,但是請注意^還能做頭錨用,后面會講到。
1.3尾綴
有人搖頭不喜歡上面的解決方案――我要求真正匹配一個不區(qū)分大小寫的"Apple"應(yīng)該怎么辦?請這樣
$szProductType=~/apple/i;
放在第二個/符號后面的尾綴i取消了一切大小寫檢查。
另外再說兩個有用的尾綴吧,第一個是g(全局匹配),如果有字符串
my$string="Applejuice,appleCider,applejeans,applepie,appleplate,apPLebag,…";
而用表達式$string=~/apple/i;只會遇到第一個apple就結(jié)束?,F(xiàn)在我們可以用尾綴g配合while循環(huán)
while($string=~/(apple.*?),/ig){
print"$1\n";
}
就可以找出所有帶apple的詞匯。注意尾綴是可以疊加使用的。上面Perl正則表達式中的圓括號、點號和問號和$1,下面馬上會講到。
另一個有用的的尾綴是s。s會強迫點號(.)匹配換行符號(\n),這對于多行匹配是必須的。不要小看這個技巧,我花了幾個小時才找到的哦。
1.4捕獲匹配的字符串
my$szValue='$1999.99';
if($szValue=~/\$([0-9]+)\.([0-9]+)/){
print"$1dollors$1cents\n";
}
上面表達式里的加號表示匹配一到多個前面的符號,在這里符號是數(shù)字。用圓括號括住的內(nèi)容,將會依次(從左到右)出現(xiàn)在$1,$1,$3……里面。另外,順便說,整個Perl正則表達式匹配的結(jié)果是放在$&里面,上面這個表達式演算下來$&的值還是"$1999.99"。
另外,還有\(zhòng)1,\1形式的反向引用,使得表達式里面可以用捕獲的字符串。舉例:表達式"(\w)\1{4,}"在匹配"aabbbbabcdefgccccc111111111999999999"時,匹配結(jié)果是:成功;匹配到的內(nèi)容是"ccccc"。再次匹配下一個時,將得到999999999(要用while和/g來配合)。
1.5任意符號.,和次數(shù)符號*以及+
PerlPerl正則表達式里點號是通配任意字母的,例如
$string=~/w.*/i;
就匹配$string里從第一個w字母開始一直到字符串結(jié)束。*表示匹配任意字母0到任意多次。*號也常被換成+號,表示匹配1到任意多次。如果即沒有*也沒有+,那么就是匹配1次。如果要自己定義匹配的次數(shù)或者次數(shù)上下限怎么辦?用{}符號:
$string=~/\d{5,15}/;
上面的式子匹配5到15位數(shù)字
$string=~/\d{10}/;
上面式子匹配10位數(shù)字。
附帶說兩個常用的符號,\S和\s。前者是"非空白",后者是"空白",具體來說包括回車、空格、跳格、響鈴。
1.6貪婪的+和*,止貪劑?
Perl的Perl正則表達式是貪婪的(確切地說,次數(shù)符號+和*是貪婪的),可以幫助你做一些事情。
my$string='$190098';
$string=~/\$(\d+)/;
由于+號的貪婪性,$1會得到值"190098",而不是遇到第一個數(shù)字1就完成匹配。
但有的時候你會不希望他貪婪,希望見好就收。還是我前面用過的一個例子
my$string="Applejuice,appleCider,applejeans,applepie,appleplate,apPLebag,…";
如果用$string=~/(apple.*),/i;
由于*的貪婪性,它會一直匹配到最后一個逗號才停下來,這不是我們想要的結(jié)果。解決辦法是用止貪符號?緊跟在*或者+后面。
$string=~/(apple.*?),/i;
問號會約束*遇到第一個逗號就停下來。
1.7頭錨^和尾錨$
有時候你希望從一個字符串的開始或者結(jié)尾匹配
my$string='Aquickbrownfoxjumpsoveralazysnake';
$string=~/^A/;#匹配第一個字母是否為A
$string=~/snake$/;#匹配最后幾個字母是否為snake
還有一個\b,匹配的是單詞邊界,意思是空白或者開頭或者結(jié)尾。
【編輯推薦】