自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

學習筆記 全面認識Perl正則表達式

開發(fā) 架構(gòu)
Perl正則表達式的概念你是否熟悉,Perl正則表達式也經(jīng)常被稱為模式,用來描述或者匹配一系列符合某個句法規(guī)則的字符串。

本文和大家重點討論一下Perl正則表達式,確切地說是Dosshell和Unixshell使用的Perl正則表達式符號,Perl的Perl正則表達式規(guī)則與這兩些shell的都有所不同,但Perl的Perl正則表達式影響最大,幾乎成了業(yè)界標準。

Perl正則表達式(RegularExpression,regex)

如果要問我Perl語言的優(yōu)點,我會說有三個半。前三個是Perl正則表達式、哈希、引用,那半個是Map,因為還不大會用,不太說得出它的秒處,所以算半個。其實哈希、引用、Map都算是數(shù)據(jù)結(jié)構(gòu)的范疇;Perl正則表達式和它們差異比較大。人類的思維里有很多Perl正則表達式的痕跡,甚至用這種方式訓練下一代。比如一位完全文科思維的幼兒園教師,也會教育她的學生從一桶積木里找出一個紅的方塊來。"紅而且方的積木",這就是一個自然語言的Perl正則表達式。Perl正則表達式也經(jīng)常被稱為模式,用來描述或者匹配一系列符合某個句法規(guī)則的字符串。
一定有人還記得在dos和Unix下面的這些命令:

$ls-limg1?.jpg
C:>dir*.exe

這里的星號通配符和問號通配符就是Perl正則表達式符號,確切地說是Dosshell和Unixshell使用的Perl正則表達式符號。Perl的Perl正則表達式規(guī)則與這兩些shell的都有所不同,但Perl的Perl正則表達式影響最大,幾乎成了業(yè)界標準,以至于近年來新建的一些計算機語言都要申明自己實現(xiàn)了Pcre(Perl兼容的Perl正則表達式),要不然都不好意思出來混江湖(微軟除外)。

Perl正則表達式的使用很簡單(其實實現(xiàn)起來很難),跟我來:

1.Perl正則表達式相關(guān)的操作符

先不說Perl正則表達式本身,下面我們的Perl正則表達式就用"apple".先定義一個字符串
my$szProductType="applecider";
現(xiàn)在要檢驗它里面有沒有字符串"apple"。
if($szProductType=~/apple/){
print$szProductType."\n";

}

上面的=~要看做一個符號,是Perl的Perl正則表達式匹配操作符。這個符號匹配成功返回1,否則返回0。后面的兩個/之間包括的就是Perl正則表達式,這是就是apple。Perl正則表達式也可以不用/符號而改用其它符號包括,鑒于海馬一向厭惡這種標新立異做無用功的行為,就不說怎么操作了,偏執(zhí)到不喜歡/符號的人請自己去查Perl手冊吧。如果要求匹配一個字符串里面沒有"apple"怎么辦?當然可以這樣(花括號里該寫什么自己寫吧,我省略啦)
unless($szProductType=~/apple/){}
還可以這樣
if(!($szProductType=~/apple/)){}

但是,為了表示你很懂Perl,你應(yīng)該這樣,這也是我最喜歡的方式(畫外音:這和前面那個被批判的標新立異有啥區(qū)別,嗯?),使用不匹配操作符號!~。
if($szProductType!~/apple/)){}
最后,為了避免被人看穿自己很不懂Perl,看到下面的表達式的時候千萬不要露怯
if($szProductType!~m/apple/)){}
這個m是干什么的?答案是,這個地方有m沒m一樣的,都是表示匹配(match)。請直接無視之。對于匹配操作符也是一樣的情況。#p#

2.Perl正則表達式語法

所謂Perl正則表達式,就是一串特別設(shè)計過的字符串,可以按照你的意圖用匹配操作尋找你要求的目標。我這里不是Perl手冊,也不是教科書,所以我從例子開始,具體的完整說明還請查手冊。

2.1轉(zhuǎn)義符號\

前面說過缺省情況下Perl正則表達式要用/包起來,那么現(xiàn)在要尋找一個字符串里面有沒有/怎么辦?不是有歧義了么那個表達式。換你設(shè)計Perl語言該咋辦?玩過C語言的人看到這里一定在嘿嘿笑,因為在C里面簡單,要寫/必須寫成\/,要寫\必須寫成\\。說Perl在語法上是C的表弟是很不錯的,Perl規(guī)定的轉(zhuǎn)義符號也是\.常用的特殊符號有回車\n,跳格\t,斜杠\\和\/,引號\'和\",方括號\[和\],圓括號\(和\),美元號\$,上尖號\^,星號\*,點號\.,問號\?,加號\+。我都是隨手寫的,建議拿不定主意的話,非52個字母的符號都去查查手冊吧。舉例:查一個字符串里有沒有美元號

my$szValue='$6580.90';
$szValue=~/\$/;

2.2或操作

Perl的Perl正則表達式缺省是區(qū)別大小寫的。什么,前面早該告訴你?真可憐,又一個從Windows世界來的小孩,就和我想當然以為在美國商店應(yīng)該在復活節(jié)大做生意創(chuàng)造GDP一樣,可是人家不開門。為了串即匹配"Apple"又匹配"apple",你可以這樣:
$szProductType=~/[Aa]pple/;
在方括號里的字母是"或"的關(guān)系,擊中其中一個就可以了。在一個Perl正則表達式中可以用任意多個方括號,但是不要嵌套。常常能見到的一種表達式
[0-9]
表示0到9這十個字母,也可以用\d來代替。\D則表示非數(shù)字字符。
[a-zA-Z]
表示52個字母。
順便在這里把反義也講了吧,[^0-9]代表非數(shù)字的其它字符,[^a]代表非a的其它字符。^在這里是反義的意思,但是請注意^還能做頭錨用,后面會講到。

2.3尾綴

有人搖頭不喜歡上面的解決方案――我要求真正匹配一個不區(qū)分大小寫的"Apple"應(yīng)該怎么辦?請這樣
$szProductType=~/apple/i;
放在第二個/符號后面的尾綴i取消了一切大小寫檢查。

另外再說兩個有用的尾綴吧,第一個是g(全局匹配),如果有字符串
my$string="Applejuice,appleCider,applejeans,applepie,appleplate,apPLebag,…";
而用表達式$string=~/apple/i;只會遇到第一個apple就結(jié)束。現(xiàn)在我們可以用尾綴g配合while循環(huán)
while($string=~/(apple.*?),/ig){
print"$1\n";
}

就可以找出所有帶apple的詞匯。注意尾綴是可以疊加使用的。上面Perl正則表達式中的圓括號、點號和問號和$1,下面馬上會講到。

另一個有用的的尾綴是s。s會強迫點號(.)匹配換行符號(\n),這對于多行匹配是必須的。不要小看這個技巧,我花了幾個小時才找到的哦。

2.4捕獲匹配的字符串

my$szValue='$1999.99';
if($szValue=~/\$([0-9]+)\.([0-9]+)/){
print"$1dollors$2cents\n";
}

上面表達式里的加號表示匹配一到多個前面的符號,在這里符號是數(shù)字。用圓括號括住的內(nèi)容,將會依次(從左到右)出現(xiàn)在$1,$2,$3……里面。另外,順便說,整個Perl正則表達式匹配的結(jié)果是放在$&里面,上面這個表達式演算下來$&的值還是"$1999.99"。

另外,還有\(zhòng)1,\2形式的反向引用,使得表達式里面可以用捕獲的字符串。舉例:表達式"(\w)\1{4,}"在匹配"aabbbbabcdefgccccc111121111999999999"時,匹配結(jié)果是:成功;匹配到的內(nèi)容是"ccccc"。再次匹配下一個時,將得到999999999(要用while和/g來配合)。

2.5任意符號.,和次數(shù)符號*以及+

Perl正則表達式里點號是通配任意字母的,例如
$string=~/w.*/i;
就匹配$string里從第一個w字母開始一直到字符串結(jié)束。*表示匹配任意字母0到任意多次。*號也常被換成+號,表示匹配1到任意多次。如果即沒有*也沒有+,那么就是匹配1次。如果要自己定義匹配的次數(shù)或者次數(shù)上下限怎么辦?用{}符號:
$string=~/\d{5,15}/;
上面的式子匹配5到15位數(shù)字
$string=~/\d{20}/;
上面式子匹配20位數(shù)字。
附帶說兩個常用的符號,\S和\s。前者是"非空白",后者是"空白",具體來說包括回車、空格、跳格、響鈴。

2.6貪婪的+和*,止貪劑?

Perl的Perl正則表達式是貪婪的(確切地說,次數(shù)符號+和*是貪婪的),可以幫助你做一些事情。
my$string='$290098';
$string=~/\$(\d+)/;
由于+號的貪婪性,$1會得到值"290098",而不是遇到第一個數(shù)字2就完成匹配。

但有的時候你會不希望他貪婪,希望見好就收。還是我前面用過的一個例子
my$string="Applejuice,appleCider,applejeans,applepie,appleplate,apPLebag,…";

如果用$string=~/(apple.*),/i;
由于*的貪婪性,它會一直匹配到最后一個逗號才停下來,這不是我們想要的結(jié)果。解決辦法是用止貪符號?緊跟在*或者+后面。
$string=~/(apple.*?),/i;
問號會約束*遇到第一個逗號就停下來。

2.6頭錨^和尾錨$

有時候你希望從一個字符串的開始或者結(jié)尾匹配
my$string='Aquickbrownfoxjumpsoveralazysnake';
$string=~/^A/;#匹配第一個字母是否為A
$string=~/snake$/;#匹配最后幾個字母是否為snake
還有一個\b,匹配的是單詞邊界,意思是空白或者開頭或者結(jié)尾。#p#

3.其它相關(guān)函數(shù)及注意事項

3.1替換功能和quotemeta

有時候你不僅希望找到你想要那些字符串,還想替換掉它們。還記得前面說的匹配符后面的m符號么?現(xiàn)在是使用另一個,s符號(替換,subplace)的時候了。
$string=~s/apple/apple/i;
上面表達式將$string里所有不用形式的apple統(tǒng)一成全小寫的apple.這里面可以用變量:
$string=~s/$string1/$string2/i;
$string里所有匹配$string1的地方都會被替換成$string2。但是,要注意,除非你能確保$string1里面不含任何特殊符號(+-*^$.()[]等)或者你需要的就是那些符號,最好在調(diào)用上面式子之前處理一下$string1
$string1=quotemeta($string1);
quotemeta()的作用是給字符串里的特殊符號加上合適的轉(zhuǎn)義符號。注意,不需要給$string2做這個處理。

3.2不要在while里改變字符串

還記得2.3里面的while循環(huán)么?警告:不要在while循環(huán)里改變$string的值,否則可能會陷入無限循環(huán)。如果你真得這樣做,把$string復制一次,一個鏡像用來循環(huán),一個用來做替換。

3.3study及提高性能

有很多人想了很多種辦法來提高PerlPerl正則表達式的性能,我一概記不住。如果你要處理的字符串很龐大。。。記得在對它使用Perl正則表達式之前用官方方法對它study一下:
study($string);
據(jù)說這樣可以提高一點性能。其實如果要性能,還是建議用Java,Java也有Perl正則表達式;或者對性能有更高要求的話,建議用C/C++。標準的C和C++都不支持Perl正則表達式,但有一些函數(shù)庫可以輔助C/C++程序員完成這一功能,其中最著名的當數(shù)PhilipHazel的Perl-CompatibleRegularExpression庫,許多Linux發(fā)行版本都帶有這個函數(shù)庫。使用方法看這里
http://www.chinaunix.net/jh/23/303346.html

在Windows上面,VC.NET(VC7)框架里是有Perl正則表達式了。警告:微軟的老大們并沒有實現(xiàn)Perl兼容。例如,在Perl中,{,1}是{0,1}的簡寫,但.NET并不支持。具體看這里
http://msdn2.microsoft.com/en-us/library/xbyh1eyc.aspx

【編輯推薦】

  1. 淺析Perl正則表達式在PHP的實現(xiàn)
  2. Perl基礎(chǔ) Perl復雜數(shù)據(jù)結(jié)構(gòu)
  3. Perl學習筆記 Perl雙引號和單引號的區(qū)別
  4. 揭秘Perl變量中Perl純變量用法
  5. 解析Perl面向?qū)ο缶幊痰膬煞N實現(xiàn)方式

 

責任編輯:佚名 來源: debagua.com
相關(guān)推薦

2010-07-14 09:47:04

Perl正則表達式

2010-07-21 10:43:25

Perl正則表達式匹配

2010-07-19 10:40:16

Perl正則表達式

2010-07-13 17:03:53

Perl正則表達式

2010-07-14 09:01:18

Perl正則表達式

2010-07-14 09:37:46

Perl正則表達式

2010-07-20 16:25:50

Perl正則表達式

2009-08-13 15:24:27

C#正則表達式

2009-08-11 13:00:41

C#正則表達式

2010-07-22 09:12:05

Perl正則表達式

2016-11-10 16:21:22

Java 正則表達式

2015-04-16 11:16:05

PHPPOSIX正則表達式

2010-03-03 13:09:10

Linux正則表達式

2010-03-03 12:53:50

Linux正則表達式

2010-03-03 12:58:41

Linux正則表達式

2010-07-14 10:06:55

Perl正則表達式

2010-03-03 11:03:51

Linux正則表達式

2010-03-03 13:31:25

Linux正則表達式

2010-03-03 10:51:32

正則表達式

2018-09-27 15:25:08

正則表達式前端
點贊
收藏

51CTO技術(shù)棧公眾號