全面認(rèn)識(shí)Perl正則表達(dá)式使用
Perl正則表達(dá)式是Perl語言的一大特色,也是Perl程序中的一點(diǎn)難點(diǎn),不過如果大家能夠很好的掌握他,就可以輕易地用Perl正則表達(dá)式來完成字符串處理的任務(wù),當(dāng)然在CGI程序設(shè)計(jì)中就更能得心應(yīng)手了。下面我們列出一些Perl正則表達(dá)式書寫時(shí)的一些基本語法規(guī)則。
Perl正則表達(dá)式
Perl正則表達(dá)式之元字符:
.匹配除\n外的任意一個(gè)字符
\轉(zhuǎn)義符
Perl正則表達(dá)式之量詞:
{3}匹配前一單元的三個(gè)*?{0,}?匹配前一單元的零個(gè)或多個(gè)
+?{1,}?匹配前一單元的一個(gè)或多個(gè)
??{0,1}?匹配前一單元的零個(gè)或一個(gè)
*{0,}匹配前一單元的多個(gè)或零個(gè)貪
+{1,}匹配前一單元的多個(gè)或一個(gè)貪
?{0,1}匹配前一單元的一個(gè)或零個(gè)貪
Perl正則表達(dá)式之編組:
()編組且觸發(fā)記憶(?:)編組但不觸發(fā)記憶Perl正則表達(dá)式之多個(gè)選擇:
Perl正則表達(dá)式之文法和算符優(yōu)先級:
'()','(?:)'>
'*','*?','+','+?','?','??','{}','{}?'>
''>
'|'
<regexp>-><regexp>'|'<concat>|<concat>
<concat>-><concat><repeat>|<repeat>
<repeat>-><repeat>('*'|'+'|'?'|'{'<int>'}')|<paren>
<paren>->'('<regexp>')'|'(?:'<regexp>')'|<char>
Perl正則表達(dá)式之字符類:
[abcwxyz]==[a-cw-z]
\d==[0-9]
\D==[^0-9]
\w==[a-zA-Z0-9_]
\W==[^a-zA-Z0-9_]
\s==[\f\t\n\r]
\S==[^\f\t\n\r]
Perl正則表達(dá)式之選項(xiàng)修飾符:
/i使匹配大小寫不敏感
/s使.匹配任意字符,包含'\n',等價(jià)于[\d\D]
/x允許Perl正則表達(dá)式中用空白和注釋來增強(qiáng)可讀性,空格文字和制表符文字等等將被忽略,只能用\s、\t等表示。/m匹配多行目標(biāo)串時(shí),改^和$的意義為行首錨和行尾錨
/g無重疊全局替換修飾符
Perl正則表達(dá)式之錨:
^串首錨
$串尾錨
\b單詞邊界錨參考\w
\B非單詞邊界錨
Perl正則表達(dá)式之綁定算子:
=~非賦值運(yùn)算符也,綁定運(yùn)算符也,It's曰ing:不處理$_了,處理我左邊的那個(gè)家伙Perl正則表達(dá)式插值:
雙引插值規(guī)則Perl正則表達(dá)式之匹配變量
()不僅用于Perl正則表達(dá)式的編組,也觸發(fā)匹配引擎的記憶,引擎會(huì)將整個(gè)匹配段中與括號(hào)內(nèi)Perl正則表達(dá)式對應(yīng)的那部分存入記憶體內(nèi)。自1編號(hào),引用以$1,$2,...
記憶至下一次匹配成功時(shí)結(jié)束$&$MATCH整個(gè)匹配段
$`$PREMATCH匹配段之前的子串
$'$POSTMATCH匹配段之后的子串
Perl正則表達(dá)式舉例:
/^fred|barney$/要么以fred打頭,要么以barney結(jié)尾的串/^(fred|barney)$/
/(wilma|pebbles?)/
/^fred|barney$/m #p#
Perl正則表達(dá)式之文本處理替換:
分隔符規(guī)則:s#^https://#http://#;
s{fred}{barney};
s[fred](barney);
s<fred>#barney#;
綁定算子:=~
大小寫切換:\U此處起至\E全部大寫
\L此處起至\E全部小寫
\u下一個(gè)字母大寫
\l下一個(gè)字母小寫
舉例:s/(bush|mandola)/\u\L$1/ig
Perl正則表達(dá)式之split算子
語法:split/PATTERN/,EXPR,LIMIT
以/PATTERN/分割EXPR,最多分成LIMIT份若LIMIT省略且尾部為空串,則丟棄它若LIMIT為負(fù)值,則視其為無窮大EXPR缺省為$_
/PATTERN/缺省為/\s+/
Perl正則表達(dá)式之列表環(huán)境下的m//:返回引擎記憶體中的變量。
my$data="BarneyRubbleFredFlintstoneWilmaFlintstone";
my%last_name=($data=~/(\w+)\s+(\w+)/g);
my@arr=($data=~/(\w+)\s+(\w+)/g);
Perl正則表達(dá)式之匹配多行文本:
^和$普通模式下是串首錨和串尾錨,在/m(多行模式)下為行首錨和行尾錨
\A匹配串首,\Z匹配串尾
/^nat/m===/^nat|\nnat/
openFILE,$filename
ordie"Can'topen'$filename':$!";
my$lines=join'',<FILE>;
$lines=~s/^/$filename:/gm;
Perl正則表達(dá)式之更新多個(gè)文件:
鉆石符號(hào)<>的魔力:他會(huì)自動(dòng)地為你打開和關(guān)閉在命令行指定的一系列文件,若命令行沒有指定任何文件名,他就打開標(biāo)準(zhǔn)輸入。$^I會(huì)改變<>的行為,若$^I不是undef,則<>會(huì)將文件重命名以"文件名".
"$^I",然后創(chuàng)建名為"文件名"的文件,然后打開重命名后的文件以讀,打開新建的文件以寫。
【編輯推薦】
- 解析Perl正則表達(dá)式用法
- Perl正則表達(dá)式的三種形式
- 學(xué)習(xí)筆記 全面認(rèn)識(shí)Perl正則表達(dá)式
- Perl正則表達(dá)式內(nèi)容盤點(diǎn)
- Perl正則表達(dá)式的三種形式和八大原則