術(shù)語匯編 全面剖析Perl正則表達(dá)式用法
本文和大家重點(diǎn)討論一下Perl正則表達(dá)式的概念以及它的起源,Perl正則表達(dá)式的“祖先”可以一直上溯至對人類神經(jīng)系統(tǒng)如何工作的早期研究。Perl正則表達(dá)式的作用也很明顯,其中之一就是它可以測試字符串的某個(gè)模式,至于其他作用請看本文詳細(xì)介紹。
Perl正則表達(dá)式簡介
1.Perl正則表達(dá)式
如果原來沒有使用過Perl正則表達(dá)式,那么可能對這個(gè)術(shù)語和概念會(huì)不太熟悉。不過,它們并不是您想象的那么新奇。
請回想一下在硬盤上是如何查找文件的。您肯定會(huì)使用?和*字符來幫助查找您正尋找的文件。?字符匹配文件名中的單個(gè)字符,而*則匹配一個(gè)或多個(gè)字符。一個(gè)如'data?.dat'的模式可以找到下述文件:
data1.dat
data2.dat
datax.dat
dataN.dat
如果使用*字符代替?字符,則將擴(kuò)大找到的文件數(shù)量。'data*.dat'可以匹配下述所有文件名:
data.dat
data1.dat
data2.dat
data12.dat
datax.dat
dataXYZ.dat
盡管這種搜索文件的方法肯定很有用,但也十分有限。?和*通配符的有限能力可以使你對Perl正則表達(dá)式能做什么有一個(gè)概念,不過Perl正則表達(dá)式的功能更強(qiáng)大,也更靈活。
2.早期起源
早期起源
Perl正則表達(dá)式的“祖先”可以一直上溯至對人類神經(jīng)系統(tǒng)如何工作的早期研究。WarrenMcCulloch和WalterPitts這兩位神經(jīng)生理學(xué)家研究出一種數(shù)學(xué)方式來描述這些神經(jīng)網(wǎng)絡(luò)。
1956年,一位叫StephenKleene的美國數(shù)學(xué)家在McCulloch和Pitts早期工作的基礎(chǔ)上,發(fā)表了一篇標(biāo)題為“神經(jīng)網(wǎng)事件的表示法”的論文,引入了Perl正則表達(dá)式的概念。Perl正則表達(dá)式就是用來描述他稱為“正則集的代數(shù)”的表達(dá)式,因此采用“Perl正則表達(dá)式”這個(gè)術(shù)語。
隨后,發(fā)現(xiàn)可以將這一工作應(yīng)用于使用KenThompson的計(jì)算搜索算法的一些早期研究,KenThompson是Unix的主要發(fā)明人。Perl正則表達(dá)式的***個(gè)實(shí)用應(yīng)用程序就是Unix中的qed編輯器。
如他們所說,剩下的就是眾所周知的歷史了。從那時(shí)起直至現(xiàn)在Perl正則表達(dá)式都是基于文本的編輯器和搜索工具中的一個(gè)重要部分。
3.使用Perl正則表達(dá)式
在典型的搜索和替換操作中,必須提供要查找的確切文字。這種技術(shù)對于靜態(tài)文本中的簡單搜索和替換任務(wù)可能足夠了,但是由于它缺乏靈活性,因此在搜索動(dòng)態(tài)文本時(shí)就有困難了,甚至是不可能的。
使用Perl正則表達(dá)式,就可以:
1.測試字符串的某個(gè)模式。例如,可以對一個(gè)輸入字符串進(jìn)行測試,看在該字符串是否存在一個(gè)電話號(hào)碼模式或一個(gè)信用卡號(hào)碼模式。這稱為數(shù)據(jù)有效性驗(yàn)證。
2.替換文本??梢栽谖臋n中使用一個(gè)Perl正則表達(dá)式來標(biāo)識(shí)特定文字,然后可以全部將其刪除,或者替換為別的文字。
3.根據(jù)模式匹配從字符串中提取一個(gè)子字符串??梢杂脕碓谖谋净蜉斎胱侄沃胁檎姨囟ㄎ淖?。
例如,如果需要搜索整個(gè)web站點(diǎn)來刪除某些過時(shí)的材料并替換某些HTML格式化標(biāo)記,則可以使用Perl正則表達(dá)式對每個(gè)文件進(jìn)行測試,看在該文件中是否存在所要查找的材料或HTML格式化標(biāo)記。用這個(gè)方法,就可以將受影響的文件范圍縮小到包含要?jiǎng)h除或更改的材料的那些文件。然后可以使用Perl正則表達(dá)式來刪除過時(shí)的材料,***,可以再次使用Perl正則表達(dá)式來
查找并替換那些需要替換的標(biāo)記。
另一個(gè)說明Perl正則表達(dá)式非常有用的示例是一種其字符串處理能力還不為人所知的語言。VBScript是VisualBasic的一個(gè)子集,具有豐富的字符串處理功能。與C類似的VisualBasicScriptingEdition則沒有這一能力。Perl正則表達(dá)式給VisualBasicScriptingEdition的字符串處理能力帶來了明顯改善。不過,可能還是在VBScript中使用Perl正則表達(dá)式的
效率更高,它允許在單個(gè)表達(dá)式中執(zhí)行多個(gè)字符串操作。
本篇文章來自<A>IDC專家網(wǎng)</a>原文鏈接:http://www.soidc.net/articles/1213781277395/20000824/1215945421383_1.html
【編輯推薦】