實(shí)例解析Perl命令行實(shí)用程序
本文和大家重點(diǎn)學(xué)習(xí)一下Perl命令行參數(shù),Perl命令行實(shí)用程序那些將Perl用作編程語言的人經(jīng)常忽視了:Perl用作Perl命令行操作的快速而又難看的腳本編制引擎時(shí)是很有用的。
Perl命令行實(shí)用程序
Perl命令行實(shí)用程序那些將Perl用作編程語言的人經(jīng)常忽視了:Perl用作Perl命令行操作的快速而又難看的腳本編制引擎時(shí)是很有用的。通過Perl命令行,Perl僅用一行就可以實(shí)現(xiàn)大多數(shù)其它語言需要數(shù)頁代碼才能完成的任務(wù)。跟著Teodor,他會(huì)教給您一些有用的示例。
為了完成這一篇how-to文章,您需要在系統(tǒng)上安裝Perl5.6.0。您的系統(tǒng)最好安裝比較新(2000或更新)的Linux或Unix,但是其它操作系統(tǒng)也能照樣工作。所有的示例都使用tcshshell(盡管bash及其它shell也能工作)。雖然這些示例也許可以和較早版本的Perl、Linux及其它操作系統(tǒng)一起工作,但是如果它們不能一起工作,那么它們無法工作的原因可以作為練習(xí),讓讀者去解決。
我想說的第一點(diǎn)是:有經(jīng)驗(yàn)的程序員不應(yīng)回避快速而又難看的解決方案。在其它專欄文章中,我已經(jīng)強(qiáng)調(diào)了文檔編制和徹底性。本專欄文章將集中在編程的消極面,其中文檔編制是可選的,而咖啡因卻無從選擇。因?yàn)槲覀円呀?jīng)身陷其中。
第二點(diǎn)和第一點(diǎn)一樣重要:快速而又難看的解決方案很難正確完成。如果您知道如何記錄、測(cè)試和調(diào)試完整的腳本,那么您就非常有可能在一行程序中取得成功。如果您不知道怎樣做,那么這就像是企圖用鯡魚來砍倒紅杉樹(而您的技能就是那條鯡魚)。
第一步,您應(yīng)該學(xué)習(xí)shell的特性:Unix將Perl命令行參數(shù)傳遞給Perl的方式及這些參數(shù)的Perl解釋方法。#p#
Perl命令行的實(shí)質(zhì)
在Unix中您將看到可執(zhí)行任務(wù)的概念,一個(gè)進(jìn)程通常是裝入內(nèi)存的程序。除了初始進(jìn)程外,進(jìn)程都可以由其它進(jìn)程來啟動(dòng),初始進(jìn)程通常是由內(nèi)核(有時(shí)由內(nèi)核進(jìn)程)來啟動(dòng)的。就用戶的觀點(diǎn)而言,啟動(dòng)進(jìn)程需要shell或啟動(dòng)程序。因此,當(dāng)用戶在shellPerl命令行輸入"xeyes"或者從啟動(dòng)程序菜單(類似于GNOME任務(wù)欄)選擇XEyes應(yīng)用程序時(shí),shell或啟動(dòng)程序創(chuàng)建新的進(jìn)程以運(yùn)行該程序。
進(jìn)程獲得Perl命令行參數(shù)。因此,例如,"perl"和"perl-w"是對(duì)同一個(gè)程序的兩種不同調(diào)用。在內(nèi)部,Perl(類似于C)將參數(shù)傳遞給它用@ARGV數(shù)組解釋的腳本。但是和C不同的是,Perl偷偷地從腳本中"竊取"其中一些參數(shù)以用于自己的用途。例如,正在解釋的腳本看不到傳給Perl解釋器的"-w"參數(shù),除非腳本看來需要它。shell用空格字符隔開參數(shù)。
傳給Perl的"-e"參數(shù)告訴Perl獲取Perl命令行中"-e"后的任何內(nèi)容并將它當(dāng)作腳本來運(yùn)行。"-M"參數(shù)表示獲取其后的任何內(nèi)容并將該內(nèi)容作為模塊導(dǎo)入,類似于正規(guī)腳本中的"useModuleName"。請(qǐng)參閱perldocperlrun頁面以獲取有關(guān)Perl必須從Perl命令行提供的開關(guān)的更多信息。
可能最好在這里舉些示例。根據(jù)本專欄文章的精神,讓我們使用一行程序。腳本的-MData:umper-e'printDumper-@ARGV'部分只是打印出了@ARGV數(shù)組的內(nèi)容。
清單1.Perl命令行參數(shù)
- #atthecommandline,typeeachlineafterthe'>'
- #andyou'llgettheoutputthat
- #followsit
- #printthe@ARGVcontentswithnoprogramarguments
- >perl-MData:umper-e'printDumper\@ARGV'
- $VAR1=[];
- #printthe@ARGVcontentswitharguments"a"and"b"
- >perl-MData:umper-e'printDumper\@ARGV'ab
- $VAR1=[
- 'a',
- 'b'
- ];
- #printthe@ARGVcontentswithwarningson,andarguments"a"and"b"
- >perl-w-MData:umper-e'printDumper\@ARGV'ab
- $VAR1=[
- 'a',
- 'b'
- ];
- #printthe@ARGVcontentswitharguments"a","b",and"-w"
- #notehowthe-wisnotstolenbyPerlifitfollowsarguments
- #thatPerlknowsitdoesn'twant
- >perl-MData:umper-e'printDumper\@ARGV'ab-w
- $VAR1=[
- 'a',
- 'b',
- '-w'
- ];
- Hereisthefinallinethatincludessome
除非您的shell限制了參數(shù)的數(shù)量或長度,不然您可以向Perl傳遞任意數(shù)量的參數(shù)。在Perl中打開神奇的文件句柄(filehandle)<>,這會(huì)將傳送給Perl的每個(gè)參數(shù)作為文件名打開并逐行讀取每個(gè)文件的內(nèi)容。缺省情況下,$_變量會(huì)保存每一行。
Shell使引號(hào)之間的所有內(nèi)容都成為一個(gè)參數(shù)。這就是為什么在清單1中我們可以寫成-e'printDumper\@ARGV'并且Perl可以將其看成單個(gè)一行程序腳本的原因。單引號(hào)更好,因?yàn)槭褂脝我?hào)后您可以在一行程序內(nèi)使用雙引號(hào)。Perl中的雙引號(hào)用于解釋雙引號(hào)之間的任何內(nèi)容。另一個(gè)示例或許會(huì)有助于進(jìn)一步說明這一點(diǎn):
清單2.單引號(hào)vs.雙引號(hào)
- #printthePerlprocessID,followedbyanewline
- >perl-e'print"$$\n"'
- 2063
- #error:thefirsttwodoublequotesgotogether,therestispassed
- #tothescriptdirectly
- >perl-e"print"$$\n""
- Barewordfoundwhereoperatorexpectedat-eline1,near"1895n"
- (Missingoperatorbeforen?)
- syntaxerrorat-eline1,nexttoken???
- Executionof-eabortedduetocompilationerrors.
用bash比用tcsh要好些,因?yàn)閎ash允許內(nèi)部的雙引號(hào)用\字符進(jìn)行轉(zhuǎn)義。但是shell仍然在將雙引號(hào)內(nèi)的$$傳遞給Perl之前對(duì)其進(jìn)行解釋。結(jié)論是:不要使用雙引號(hào)來指定以-e開始的一行程序腳本參數(shù)。請(qǐng)參閱perldocperlrun以獲取更多的詳細(xì)信息,但是您主要應(yīng)清楚什么在系統(tǒng)上有效并堅(jiān)持下去。
到目前為止您已經(jīng)了解了-e和-M開關(guān)所起的作用:導(dǎo)入模塊和運(yùn)行語句。下面我列出了一些有用的其它開關(guān);為了不把您搞糊涂,所以省略了那些更復(fù)雜的開關(guān)。請(qǐng)參閱perldocperlrun以獲取完整的列表和一些使用想法。
整潔性
-w
打開警告
-Mstrict
打開嚴(yán)格編譯指示(pragma)
數(shù)據(jù)
-0
(這是個(gè)零)指定輸入記錄分隔符
-a
將數(shù)據(jù)分割成名為@F的數(shù)組
-F
指定分割時(shí)-a使用的模式(請(qǐng)參閱perldoc-fsplit)
-i
在適當(dāng)?shù)奈恢镁庉嬑募ㄕ?qǐng)參閱perldocperlrun以獲取大量詳細(xì)信息)
-n
使用<>將所有@ARGV參數(shù)當(dāng)作文件來逐個(gè)運(yùn)行
-p
和-n一樣,但是還會(huì)打印$_的內(nèi)容
執(zhí)行控制
-e
指定字符串以作為腳本(多個(gè)字符串迭加)執(zhí)行
-M
導(dǎo)入模塊
-I
指定目錄以搜索標(biāo)準(zhǔn)位置前的模塊。#p#
文件操作
假定您在一個(gè)目錄中有一些文件需要用特定的方式重命名。例如,所有包含單詞"aaa"的文件應(yīng)進(jìn)行重命名,用單詞"bbb"進(jìn)行代替。我們將不使用Unix"mv"命令,因?yàn)橛肞erl的rename()函數(shù)來重命名文件已經(jīng)相當(dāng)不錯(cuò)了(請(qǐng)參閱perldoc-frename以獲取當(dāng)使用rename()出問題時(shí)的詳細(xì)信息)。
請(qǐng)參閱清單3以獲取將文件從aaa重命名為bbb的一行程序腳本。
find.命令打印出當(dāng)前目錄下的所有文件和目錄列表。如果您只想要查看文件,那么就給find添加"-typef"參數(shù)。獲取find的輸出(一個(gè)文件列表)并將其傳遞給一行程序。
一行腳本使用-ne參數(shù),該意味著它會(huì)被重寫成:
清單4.將文件從aaa重命名為bbb(已分解)
- while(<>)
- {
- chomp;#trimthenewlinefromthefilename
- nextunless-e;#thefilename($_)mustexist
- $oldname=$_;#$oldnameisnow$_
- s/aaa/bbb/;#changeall"aaa"to"bbb"in$_
- nextif-e;#thenewfilenamemustn'texist
- rename$oldname,$_;#renametheoldtothenewname
- }
正如您所看到的那樣,這是個(gè)相當(dāng)復(fù)雜的七行腳本。-n開關(guān)簡(jiǎn)化了很多東西。但是盡管如此,您還是必須知道$_變量和s///及-e運(yùn)算符(請(qǐng)參閱perldocperlop頁面以獲取詳細(xì)信息)。File::Find標(biāo)準(zhǔn)Perl模塊本來可以代替Unixfind命令用于進(jìn)行文件查找,但是腳本也會(huì)隨之變得太大而不再是一行程序了。
一行程序巧妙地平衡了有用性和復(fù)雜性,您必須準(zhǔn)備好在需要時(shí)將它們重寫成實(shí)際腳本,而不應(yīng)讓程序過于麻煩而無法控制。
下面是文件處理的另一個(gè)示例:用已知的命名結(jié)構(gòu)瀏覽MP3文件的目錄并抽取專輯名。讓我們假設(shè)文件名是"Artist-Album-Track#-Song.mp3"。
清單5.查找Artist-Album-Track#-Song.mp3的專輯名
>find.-name"*.mp3"|perl-pe's/.\/\w+-(\w+)-.*/$1/'|sort|uniq
這個(gè)腳本非常簡(jiǎn)單。它依靠find的行為,總是在每個(gè)文件名前打印"./"。隨后它僅用專輯名代替$_,并且-p開關(guān)自動(dòng)打印專輯名。最后,按順序的sort和uniq確保了重復(fù)的專輯名只打印一次。所有的find、sort和uniq調(diào)用都可以用Perl完成,但是在操作系統(tǒng)已經(jīng)為我們編寫了這一切時(shí)為何還煩惱呢?作為練習(xí)這會(huì)很有趣,但是實(shí)際上一行程序可能會(huì)變成20-30行不必要的代碼。
讓我們分解Perl腳本(用一種簡(jiǎn)化的方式-省略-p開關(guān)的一些復(fù)雜性):
清單6.查找Artist-Album-Track#-Song.mp3的專輯名(已分解)
- while(<>)
- {
- s/.\/\w+-(\w+)-.*/$1/;#extractthealbumnameinto$_
- }continue
- {
- print;#printthealbumname
- }
此外,請(qǐng)注意Perl是如何成為find、sort和uniq之間的中間工具的。不必嘗試用Perl編寫所有東西。您可以這么做,有時(shí)也必須這么做,但一行程序可以重用。還有,看看正則表達(dá)式是多么的簡(jiǎn)單。當(dāng)然,如果MP3文件未正確命名,那么我們可能會(huì)獲得一些異常的專輯名,但是這值得去盡力完善正則表
【編輯推薦】
- Perl命令行常見用法及技巧揭秘
- 常用Perl命令行參數(shù)應(yīng)用介紹
- 淺析Perl命令行應(yīng)用
- Perl命令行用法解析
- 五大常用Perl命令行參數(shù)應(yīng)用介紹