我從Icon編程語言中所學(xué)到的
在20世紀(jì)70年代末和80年代初期,Icon 編程語言主要由拉爾夫•格里斯沃爾德(Ralph Griswold)所設(shè)計(jì)的。在60年代,格里斯沃爾德負(fù)責(zé)過***個專門用于處理文本的編程語言 ――Snobol(String Orientated Symbolic Language)。Icon是基于Snobol思想而設(shè)計(jì)的下一代語言,然而它更加統(tǒng)一和完整。
在很多方面﹐Icon是***個“腳本語言”。它是一種非常高級別,具備出色的能力去處理文本數(shù)據(jù)并與其環(huán)境相結(jié)合的語言。迄今為止,它都是如此超前,這也許是它從沒有很流行的一個原因。早在Perl和TCL(這些語言開啟了腳本語言的熱潮)崛起之前好幾年,它就已經(jīng)出現(xiàn)了。
對于一個泡在BASIC、Fortran、PL/I、Pascal和C里成長起來的人,Icon就是個徹頭徹尾的異類。然而它教會了我許多至今都很有用的東西。
空集(Nullology)
當(dāng)你調(diào)用一個Icon函數(shù),它會做以下兩件事之一:它可以返回一個值,或者它會失效。失效聽上去類似于現(xiàn)代的異常處理機(jī)制,但是Icon的失效有以下幾個不同。首先,當(dāng)一個Icon函數(shù)失效時,沒有指標(biāo)說明它為什么失效。再者,失效是預(yù)期的。它總在發(fā)生,而且是Icon工作方式的一個重要部分。(它有一個單獨(dú)的、原始的、針對真正異常條件的錯誤處理機(jī)制。)
許多Icon的函數(shù)都是生成器(generator)――它們可以返回多個值。在某些情況下,Icon將持續(xù)調(diào)用該函數(shù)直到它失效。所以在Icon里,失效真正的意思是“沒有更多的值”。例如,下面是一個完整的Icon程序,把它的輸入復(fù)制到它的輸出:
- every write(read())
子句Every表示“這樣做直到它失效”。write()把它的參數(shù)寫到標(biāo)準(zhǔn)輸出,read()從標(biāo)準(zhǔn)輸入返回連續(xù)的行,最終在達(dá)到文件結(jié)束時失效。
在C語言里,失效通常被一些特殊保留的返回值,或者其他特設(shè)機(jī)制所表示(那些失效指標(biāo)都太容易被遺漏)。直接從C轉(zhuǎn)到Icon后,上面那個小程序驚醒了我,讓我見識到了簡潔、傳神的美感。
***課
重要的是去區(qū)分有和沒有?;蛘呤且粋€函數(shù)的返回值,或者是一個變量的值,重要的是要能說“沒有一個”。
這一課幫我在幾年后認(rèn)識到異常,也使我領(lǐng)會到其它語言,例如Lisp, Smalltalk, Ruby和(在某種程度上)Java,它們的變量包含可以為空的引用,而不是直接存儲數(shù)據(jù)。
一致性(Uniformity)
Icon是***個讓我用表達(dá)式語言做嚴(yán)肅工作的語言。也就是說,Icon沒有語句,只有包含結(jié)果值的表達(dá)式。我***次看到這個:
- sign := if count > 0 then 1 else -1
起初我真的很困惑,但很快我就明白是怎么回事。在Icon里,我所用來思考的“if語句”事實(shí)上只是一個“if表達(dá)式”,就像在別處一樣,它會有一個結(jié)果值。為什么不應(yīng)該呢?我曾經(jīng)思考過這個問題,語句和我所熟悉的語言里的表達(dá)式之間的區(qū)別好像是人為的和任意的。進(jìn)一步使用Icon的經(jīng)歷證明了這一點(diǎn)。這當(dāng)然可能造成濫用構(gòu)造,產(chǎn)生費(fèi)解的代碼。但是有時它們正是你做正確的事情所需要的。
第二課
通常情況下,你認(rèn)為根本不相同的事情事實(shí)上完全相同。不要想當(dāng)然認(rèn)為你在某處學(xué)到的就是普遍真理。
這么多年來,這一課幫助我用許多新東西迅速武裝我的頭腦,包括語言,工具,編程范式和平臺。
事實(shí)(Truth)
我已經(jīng)提到了生成器和失效的語義。然而一旦你有可以返回多個值甚至失效的表達(dá)式,就出現(xiàn)一個問題――類似 E1 | E2 這樣的表達(dá)式是什么意思?在多個值有意義的上下文,你可能需要一個定義;但是在傳統(tǒng)環(huán)境下,你可能需要一個不同的。所以看起來熟悉的結(jié)構(gòu)就像人們所習(xí)慣的。我不會討論細(xì)節(jié)(畢竟這不是一節(jié)Icon課),但是Icon設(shè)計(jì)師們能夠找到一個能工作在傳統(tǒng)結(jié)構(gòu)和新結(jié)構(gòu)兩種情況下的表達(dá)式,Icon思路共存,沒有特殊情況。所以,你可以做所有這些事情:
- if (i = 1 | i = 0) then ...
- if i = (1|0) then ...
- every write(read("header") | read("body") | read("footer"))
并且它們實(shí)現(xiàn)你所期待的。在上例中,“|”像一個連接操作符,結(jié)果是連接那三個文件。但是操作符的實(shí)際語義是不變的――所有這三個例子使用單一的“|”定義,結(jié)合生成器,表達(dá)式失效和目標(biāo)導(dǎo)向評估。
第三課
我們所受的關(guān)于編程的教育正如我們所學(xué)的科學(xué)――很方便想到世界是如何真正運(yùn)轉(zhuǎn),但事實(shí)是我們就是不知道??茖W(xué)給予我們的是似乎能解釋世界的理論,因?yàn)樗鼈兎纤形覀兯芟氲降膶?shí)驗(yàn)。但是隨著我們對世界的了解不斷擴(kuò)大,遲早我們會認(rèn)識到之前的理論只是一個近似。一旦事情變得足夠快,足夠大,牛頓是不夠的,我們需要愛因斯坦。(然后它們變得足夠小,我們就需要普朗克和波爾)。單值函數(shù),布爾邏輯是足夠的,但當(dāng)把生成器投向混合后,你就需要更多地東西。
這節(jié)課已經(jīng)幫了我很多次去處理復(fù)雜、混亂、有時前矛后盾的商業(yè)規(guī)則和需求。受Icon例子的啟發(fā),我經(jīng)常成功找到更深、更簡單、更普遍的規(guī)則,能作為純粹的變化支持所有表面的合并。
表達(dá)(Representation)
當(dāng)遇到Icon時,我還是一個Unix用戶,我已經(jīng)相當(dāng)精通用作文本模式的正則表達(dá)式。Icon有一種極其復(fù)雜的文本模式機(jī)制,不是基于正則表達(dá)式,但是實(shí)際上更強(qiáng)大。(經(jīng)過Perl 6幾層經(jīng)典正則表達(dá)式添加,Perl的正則表達(dá)式最終實(shí)現(xiàn)了威力相當(dāng)于Icon模式的功能。但那是另一個故事了。)
語言和協(xié)議往往用看起來像簡單的算數(shù)表達(dá)式的語法來描述:
- X := T | T "+" X
- T := E | E "*" T
- E := "x" | "y" | "z" | "(" X ")"
(僅支持變量x, y和z的加法和乘法。)
盡管很強(qiáng)大,但不可能實(shí)現(xiàn)一個像使用經(jīng)典的正則表達(dá)式那樣的語法解析器。(如果你以某種方式成功,也將會非常困難去維護(hù)和擴(kuò)展該解析器。)
但是使用Icon的可編程模式機(jī)制,你可以實(shí)現(xiàn)這樣的解析器:
- procedure X()
- suspend [T()] | [T(), ="+", X()]
- end
- procedure T()
- suspend [E()] | [E(), ="*", T()]
- end
- procedure E()
- suspend [="x" | ="y" | ="z"] | [="(", X(), =")"]
- end
哇!這看起來就像語法!事實(shí)上會真的很容易去用語法編寫程序以生成解析器!
你可以這樣調(diào)用它:
- parseTree = line ? {X()}
Icon里的yacc是一個為期一天的黑客。
第四課
語法很重要。如果語法適合問題域(problem domain),程序則很容易理解。這就是為什么如果一種語言要很好的處理繁雜的數(shù)據(jù)時,即使它是一個危險的語言功能、容易被濫用,但操作符重載是必不可少的。強(qiáng)大的正則表達(dá)式看上去就像“正則表達(dá)式”。
這一課讓我知道什么時候去寫一點(diǎn)特定領(lǐng)域語言,而不是試圖擠入我現(xiàn)有語言的領(lǐng)域。(通常這是一個很容易的事情。)它把我推向動態(tài)的、可塑的語言,如Ruby(我敢說還有Lisp)更主流的東西。
(語法很重要這一課也大大加強(qiáng)――但以消極的方式――在每次我使用XSLT時。幸運(yùn)的是,很快我就能使用XQuery去做所有現(xiàn)在得用XSLT去做的工作。)
(全文完)
英文原文:Glenn Vanderburg,感謝@dryrun 的翻譯