Lua的語(yǔ)法是無(wú)歧義的嗎?
Lua5.0的語(yǔ)法非常簡(jiǎn)潔,這從參考手冊(cè)中的語(yǔ)法定義的規(guī)模(轉(zhuǎn)換成標(biāo)準(zhǔn)BNF形式大概有100個(gè)左右的產(chǎn)生 式)可以看出。不過(guò)簡(jiǎn)潔歸簡(jiǎn)潔,它卻不完全是無(wú)二義性的。下面將用具體例子揭示什么樣的代碼會(huì)引起歧義(執(zhí)行環(huán)境是www.lua.org發(fā)布的 Lua5.04)。
首先定義如下幾個(gè)函數(shù):
- function foo(a)
- print("foo print",a)
- return a
- end
- function goo(a)
- print("goo print",a)
- return a
- end
- function hoo(a)
- print("hoo print",a)
- return a
- end
試看這一段代碼:
foo(goo)
(hoo)(1979)
如果試圖編譯執(zhí)行上面這段程序,那么解釋器就會(huì)報(bào)告 "ambiguous syntax (function call x new statement) near '(' " 這樣的錯(cuò)誤。為什么呢?或許寫(xiě)程序的人原本的意思就是***行foo(goo)為一個(gè)單獨(dú)的函數(shù)調(diào)用語(yǔ)句(statement),而第二行(hoo) (1979)又為另一個(gè)單獨(dú)的函數(shù)調(diào)用語(yǔ)句(Lua中語(yǔ)句之間的分隔符——分號(hào)并非必需,而是可選的)。但是不要忘記了foo(goo)(hoo)是一個(gè) 語(yǔ)法上完全合法的函數(shù)調(diào)用形式(在編譯過(guò)程中換行符作為空白符會(huì)被忽略掉),foo(goo)(hoo)(1979)也可以成為一個(gè)完整的函數(shù)調(diào)用語(yǔ)句。 這樣的話,編譯器就無(wú)法知道程序員的真正意圖了。
我們可以再深入到編譯過(guò)程里頭一點(diǎn)看看。Lua語(yǔ)法的形式定義(轉(zhuǎn)換成BNF標(biāo)準(zhǔn)形式)包含如下幾個(gè)產(chǎn)生式:
(1) stat -> functioncall (語(yǔ)句的產(chǎn)生式)
(2) prefixexp -> functioncall (前綴表達(dá)式的產(chǎn)生式)
(3) functioncall -> prefixexp args
| prefixexp ':' Name args (函數(shù)調(diào)用的產(chǎn)生式)
可以發(fā)現(xiàn),functioncall既可以被規(guī)約(reduce)為stat,也可以被規(guī)約成prefixexp,(1)和(2)兩個(gè)產(chǎn)生式發(fā)生了沖突,編譯器不知道用哪一個(gè)對(duì)foo(goo)進(jìn)行規(guī)約,所以便出現(xiàn)了錯(cuò)誤。
其實(shí)要解決這個(gè)問(wèn)題歧義問(wèn)題也很簡(jiǎn)單,在***行后面加一個(gè)語(yǔ)句分隔符——分號(hào),編譯器就會(huì)把代碼編譯成兩個(gè)獨(dú)立的語(yǔ)句。或者把兩行合并成一行, 那么foo(goo)(hoo)(1979)就被看作是一個(gè)完整的函數(shù)調(diào)用(其實(shí)此時(shí)仍然是有歧義的,但是Lua5.04通過(guò)優(yōu)先選擇prefixexp -> functioncall進(jìn)行規(guī)約解決了二義性)。
實(shí)際上,還有另外3種情況也會(huì)引起歧義:
- -- prefixexp -> functioncall 與
- -- exp -> functioncall 沖突。
- -- 編譯器不知道該把foo(goo)解釋成表達(dá)式(exp)還是前綴表達(dá)式
- local v = foo(goo) (hoo)(1979)
- -- exp -> var 與 prefixexp -> var 沖突
- -- 第二行的變量(var)m不知道該被看成表達(dá)式還是前綴表達(dá)式
- m = foo local v = m (goo)(1979)
- -- prefixexp -> '(' exp ')' 與
- -- exp -> '(' exp ')' 沖突
- -- 不知道該把(t.fn)看成表達(dá)式還是前綴表達(dá)式
- t = {fn = foo} local v = (t.fn) (goo)(1979)
***個(gè)例子中解決歧義的兩種方法同樣也適用于這三種情況。至此我們不難發(fā)現(xiàn),引起歧義的根本原因在于Lua語(yǔ)句之間的分隔符是可選而不是必需的。如果強(qiáng)制 要求象C語(yǔ)言那樣每條語(yǔ)句后跟一個(gè)分號(hào),那么二義性就不復(fù)存在(這一點(diǎn)在本文作者構(gòu)造Lua5.0的SLR解析表時(shí)得到了驗(yàn)證)。但是有許多人未必喜歡敲 入那么多討厭的分號(hào),所以Lua的作者把選擇的權(quán)利留給了程序員自己,付出的代價(jià)就是引進(jìn)了這些模糊的代碼(雖然出現(xiàn)的幾率不大),這也算是語(yǔ)言設(shè)計(jì)時(shí)的 一種折衷吧。
原文鏈接:http://tech.it168.com/j/2008-02-17/200802171001717.shtml