神奇的自產(chǎn)生程序,兼談人工生命
最近讀到馮·諾依曼的《Theory of Self-Reproducing Automata》的中譯本,被自復(fù)制自動(dòng)機(jī)理論深深吸引了!生命是什么?這本書讓我對(duì)生命有了新的認(rèn)識(shí)。
熱力學(xué)第二定律是宇宙的死亡法則:系統(tǒng)的熵總是趨于增加,系統(tǒng)總是由有序趨向無序,由有形趨向混沌,***終結(jié)于熱寂。宇宙萬物都逃不過這條法則,唯有生命例外。通過與外界交換能量,生命可以保持內(nèi)在的有序。只有生命可以違抗熱力學(xué)第二定律。
熱力學(xué)與信息論有著內(nèi)在聯(lián)系:一個(gè)系統(tǒng)越有序,它包含的信息就越多;一個(gè)系統(tǒng)越無序,它包含的信息就越少。信息總是沿著減少的方向流動(dòng)。只有生命可以抗拒這個(gè)規(guī)律:生命可以“創(chuàng)造”出信息。“創(chuàng)造”是生命之所以為生命的本質(zhì)。
生命的另一個(gè)神奇之處是,他們自己包含了自己的全部信息,他們自己可以產(chǎn)生一個(gè)跟自己一樣的新生命。唯有生命可以做到自己創(chuàng)造自己。
馮·諾依曼認(rèn)為,一個(gè)簡(jiǎn)單的系統(tǒng)是無法抗拒熱力學(xué)第二定律的,這樣的系統(tǒng)只會(huì)越來越趨向于無序,能量會(huì)向更低的方向流動(dòng),信息會(huì)越來越少。只有當(dāng)系 統(tǒng)復(fù)雜到某一個(gè)程度的時(shí)候,不妨設(shè)為臨界點(diǎn) C ,一旦越過了這個(gè)臨界點(diǎn),系統(tǒng)可以自己創(chuàng)造自己,這樣系統(tǒng)就可以逆熱力學(xué)第二定律而上,并且變得越來越復(fù)雜。
這里的臨界點(diǎn) C 跟不少人提出的“技術(shù)奇異點(diǎn)”是一樣的:人們認(rèn)為,當(dāng)人工智能達(dá)到了這樣一種程度,即它們可以自己創(chuàng)造自己的時(shí)候,這就是人工智能真正覺醒的時(shí)候。“奇異 點(diǎn)”就是機(jī)器可以自己造出自己的時(shí)候,“奇異點(diǎn)”之后,機(jī)器將進(jìn)化,并且變得越來越復(fù)雜,超出人類所能理解的范圍,它們?cè)谀撤N程度上已經(jīng)具備了生命的特 質(zhì),那將是人工智能的時(shí)代。
總而言之,生命之所以區(qū)別于世界萬物,就在于生命可以包含自己的全部信息。所以下面就是我們的問題了:
問題(自產(chǎn)生程序):編寫一個(gè)程序,不讀取任何輸入,只把自己的源代碼輸出。
這個(gè)問題是個(gè)非常本質(zhì)的問題,跟使用什么編程語言無關(guān)(不要想到使用反射之類的東西)。
試想,如果要輸出自己的源代碼,那么,顯然,程序中應(yīng)該有“print …”語句。但 print 什么出來呢?如果硬要寫的話就會(huì)變成:
- print "print \"print ......\""
***是一個(gè)無限循環(huán)。
一般地,我們知道,如果程序 A 能產(chǎn)生程序 B ,那么 A 必須包含 B 的全部信息,而且應(yīng)該比 B 的信息還多,因?yàn)檫€要包含額外的打印語句。也就是說,一般情況下,信息是減少的。而這個(gè)自產(chǎn)生程序,自己要包含自己的全部信息,從某種程度上已經(jīng)具有生命的意味了。
下面列出一些自產(chǎn)生程序及其思路。
需要注意的是,使用編程語言本身的反射功能或者讀取文件等做法都被視為 cheating ,比如這樣的 bash 腳本:
- #!/bin/sh
- cat $0
或者像這樣的 javascript :
- function a() { console.log(a.toString(), "a()"); } a()
因?yàn)檫@些程序沒有體現(xiàn)出自產(chǎn)生程序的遞歸和自指特性,或者結(jié)果嚴(yán)重依賴于編程語言的具體實(shí)現(xiàn)。
輸出源代碼在該語言中的轉(zhuǎn)義
Python :
- s = "'s = ' + repr(s) + '\\nprint(' + s + ')'"
- print('s = ' + repr(s) + '\nprint(' + s + ')')
Lua 5.1 :
- s = "string.format('s = %q\\nprint(%s)', s, s)"
- print(string.format('s = %q\nprint(%s)', s, s))
另一個(gè) Lua 版:
- s = "s = %q\
- print(string.format(s, s))"
- print(string.format(s, s))
Scala :
- def e(s: String) = ("\"" + s.replace("\\", "\\\\").replace("\"", "\\\"") + "\"")
- val s = "\"\"\"def e(s: String) = (\"\\\"\" + s.replace(\"\\\\\", \"\\\\\\\\\").replace(\"\\\"\", \"\\\\\\\"\") + \"\\\"\")\"\"\" + \"\\nval s = \" + e(s) + \"\\nprintln(\" + s + \")\""
- println("""def e(s: String) = ("\"" + s.replace("\\", "\\\\").replace("\"", "\\\"") + "\"")""" + "\nval s = " + e(s) + "\nprintln(" + s + ")")
用某種方法 encode 源代碼,使之不包含引號(hào),然后還原出源代碼
Bash :
- #!/bin/sh
- s='\x22#!/bin/sh\ns=\x27$s\x27\necho $(echo -e $s)\x22'
- echo "#!/bin/sh
- s='$s'
- echo $(echo -e $s)"
Lua 5.2 使用 load():
- s = "a,q,b=string.char(39),string.char(34),string.char(92) return a..'s = '..q..a..'..s..'..a..q..b..'nprint('..a..'..load(s)()..'..a..')'..a"
- print('s = "'..s..'"\nprint('..load(s)()..')')
Scala :
- val s = "%22val+s+%3D+%5C%22%22+%2B+s+%2B+%22%5C%22%5Cnprintln%28%22+%2B+java.net.URLDecoder.decode%28s%2C+%22UTF-8%22%29+%2B+%22%29%22"
- println("val s = \"" + s + "\"\nprintln(" + java.net.URLDecoder.decode(s, "UTF-8") + ")")
使用 eval :在 eval 的字符串中引用自己
Lua load() 的另一種用法:
- s = "print(string.format('s = %q load(s)()', s))" load(s)()
js 的 eval():
- s = "q = String.fromCharCode(34); console.log('s = ' + q + s + q + '; eval(s)')"; eval(s)
使用語言中的更強(qiáng)的轉(zhuǎn)義機(jī)制
類似上面的第二種,但不用引號(hào)。
Lua 的 long string :
- x = [["x = [".."["..x.."]".."]\nprint("..x..")"]]
- print("x = [".."["..x.."]".."]\nprint("..x..")")
Scala 的三引號(hào):
- val s = """"val s = \"\"\"" + s + "\"\"\"\nprintln(" + s + ")""""
- println("val s = \"\"\"" + s + "\"\"\"\nprintln(" + s + ")")
使用 C 的宏
先執(zhí)行傳入的參數(shù),再把參數(shù)變成字符串。
gcc :
- #define p(a) int main(){a;puts("p("#a")");return 0;}
- p(puts("#define p(a) int main(){a;puts(\"p(\"#a\")\");return 0;}"))
至于它們是怎么實(shí)現(xiàn)的,就留給讀者自己琢磨了。自產(chǎn)生程序也稱為 Quine ,可以參考 Quine Page 。
原文鏈接: