自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

阿爾法狗的前世今生

網(wǎng)絡(luò)
圍棋是什么?在計(jì)算機(jī)的眼里,她無非是一個(gè)桌面游戲。19*19的棋盤,黑白輪流走棋。一塊棋沒有氣了,就得從棋盤上拿掉。最后無處可下了,誰占的地方大誰就贏。規(guī)則如此簡單。

“阿爾法狗”為什么盯上圍棋,而不是麻將?

阿爾法狗

傳說堯作圍棋以教丹朱,如此算來圍棋就有4000多年歷史了。2009年的LG杯決賽,就被善于造勢的韓國人渲染為“四千年之戰(zhàn)”。當(dāng)時(shí)對(duì)局的是李世石和古力,頗有中韓圍棋此消彼長的天王山之戰(zhàn)的意思。如今李世石又站在了歷史的關(guān)頭,肩負(fù)著人類四千年的高傲和尊嚴(yán),只是對(duì)面坐著的是谷歌的計(jì)算機(jī)棋手阿爾法狗(AlphaGo)。谷歌,古哥,莫非前定。

圍棋是什么?在計(jì)算機(jī)的眼里,她無非是一個(gè)桌面游戲。19*19的棋盤,黑白輪流走棋。一塊棋沒有氣了,就得從棋盤上拿掉。最后無處可下了,誰占的地方大誰就贏。規(guī)則如此簡單。

但在人類的眼里,圍棋早就超越了游戲的范疇。其中有歷史,有禮儀,有美學(xué),有人生哲理。本能寺變,淮上信至,十番棋,擂臺(tái)賽,見證了多少歷史;新布局,宇宙流,美學(xué)的大竹,石佛與妖刀,蘊(yùn)含了多少風(fēng)雅;入界宜緩,棄子爭先,早成了無數(shù)人的人生信條。當(dāng)計(jì)算機(jī)真的坐到自己對(duì)面時(shí),人是五味雜陳的:我說這是人生,你卻說這只是一場游戲。

在浩如煙海的人類智力游戲中,圍棋不過是一粟而已,其在民間的影響力,未必能比得上麻將和撲克。相比中國尋常巷陌的麻將桌子和賭城成千上萬的撲克臺(tái)子,下圍棋多少有點(diǎn)曲高和寡的意思。

那么為什么人工智能如此青睞圍棋呢?為什么不是“AlphaMajo”挑戰(zhàn)四川麻將高手,或者是“AlphaHoldem”挑戰(zhàn)德州撲克冠軍呢?其原因有三:

其一,圍棋有簡單的輸贏規(guī)則 (explicit winning condition)。這一點(diǎn)非常重要,因?yàn)殡娔X需要對(duì)每一個(gè)決策的好壞做精確、量化的評(píng)估。把圍棋下好可能需要十年,但初學(xué)者就能判斷一盤下完的棋誰輸誰贏。如果規(guī)則本身比較模糊,可以去想象電腦和人類比拼現(xiàn)代詩或者抽象派繪畫,會(huì)出現(xiàn)什么樣的結(jié)果。

其二,圍棋是信息對(duì)稱的,或者說是信息完整的 (perfect information)。面對(duì)棋盤,電腦和其人類對(duì)手看到的是完全一樣的信息。象棋和國際象棋亦是如此。麻將、撲克和四國軍棋則不同:每個(gè)玩家只能看到自己一方的信息,而必須通過對(duì)手的行為去推測他的底牌。這就不難解釋,為什么久經(jīng)沙場的麻將老手往往輸給不按常理出牌的新手,以及為什么德州撲克里有層出不窮的騙術(shù)與心理戰(zhàn)。信息的完整和對(duì)稱,讓電腦可以做絕對(duì)理性的決策:不管你為什么這么下,我只要下當(dāng)前局面下最好的一手就行了。

其三,圍棋廣闊的搜索空間,帶來的挑戰(zhàn)和誘惑是電腦無法抗拒的。人類下象棋和國際象棋早已淪為電腦的手下敗將,而圍棋至少還能期待柯潔。

二,電腦學(xué)下圍棋,到底有多難?

圍棋究竟有多難呢?對(duì)人類棋手來說,這很難量化。聶衛(wèi)平曾謙虛地表示“圍棋境界高不可及,我也只能算是剛剛?cè)腴T。” 職業(yè)棋手經(jīng)常被問到與“圍棋之神”的差距:有人說讓兩子,柯潔說讓先,有人則認(rèn)為圍棋的發(fā)展接近盡頭,眾說不一。人類的視野總是被眼前的山擋住,等爬到山頂,才知道山外有山。

對(duì)計(jì)算機(jī)來說,這個(gè)問題就好回答得多。圍棋究竟有多少種變化呢?如果對(duì)每一種變化我都能判斷局面好壞,那我豈不就是每步都能走到最優(yōu)的圍棋之神了嗎?早期的人工智能的設(shè)計(jì)者們的確是這樣想的。

[[180185]]

 

設(shè)想我們玩一個(gè)Tic-Tac-Toe(圈叉棋,如上圖。)的游戲:3*3的棋盤,玩家分別在空格中填入棋子,最先連成一行、一列、或一對(duì)角線者勝。如果考慮每個(gè)空格只有黑子、白子、無子三種狀態(tài),那么一共只有393 9 (3的9次方,即9個(gè)3相乘)=19,683種狀態(tài)。就算考慮到落子的順序,也不過是9! = 362,880種變化。評(píng)估不到一百萬種變化的優(yōu)劣,對(duì)當(dāng)今的計(jì)算機(jī)來說,自然是小菜一碟。

但是這個(gè)辦法用得圍棋上,一下子就傻眼了,變化太多!

那么圍棋的變化有多少呢?如果也考慮每個(gè)交叉點(diǎn)有黑子、白子、無子三個(gè)狀態(tài),那么一張圍棋盤的狀態(tài)是33613 361 種,除去實(shí)際不可能出現(xiàn)的狀態(tài),大約是1017010 170 。相比起來,國際象棋的狀態(tài)數(shù)只有不到105010 50 ,這與圍棋的復(fù)雜度相比較,完全可以忽略不計(jì)。如果考慮行棋的順序,那么圍棋有大概361!種變化,或者說是1076810 768 (實(shí)際上沒有這么多,因?yàn)榭傆胁荒苈渥又?。無論哪一個(gè),都是天文數(shù)字,因?yàn)橛钪嬷锌捎^測的原子的總數(shù),也無非是108010 80 。

或許有人說,圍棋之神也不一定每手都算到底吧,往后推算個(gè)三五十步差不多了。好,序盤的時(shí)候(按60手以內(nèi))推算50步大概有超過1012010 120 種變化。10步?102410 24 。就算只推5步也有超過2?10122 ? 10 12 種變化。就算評(píng)價(jià)一種變化只需一個(gè)納秒(這當(dāng)然是不可能的),那么下這一手也要40分鐘。何況對(duì)計(jì)算機(jī)來說有更嚴(yán)肅的問題:不走到底我怎么知道誰好誰壞?

看起來太難了!那么棋盤小一點(diǎn)會(huì)不會(huì)簡單一點(diǎn)呢?答案是肯定的。在13*13的棋盤上,變化的個(gè)數(shù)降低到了1030410 304 。9*9的棋盤上則只有1012010 120 。張栩自創(chuàng)的四路棋,變化數(shù)只有101310 13 ,而狀態(tài)數(shù)更降低到了幾千萬個(gè):仍然很多,但對(duì)計(jì)算機(jī)來說完全可以處理。

好了,現(xiàn)在我們知道圍棋之神和宇宙之神大概是同一位。她既然能洞悉棋盤上所有的變化,大概也熟悉宇宙中所有的原子。AlphaGo真的能窮盡每一個(gè)變化嗎?沒關(guān)系,就算能也并不恐怖。我們明天就把棋盤擴(kuò)大到21路,那就算全宇宙的原子都變成AlphaGo也不行了。

三,早期的計(jì)算機(jī)圍棋靠人教套路

計(jì)算機(jī)當(dāng)然不是圍棋之神。你可以把他想象成一個(gè)天賦異稟的少年,想要挑戰(zhàn)武林高手。他內(nèi)功極強(qiáng),動(dòng)作極快,但不會(huì)招數(shù)(想想剛剛學(xué)會(huì)九陽神功的張君寶或者張無忌),他如何才能戰(zhàn)勝招法嫻熟的武林高手呢?

由于對(duì)天文數(shù)字般的圍棋變化的恐懼,最早的計(jì)算機(jī)圍棋,選擇了模仿人類的方式。你會(huì)我不會(huì),但你走哪、我就走哪總會(huì)吧。這也是被專業(yè)棋手戲稱為“背棋譜”的方式。小飛掛角,應(yīng)以小飛。你逼住,我就跳,你跳,我就跟著跳,被人走得多的總是好的。大量的圍棋知識(shí)如定式(布局的套路)、手筋(局部戰(zhàn)斗的妙招)等,就這樣從棋譜中提煉出來,然后被程序員以規(guī)則的方式告訴電腦。然后,電腦在實(shí)戰(zhàn)中按部就班跟著走。著名國產(chǎn)圍棋軟件“手談”的早期版本,就是走的這個(gè)路子。

這樣的算法的棋力當(dāng)然與規(guī)則庫的完備程度相關(guān),但基本上是相當(dāng)?shù)拖碌?。見一招流星飛墮,便會(huì)應(yīng)以一招花開見佛,這充其量是林平之他爹的水平。這種背定式的算法,實(shí)戰(zhàn)稍微變化一下,小飛掛變成大飛掛,跳著走變成飛著走,電腦就立刻感到面目全非,找不到北。

當(dāng)然,程序員也有對(duì)策:他們?cè)?ldquo;死記硬背”之上,逐漸加入了許多模糊匹配的嘗試。在實(shí)戰(zhàn)中見到略有不同的場面下,也可以走出下一手。這可以看成一定程度上的舉一反三。當(dāng)然,在差之毫厘、謬以千里的中盤戰(zhàn)斗里,這樣的模糊匹配很難奏效。

“背棋譜”的算法,還有一個(gè)重大缺陷,就是這些規(guī)則絕大多數(shù)都限于窄小的局部,而對(duì)全局棋子的協(xié)同則毫無章法。早期的圍棋程序,最怕“征子”,即是這個(gè)缺陷的典型體現(xiàn)。

既然背棋譜的下法缺陷如此明顯,為什么還是計(jì)算機(jī)圍棋的程序員們的第一感呢?從計(jì)算機(jī)的角度講,背棋譜極大地縮小了選擇的空間。掛角除了小飛、跳、夾、尖頂、靠出,大概也沒有多少應(yīng)法了吧。這樣值得考慮的選擇就變得很少,大大減輕了電腦的計(jì)算強(qiáng)度。

四,計(jì)算機(jī)圍棋的另一做法是評(píng)估局勢

那么有人會(huì)問,既然縮減選擇范圍不靠譜,咱們能縮減變化的深度嗎?

這是一個(gè)相當(dāng)有趣的想法。如果每一招棋都只管當(dāng)下、不想后招,那么每下一步不就只需要考慮最多三百來個(gè)變化了嗎?假設(shè)我們可以判斷每招棋放在棋盤上之后局面的好壞,那么選最好的一步下不就行了嗎?這的確很誘人!可是當(dāng)一盤棋只下了寥寥幾十步的時(shí)候,真的可以判斷局面的好壞嗎?偉大的圍棋之神,真的可以計(jì)算每顆棋子的效用嗎?

早期的計(jì)算機(jī)圍棋,的確在此做了很多有趣的嘗試。一些人在背棋譜,另一些人則在評(píng)估局勢,評(píng)估局勢的人甚至開始得更早。

這很好理解:往后推一步也不是終局,推十步也不是終局,那么只要我能精確評(píng)估局面的好壞,那么推多少步都能用得上。怎么做呢?分而治之吧!圍棋不是誰圍的地盤(目數(shù))大誰贏嗎?那假設(shè)棋盤上的每顆棋子都能折算成目,把它們加起來不就可以判斷局勢好壞了嗎?從50年前(那時(shí)計(jì)算機(jī)的水平可以想象),就有人開始做這樣的嘗試。

具體的做法不一,但大致想法都差不多:離我方棋子越近的空點(diǎn),越容易是我的,離對(duì)方棋子越近的點(diǎn),越容易是對(duì)方的;活子,死子,和半死不活的子則分開考慮。據(jù)說第一個(gè)圍棋程序誕生于1968年,其主要思想就是通過計(jì)算每一個(gè)棋子的“影響力”來評(píng)估局面,可惜其論文現(xiàn)在已經(jīng)找不到。另一篇發(fā)表在1981年的文章筆者倒是讀了,基本的做法還是計(jì)算“氣”(與棋子相鄰的空位)的多少,選擇最大化己方的氣,最小化對(duì)方的氣的下法。(因?yàn)闅獾亩嗌訇P(guān)系到棋子的死活,也就是生存能力)

在1990年代的“手談”軟件里,其作者曾經(jīng)把每個(gè)活子的影響力設(shè)置為:“對(duì)其相鄰位置為4,斜位(小尖)為3,單關(guān)和小飛位為2,稍遠(yuǎn)為1。” 在子效累加的基礎(chǔ)上,設(shè)計(jì)者們又陸續(xù)加入了不少改進(jìn),以修正單子、相鄰的棋子和成塊的棋子的價(jià)值。

這樣的做法棋力如何呢?似乎還是很糟糕。即便結(jié)合了一些人工智能的搜索算法,1990年代計(jì)算機(jī)圍棋的冠軍大概只是業(yè)余高手讓14-16子的水平。如果說“背棋譜”算法是打完一套少林長拳,又重新打起;那這種靜態(tài)局面評(píng)估法,有點(diǎn)像所謂的“亂劈風(fēng)”刀法:沒有后招,看哪好砍就砍哪,砍到哪算哪。值得一提的是,雖然棋力不逮,靜態(tài)局面評(píng)估作為中后盤的快速形勢分析手段,倒是深受圍棋愛好者喜歡。筆者在新浪圍棋下棋的時(shí)候,經(jīng)常使用其提供的形勢分析工具來點(diǎn)目(數(shù)自己的空有多少)。在職業(yè)棋手孟泰齡的網(wǎng)絡(luò)自戰(zhàn)解說中,我們驚訝地發(fā)現(xiàn)泰哥原來有時(shí)也會(huì)用這個(gè)工具。

整個(gè)二十世紀(jì),計(jì)算機(jī)圍棋都處于背棋譜和形勢評(píng)估交相輝映的時(shí)代。設(shè)計(jì)者們加入了許多啟發(fā)式算法以計(jì)算征子,識(shí)別打劫,模糊匹配,優(yōu)化官子。可是計(jì)算機(jī)的棋力卻如走進(jìn)了漫漫黑夜,一直上不去。

這導(dǎo)致圍棋高手們對(duì)計(jì)算機(jī)的水平有著根深蒂固的輕視:直到阿爾法狗與李世石決戰(zhàn)之前,羅洗河還認(rèn)為自己可以輕松讓AlphaGo四子。的確,如果一個(gè)學(xué)了三十年棋的人,還只能和業(yè)余高手下讓子棋,他的圍棋生涯恐怕早就被判了死刑吧。

當(dāng)然,在筆者看來,這種背棋譜和靜態(tài)形勢評(píng)估的計(jì)算機(jī)圍棋,是遠(yuǎn)遠(yuǎn)稱不上“人工智能”的。早期的設(shè)計(jì)者們播下了種子,這顆種子在黑夜里,在石頭下慢慢生根發(fā)芽。它在等待掀開石頭的一天,距這一天還有很多年。

五,搜索:從走迷宮去領(lǐng)悟下棋秘籍

計(jì)算機(jī)圍棋的種子在石頭下緩緩成長。讓我們暫且按下不表,蕩開一筆去看看真正的人工智能的研究者們?cè)谧鲂┦裁础K麄兘^大多數(shù)沒有接觸過圍棋,他們從小的目標(biāo)是打敗國際象棋的人類棋王。

和東方人從小就接觸大棋盤不同,西方人的童年是從圈叉棋到國際象棋的過程。我們已經(jīng)說過,圈叉棋的變化不到百萬,國象的變化看上去似乎也不多。因此西方的研究者一上來,心里想的就是窮舉法。

窮舉也得有順序。從威尼斯出發(fā),條條大路通羅馬。威尼斯是開局,羅馬是終局,我們把通向羅馬的過程叫做搜索。搜索在人工智能的兵器譜上穩(wěn)居第一位。1990年代以后由于互聯(lián)網(wǎng)的興起和人工智能的低谷,人們提到搜索的時(shí)候,首先想到的往往變成了Google和百度。我問問題,電腦告訴我答案。

別忘了,搜索的本義,是尋找羅馬的過程而非羅馬本身!

人類對(duì)搜索可不陌生。不就是走迷宮嗎?在曼哈頓的每一個(gè)路口都有4個(gè)選擇,不管選哪一個(gè),到下一個(gè)路口又有另外4個(gè)選擇在等你,直到你走出了迷宮或者窮盡了所有的選擇。

從數(shù)學(xué)上講,我們把迷宮的開始叫做“根”,每一個(gè)路口叫做“結(jié)點(diǎn)”,路口的每一個(gè)路叫做“分支”,每一個(gè)無路可走的狀態(tài)叫做“葉”,那么走迷宮所有的變化就成了一棵“樹”。搜索的過程,就是按照某個(gè)順序遍歷這棵樹,直到找到出口的葉子或者找遍所有的葉子。

這多么像圍棋!從空白的棋盤開始,每一步的選擇都帶來數(shù)十成百的分支,每一個(gè)終局都是一片葉子,而每一盤贏棋都是羅馬。

找到迷宮的出口或者找到羅馬可不難,只要在走過的路口做記號(hào),一直靠左或者右走就行了(在計(jì)算機(jī)算法里,這叫做深度優(yōu)先搜索,它可以保證無遺漏地遍歷一棵樹)。難的是,到了羅馬還趕得上吃頓熱的。這可就難了,因此我們必須要放棄一些分支,放棄尋找大多數(shù)葉子。在有限的時(shí)間和選擇里,我們還能找到羅馬嗎?

無數(shù)人工智能的先驅(qū),前仆后繼地研究這個(gè)問題,其中包括著名的Dijkstra先生,他的算法能讓人找到威尼斯到羅馬的最短路徑(當(dāng)然,找到這條路徑的代價(jià)并不比深度優(yōu)先的搜索低)。

計(jì)算機(jī)比人類擅長走迷宮,它可以自由地在已經(jīng)發(fā)現(xiàn)的路口間跳躍(類似于機(jī)器貓的傳送門)。這使得它可以每個(gè)路口都試一下再?zèng)Q定下一步,即是所謂的廣度優(yōu)先搜索。搜索算法中名滿江湖的A星算法(A* Search, 最佳優(yōu)先搜索的一種),即是兼?zhèn)淞藦V度優(yōu)先搜索和最短路徑搜索之長。它在每一個(gè)路口派出探子,回報(bào)下一個(gè)路口有多遠(yuǎn)、是哪里。它再綜合當(dāng)前路徑的長度和對(duì)下一個(gè)路口離終點(diǎn)的距離的估計(jì),來決定下一步怎么走。行軍數(shù)天到離長安幾百里外的隴右,似乎當(dāng)然不如花十天出子午谷直逼長安城下。

這樣的算法大大降低了搜索最優(yōu)路徑的復(fù)雜度。但是,估計(jì)威尼斯到羅馬的距離容易,估計(jì)中盤到贏棋的距離,還是很難啊!

等一等,我們似乎忘記了一件重要的事情。迷宮是一個(gè)人走,棋是兩個(gè)人下的呀。不能預(yù)測對(duì)手的下法,怎么能找到自己最優(yōu)的下法呢?在把搜索應(yīng)用到棋類游戲的探索中,人工智能的先驅(qū)們發(fā)明了“極小化極大算法”(minmax algorithm)。聽起來是不是很拗口?其實(shí)不難理解,在尋找下一步棋的時(shí)候,我們優(yōu)先選擇下在不管對(duì)方怎么應(yīng),我們都不會(huì)太壞的地方(而不是下在,如果對(duì)方應(yīng)錯(cuò)了就占大便宜,應(yīng)對(duì)了可能反而吃大虧的地方)。研究者們又設(shè)計(jì)了紛繁復(fù)雜的算法來進(jìn)一步縮小搜索空間,以讓計(jì)算機(jī)能在更有效的分支上搜索得更深,而不把時(shí)間花在一看就不行的廢棋上。這其中一個(gè)相當(dāng)重要的算法叫做Alpha-Beta剪枝。前文提到的1990年代的計(jì)算機(jī)圍棋冠軍即是用它來配合局面評(píng)估。Alpha-Beta, Alpha-Bet,Alpha-Go,前世今生,情何以堪!

有了這些搜索算法在手,計(jì)算機(jī)在圈叉棋上戰(zhàn)勝(或者打平)小朋友們?cè)缇筒辉谠捪铝???僧?dāng)人工智能的研究者們把眼光投向國際象棋的時(shí)候,卻發(fā)現(xiàn)它的搜索空間意外的大,似乎怎么剪枝也搜不到底。

當(dāng)時(shí)的人們也沒有一個(gè)好的方法能準(zhǔn)確估計(jì)非葉結(jié)點(diǎn)局勢的好壞(如果子力多就好,那擺象棋殘局的騙子們就都下崗了)。搞計(jì)算機(jī)圍棋的一看,你象棋都搜不到底,我圍棋就更別想了。于是計(jì)算機(jī)圍棋又在黑暗中度過了二十年,直到一個(gè)英雄的出現(xiàn)。

六,深藍(lán)帶來的啟示

1996年2月10日,一個(gè)叫“深藍(lán)”的電腦挑戰(zhàn)國際象棋棋王卡斯帕羅夫。讓所有人跌破眼鏡,它居然贏了第一局,之后兩和三負(fù)。深藍(lán)是IBM設(shè)計(jì)。雙方約定一年后再戰(zhàn)。1997年5月,雙方再下六局,“深藍(lán)”一勝五和戰(zhàn)勝棋王。這是人工智能載入史冊(cè)的里程碑事件。

值得一提的是,輸棋之后的卡斯帕羅夫認(rèn)為深藍(lán)表現(xiàn)出的智能和創(chuàng)造性不可思議,必有人類棋手在背后操刀。這次谷歌顯然早有準(zhǔn)備:高調(diào)的營銷,讓幾乎所有的人類頂尖高手都現(xiàn)身講棋,從而杜絕了“機(jī)箱里躲著柯潔”的猜測。

“深藍(lán)”為什么贏?除了摩爾定律帶來的計(jì)算力的顯著提高,深藍(lán)的算法似乎也沒有什么稀奇。Minmax搜索, Alpha-Beta剪枝, 為什么一夜之間武功就變得如此厲害?

當(dāng)深藍(lán)揭開神秘面紗,人們發(fā)現(xiàn),深藍(lán)算法中的秘密其實(shí)不外乎兩點(diǎn):局勢評(píng)估和往前看。老熟人了,不是嗎?深藍(lán)的局勢評(píng)估考慮了棋子的重要性(皇后是9,小兵是1,車取其中),每個(gè)棋子的影響范圍(又很耳熟?),王的安全系數(shù),以及先手 (tempo)。這個(gè)評(píng)估并非靜態(tài)的,而是要往前窮舉數(shù)步棋中的所有變化,再對(duì)所有可能導(dǎo)致的局面進(jìn)行估計(jì)(相傳與卡斯帕羅夫下的時(shí)候,深藍(lán)往前推了12步)。這有多難呢?粗略以每一步棋有100種下法而計(jì)(每個(gè)兵最多2-3種下法,每個(gè)馬最多8種下法,每個(gè)車14種,去掉不能下的地方,以此類推),12步也就是102410 24 種變化。用上alpha-beta的剪枝和IBM強(qiáng)大的并行運(yùn)算能力,完全可以處理!

深藍(lán)的成功,讓人類第一次正視人工智能的強(qiáng)大潛力。讓我們看看深藍(lán)帶給計(jì)算機(jī)圍棋的前所未有的啟示與契機(jī)。一方面,深藍(lán)的成功宣告國際象棋已經(jīng)是被解決的問題,這讓許多人工智能的研究者們把目光投向了下一個(gè)挑戰(zhàn):圍棋。另一方面,計(jì)算機(jī)圍棋的設(shè)計(jì)者們從深藍(lán)身上驚訝地領(lǐng)悟到了兩點(diǎn):其一,并沒有多少專業(yè)知識(shí),貌似蠻力的窮舉搜索竟能如此有效;其二,精確的局勢評(píng)估如此重要,但靜態(tài)的評(píng)估似乎并不足取。從現(xiàn)在開始,背棋譜不再是出路,而局勢評(píng)估將以動(dòng)態(tài)的搜索為基礎(chǔ)!

2006年,一個(gè)叫做《瘋狂的石頭》的黑色幽默電影席卷中國。同年,一個(gè)同名(Crazy Stone)的計(jì)算機(jī)圍棋程序悄悄地在計(jì)算機(jī)奧運(yùn)會(huì)上奪得9*9圍棋的冠軍。翌年,它在計(jì)算機(jī)奧運(yùn)會(huì)上蟬聯(lián)9*9冠軍并奪得19*19比賽的亞軍。再下一年,瘋石在對(duì)真正的職業(yè)棋手(青葉熏四段)的授八子局中獲勝,同年年底又贏了授七子局。5年后(2013年),瘋石在對(duì)石田芳夫九段的授四子棋中取勝。第二年,同樣授四子,瘋石取勝棋力更強(qiáng)的依田紀(jì)基,其在圍棋界的影響力達(dá)到頂峰。

無獨(dú)有偶,2010年之后網(wǎng)上出現(xiàn)了一個(gè)叫Zen(禪)的計(jì)算機(jī)棋手,在KGS(一個(gè)著名的圍棋服務(wù)器)上慢慢升到5段。筆者當(dāng)時(shí)經(jīng)常在KGS下棋,也曾和Zen互有勝負(fù)??墒遣痪镁椭荒苎郾牨牽粗钠辶Τ^自己,揚(yáng)長而去。2012年,Zen也在授四子局中擊敗了專業(yè)九段:深受大家喜愛的武宮正樹。

從此計(jì)算機(jī)圍棋進(jìn)入了一個(gè)新的時(shí)代,一個(gè)不斷帶給大家驚喜的時(shí)代??晌覀儾唤雴杻杉拢旱谝唬?ldquo;瘋石”的出現(xiàn)離“深藍(lán)”也有十年過去了,這十年計(jì)算機(jī)都在做些什么?第二,為什么這一切總是和“石頭”有關(guān)?

七,一株奇異的樹——蒙特卡洛樹

從“瘋石”開始,這個(gè)時(shí)代可以被稱為“蒙特卡洛時(shí)代”。當(dāng)代的計(jì)算機(jī)棋手,不約而同地采用了一種叫做“蒙特卡洛樹”的搜索算法(Monte-Carlo Tree Search),直到AlphaGo也不例外。它是什么獨(dú)門絕學(xué)?

深藍(lán)帶來的啟示之一,是尋找精確的形勢評(píng)估函數(shù),而這個(gè)函數(shù)必須是動(dòng)態(tài)的,必須要考慮到數(shù)步乃至數(shù)十步之后的局面。

這思路并非沒人想過。可是相比國際象棋,它有唯一的取勝目標(biāo)——殺老王,圍棋的局勢判斷或許更為主觀。什么是勢?什么是厚?什么是薄?勢與地如何換算?大局觀究竟是什么?這些大概是圍棋永恒的問題。就連頂尖棋手也常常判斷不清。看頂尖高手的比賽最有趣,總是韓國解說覺得韓國人好,中國解說覺得中國人好。一邊說是棄子,一邊說是被吃…… 計(jì)算機(jī)可不喜歡橫看成嶺側(cè)成峰,它需要做理性和客觀的決斷。

那么圍棋中有什么是絕對(duì)客觀的呢?我們之前說過,只有終局的勝負(fù)??赡切┐斫K局的葉子在圍棋的搜索樹上似乎遙不可及。那么,能否不窮舉所有的葉子,也能判斷一個(gè)枝頭的局勢呢?這個(gè)想法讓人精神一振。如果一棵枝頭有10片葉子,8片是贏,兩片是輸,我們一定要找到輸贏最大的一片才能判斷這個(gè)枝頭的好壞嗎?如果這棵枝頭有100片葉子,我們難道一定要看遍所有的葉子才能判斷優(yōu)劣嗎?

喜愛統(tǒng)計(jì)的朋友們已經(jīng)樂出了聲:要想知道添加劑是否超標(biāo),當(dāng)然不需要打開所有的罐頭。抽樣就行了嘛!假設(shè)對(duì)每手棋我們都能抽樣調(diào)查它所導(dǎo)致的終局,大概不需要理解地、勢、厚、薄也可以做形勢判斷了吧?

如何抽樣?隨機(jī)既簡單又靠譜。一步新著法好壞不明時(shí),職業(yè)棋手往往提倡實(shí)戰(zhàn)解決。計(jì)算機(jī)也一樣,只是并非找兩個(gè)高手下一盤,而是找兩個(gè)不懂棋的小朋友下一千盤罷了。隨機(jī)下一千盤棋,對(duì)電腦來說花費(fèi)幾何?以毫秒計(jì)吧!

這不就好辦了嗎!從現(xiàn)在起,每一個(gè)局面我都可以客觀地估計(jì)好壞了,同時(shí)我并不需要遍歷整個(gè)搜索樹(所以請(qǐng)不要再叫我窮舉法!)。真是這樣簡單嗎?我可不信。難道從第一手右上星位開始,隨機(jī)模擬一千盤棋,發(fā)現(xiàn)白勝501盤,就說明黑1是敗招嗎?很可惜,隨機(jī)抽樣得到的結(jié)果是一個(gè)統(tǒng)計(jì)上的期望,而并非實(shí)際上的“最優(yōu)”。它需要遵從統(tǒng)計(jì)之神的規(guī)律。第一手黑1對(duì)應(yīng)的局面有多少呢?天文數(shù)字。勝負(fù)是怎樣分布的呢?不知道。那么一千盤,一萬盤棋,對(duì)于這樣的統(tǒng)計(jì)分析來講,只是個(gè)微不足道的樣本,很難得出有實(shí)際意義的結(jié)論。

沒關(guān)系,樣本不夠可以多下,反正是隨機(jī)棋不費(fèi)電。具體下多少盤呢?當(dāng)然越多越好,但咱們不妨算到讀秒的時(shí)限為止。像這樣在確定時(shí)間內(nèi)完成的隨機(jī)算法,就叫做蒙特卡洛。說起來,這個(gè)名詞來自摩納哥著名的賭場勝地蒙特卡洛,因?yàn)檫@樣的算法往往被用來計(jì)算賭博勝率的問題。既然有蒙特卡洛,那有沒有拉斯維加斯呢?當(dāng)然有,我們暫且不表。“國際象棋之神”深藍(lán)用過的搜索算法,現(xiàn)在一樣能用:只要把局面評(píng)估換成蒙特卡洛就行了(用模擬對(duì)局的最終勝率而不是評(píng)分值,來評(píng)價(jià)當(dāng)前局面的好壞)。這就是所謂的“蒙特卡洛樹搜索”。

這法子聽起來相當(dāng)靠譜。那為什么直到10年之后,蒙特卡洛才開始在江湖流傳呢?

這是因?yàn)槊商乜逡灿忻黠@的缺陷。由于其隨機(jī)性,蒙特卡洛不能保證答案的正確,而只能保證在一定的概率下不犯錯(cuò)。這個(gè)概率邊界由什么決定呢?當(dāng)然和隨機(jī)模擬的次數(shù)有關(guān)。

這就又回到了當(dāng)初的難題:因?yàn)閲逯畼鋵?shí)在太大,每個(gè)結(jié)點(diǎn)模擬次數(shù)多,時(shí)間不夠用;少,答案又不精確。這個(gè)矛盾耽誤了蒙特卡洛圍棋整整十年。

八,“多臂老虎機(jī)”的閃亮登場

“瘋石”提供了解決矛盾的一個(gè)好思路。說起來并不難:看上去不錯(cuò)的分支,咱們就多模擬幾盤,讓它的評(píng)估更精確??瓷先ゲ辉趺礃拥?,咱們就少下幾盤。實(shí)在不怎么靠譜的,這個(gè)分支咱們根本就不看。這樣雖然搜索空間巨大,實(shí)際搜索的樹則變得很小。

可是有人會(huì)問,這會(huì)不會(huì)導(dǎo)致瘋石在“一棵樹上吊死”呢?它如果守著一個(gè)看上去不錯(cuò)的分支,一根筋地往下找呢?

這個(gè)問題的確存在,而且它在人工智能領(lǐng)域相當(dāng)有名,被稱為“探索與利用的矛盾” (exploration vs. exploitation)。用地質(zhì)學(xué)家(或者星際爭霸玩家)的話來說更有意思,大概是勘探和開發(fā)的平衡吧:過多地開發(fā)當(dāng)前的油田,減少了勘探到更富的油田的機(jī)會(huì),而過多的勘探則讓開發(fā)的效率變低。

這很讓人困擾。不過,這個(gè)問題有一個(gè)優(yōu)美的解決方案。

既然身在蒙特卡洛,我們還是用賭場的方式解決賭場的事情吧!玩老虎機(jī)的賭客們往往有這樣的苦惱:老虎機(jī)有的吐幣容易、有的難。現(xiàn)在我玩的這個(gè)還算不錯(cuò)。可一直玩下去吧,又總覺得隔壁的沒準(zhǔn)會(huì)更出幣;換到隔壁去吧,又怕我一走,這兒就出個(gè)大的。

機(jī)器學(xué)習(xí)里,有一個(gè)算法叫做“多臂老虎機(jī)”(multi-armed bandit),解決的就是這個(gè)問題。它用一個(gè)叫做UCB的策略,精確地計(jì)算哪個(gè)老虎機(jī)應(yīng)該多試,哪個(gè)應(yīng)該少試,并告訴賭客下一把應(yīng)該去試哪一個(gè)。當(dāng)這個(gè)策略應(yīng)用在蒙特卡洛樹上時(shí),就成了“瘋石”賴以成名的UCT算法(UCB applied to trees)。與局部焦點(diǎn)相關(guān)的分支多試,較遠(yuǎn)的地方則少試,但并非不試。UCT推薦的分支,我們就優(yōu)先往下搜索,用蒙特卡洛模擬更多的棋局。

蒙特卡洛和多臂老虎機(jī),這兩大賭神,給電腦圍棋帶來一片欣欣向榮。電腦“瘋石”和“禪”交相輝映,近十年里不斷刷新著人們的期望,他們分先戰(zhàn)勝專業(yè)棋手似乎指日可待。

可是行百里者半九十,差的就是這臨門一腳。到了最近兩年,我們發(fā)現(xiàn),它們的進(jìn)步速度又變緩了,就連Zen的段位也升不上去了。

大家終于知道它們又遇到了瓶頸。這也難怪,即便是蒙特卡洛,也需要走到底;即便是多臂老虎機(jī),也需要試很多枝。計(jì)算能力仍然是瓶頸,除非能更加有效地減小搜索的寬度與深度。

可是,連賭神都搬出來了,人工智能的高手們似乎已無計(jì)可施。

可是人們忘記了,在數(shù)十年的漫漫黑夜里,有顆種子一直在生長。這一天終于到了,它將頂開石頭,破繭而出。

“韋小寶,我一定會(huì)回來的。下次我再出現(xiàn)的時(shí)候,你一定不會(huì)認(rèn)得我是誰。”

九,人類棋手的兩大獨(dú)門秘笈

漫漫黑夜終于過去了,我們不經(jīng)意間就等到了AlphaGo。它的橫空出世如此讓人驚訝,以致于最初報(bào)道AlphaGo登上《Nature》的消息,在朋友圈里被不少人疑為謠言。

在我們盼望著“瘋石”和“禪”能逐步逼近職業(yè)棋手棋力的時(shí)候,“阿爾發(fā)狗”一出手就咬暈了歐洲冠軍,還把戰(zhàn)書下到了另一個(gè)瘋狂的石頭李世石面前。它究竟有何秘密?

“瘋石”和“禪”遇到的瓶頸,我們不妨換一個(gè)思路來想。我們算是知道了電腦怎樣挑戰(zhàn)人,可人憑什么可以和電腦對(duì)抗呢?再強(qiáng)的專業(yè)棋手,顯然也沒辦法每秒鐘算出幾千種變化,他們也不會(huì)蒙特卡洛或者Alpha-Beta剪枝,那他們憑借什么能在圍棋迷宮里游刃有余呢?計(jì)算能力顯然是比不過的,但一定有什么是人類比計(jì)算機(jī)強(qiáng)的。

其實(shí),在搜索圍棋之樹的過程里,人類棋手的確有獨(dú)門秘笈。

人類的第一種魔法,是能夠顯著地降低搜索空間,在復(fù)雜開放的局面下不可思議地找到寥寥幾種可行的下法。這就是所謂的棋感,對(duì)于頂尖高手而言,甚至是“第一感”。假如計(jì)算機(jī)也學(xué)會(huì)這種能力,那豈不是可以把可貴的計(jì)算資源集中在探索這少數(shù)幾個(gè)分支上嗎?

人類的第二種魔法在于其強(qiáng)大的形勢判斷能力,不用精確推算也能判斷全盤局面的優(yōu)劣。這就是所謂的“大局觀”。假如計(jì)算機(jī)也具有這種能力,那豈不是不需要搜索很深也能正確地評(píng)估局勢了嗎?棋感和大局觀難道是人類與生俱來的魔法嗎?當(dāng)然不是。它們其實(shí)是千百年來人類棋手智慧的結(jié)晶;它們的根基是被一張張棋譜和一代代棋手流傳下來的圍棋知識(shí)與經(jīng)驗(yàn)。

這個(gè)想法非常讓人興奮:良好的棋感和大局觀,一個(gè)能減小搜索寬度,一個(gè)能減小搜索深度,這不正是蒙特卡洛夢寐以求的嗎!棋感和大局觀從哪里來呢?小時(shí)候教我學(xué)棋的老師就一句話:多打高手的譜。想到這里,人工智能的研究者們釋然了:原來答案還在棋譜啊。我們收集了數(shù)以十萬計(jì)的人類棋譜,卻沒有好好利用它們,“惟能消敵內(nèi)力,不能引而為我用,猶日取千金而復(fù)棄之于地,暴殄珍物,殊可哂也”。

歷史總是像車輪一樣滾動(dòng)前進(jìn)的。眾里尋他千百度,原來那人早在燈火闌珊處。是時(shí)候把沉睡了幾十年的“背棋譜”和“亂劈風(fēng)”請(qǐng)回來了。只是這時(shí)候他們?cè)缫哑评O成蝶,練就了武林秘笈,以全新的面目出現(xiàn)在我們面前。

這本秘笈叫做“深度學(xué)習(xí)”。

十,深度學(xué)習(xí)帶來的臨門一腳

“深度學(xué)習(xí)”是什么?“卷積神經(jīng)網(wǎng)絡(luò)”又是什么?聽上去好科幻的名詞,可我們不需要太深究。

你只要知道,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,它是一臺(tái)精密的流水線,整頭豬從這邊趕進(jìn)去,香腸從那邊出來就可以了。豬是棋盤,香腸是一手棋,深度學(xué)習(xí),可以用來預(yù)測當(dāng)前局面可能的下一手。豬是棋盤,香腸有好有壞,那么深度學(xué)習(xí)也可以用來判斷當(dāng)前局面的優(yōu)劣。

那么這個(gè)流水線是如何搭建的呢?它可不是拍腦袋設(shè)計(jì)的,而是看過了數(shù)以百萬的豬和它們做出的香腸之后,計(jì)算出來的。豬我們可有的是。人類高手的棋譜大概走了三千萬步(三千萬頭豬),而電腦還可以自己養(yǎng)豬(自己模擬對(duì)局)。

那么這位問了,為什么是深度學(xué)習(xí)而不是其他的什么學(xué)習(xí)呢?它和背棋譜究竟有什么區(qū)別呢?

傳統(tǒng)的機(jī)器學(xué)習(xí),需要先把豬按一定規(guī)則分解成各種“特征”(顏色,重量,后腿有塊疤,等等),香腸的做法則由這些特征共同決定。當(dāng)只有少數(shù)幾個(gè)死規(guī)則的時(shí)候,就和背棋譜區(qū)別不大了(看到后腿有疤的豬,請(qǐng)下小飛)。

可是“道可道,非常道”,棋感這樣只可意會(huì)的東西,硬要把它寫成規(guī)則和特征,既不達(dá)意也沒必要。你總不能逼著古力告訴你,他想到那招“峭壁鑿火”的妙手,是因?yàn)樽筮呌袀€(gè)彎三,右邊有個(gè)曲四吧!

深度學(xué)習(xí)則省略了這個(gè)步驟,整豬進(jìn),讓機(jī)器自動(dòng)去尋找這些特征和他們的組合。還記得手談的形勢估計(jì)辦法“相鄰加4、小尖加3”嗎?深度學(xué)習(xí)找到的,可不是這樣簡單的加加減減(線性組合)。在理論上,它可以模擬任何的非線性函數(shù)。

好,到現(xiàn)在我們大概明白AlphaGo的秘訣了。它的主體仍然是蒙特卡洛樹,但它巧妙地用了兩個(gè)深度學(xué)習(xí)模型,一個(gè)預(yù)測下一手,一個(gè)判斷形勢。預(yù)測的結(jié)果,降低了搜索寬度;而形勢判斷,則減小了搜索深度。深度學(xué)習(xí)從人類的經(jīng)驗(yàn)中學(xué)來了棋感與大局觀,它們使蒙特卡洛如虎添翼,一扇翅膀就飛到了李世石的面前。縱橫江湖15年的李石頭,在另一位“古哥”的面前低下了高傲的頭。

寫到這里,“阿爾發(fā)狗”的前世今生就介紹得差不多了。我們要看到,這并不簡單的是人工智能的勝利。

AlphaGo的成功,極大部分應(yīng)該歸功于谷歌的工程師們。他們有效地把復(fù)雜的算法并行化,嫻熟地在CPU和GPU間轉(zhuǎn)換,游刃有余地用“云計(jì)算”解決著計(jì)算力的瓶頸。

我們也要看到,除了谷歌和AlphaGo,還有很多設(shè)計(jì)者、工程師,和計(jì)算機(jī)棋手在同時(shí)努力著。“瘋石”,“禪”,以及華人科學(xué)家主導(dǎo)的Facebook的“黑暗森林”,都在一起前行。

這是一場人類經(jīng)驗(yàn)和電腦算法共同的狂歡,而歸根結(jié)底,這是一場屬于圍棋的盛宴。

十一,成也蒙特卡洛,敗也蒙特卡洛

寫就此文的時(shí)候,AlphaGo正和李世石下著第五盤棋。前三盤幾乎完勝的AlphaGo,令人驚訝地幾乎短路般地輸?shù)袅说谒谋P。一時(shí)間眾說紛紜,謠言四起。當(dāng)我們了解了AlphaGo的前世今生之后,或許能對(duì)一些問題有更好的理解。知道了它的武功秘笈,人類棋手也更能針鋒相對(duì)。

以下是一些我的思考,一家之言,貽笑方家。由于AlphaGo一直在暗處,Google的論文也信息有限,不少觀點(diǎn)是筆者自己的推測。相信隨著AlphaGo與更多棋手交戰(zhàn),它會(huì)越來越透明,而它面對(duì)的挑戰(zhàn)也會(huì)越來越難。

AlphaGo會(huì)犯錯(cuò)嗎?當(dāng)然會(huì)。不僅序盤會(huì),中盤會(huì),官子也會(huì)。

因?yàn)槊商乜鍟?huì)犯錯(cuò)。蒙特卡洛只能保證在一定概率下得到正確的結(jié)果,而模擬的次數(shù)越多,犯錯(cuò)的可能越小。

計(jì)算力永遠(yuǎn)是瓶頸,如果讓電腦得以把計(jì)算資源集中在狹小的搜索空間,那么它在這里犯錯(cuò)的可能極小。想想第一盤的上邊和第三盤的左邊,局部雖然復(fù)雜,但搜索的空間卻很小。狹小空間里的直線計(jì)算,人恐怕很難討好(參見AlphaGo在第一盤右邊的妙手一點(diǎn))。因?yàn)樗惴ㄊ谷唬?jì)算機(jī)圍棋永遠(yuǎn)希望縮小搜索空間,因此AlphaGo不愛保留后續(xù)變化、多俗手、總是簡化局面的特點(diǎn),就不難理解了吧。

那人應(yīng)該怎么辦呢?說來簡單:反其道而行之。

盡量擴(kuò)大搜索空間,迫使電腦搜索更多的分支,而且每個(gè)分支也搜索得更深。當(dāng)有限的計(jì)算資源不得不分配到大量的局部時(shí),出錯(cuò)的可能就變大了。

當(dāng)AlphaGo想斷其一指的時(shí)候,我們偏偏讓它十指均勻用力。

李世石第四盤第78著“挖”的一手,恰恰就是AlphaGo漏算的一手。深度學(xué)習(xí)和多臂老虎機(jī)可能并沒有推薦它,也可能推薦排名靠后,導(dǎo)致沒有深入計(jì)算;它也可能被剪掉了,不得而知??墒遣还茉趺礃樱且皇种暗木謩?,牽一發(fā)而動(dòng)全身,全局可能的落點(diǎn)很多;那手棋又牽扯到潛在的劫和引征,讓形勢判斷變得復(fù)雜,導(dǎo)致了搜索深度的顯著增加。真是成也蒙特卡洛,敗也蒙特卡洛呀!

十二,打狗棒法就是打劫!

說得容易,但那一手挖分明是可遇不可求的一步,難道還能復(fù)制嗎?

其實(shí)也有更加易行的辦法,那就是這幾天被討論得底朝天的“打劫”(圍棋術(shù)語,即在一個(gè)關(guān)鍵處雙方來回提子)。具體情況圍棋高手和同行專家都已分析得很透徹了,簡而言之,打劫能同時(shí)增加搜索的寬度和深度。

因?yàn)榻俨目赡苌⒉既P各地,多數(shù)甚至和劫的本身無關(guān),這使得深度學(xué)習(xí)也無法準(zhǔn)確預(yù)測如何找劫,迫使計(jì)算機(jī)做全局的搜索。

劫與劫材的不確定性,又導(dǎo)致局面好壞很難判斷,讓AlphaGo無法有效地減小搜索深度。

這里有兩個(gè)有趣的地方:其一是AlphaGo不可能不會(huì)打劫,因?yàn)橥瑯邮褂妹商乜宓?ldquo;瘋石”和“禪”都會(huì),只是它打劫的能力未必比別的計(jì)算機(jī)棋手強(qiáng)。正因?yàn)槿绱?,我們可以看到幾盤棋AlphaGo都有明顯規(guī)避打劫的傾向。試想如果柯潔對(duì)上一個(gè)棋力為不打劫13段、打劫業(yè)余5段的對(duì)手,恐怕也有辦法對(duì)付吧。

其二是打劫可以引而不發(fā),打而不消,最好在不同的地方多造幾個(gè)劫來打。你問為什么?消劫太快不就又降低搜索難度了嗎?

那么AlphaGo在漏算之后,為何表現(xiàn)得如同“失魂落魄”呢?這當(dāng)然很有可能是谷歌的算法在處理“漏算”的時(shí)候出現(xiàn)了瑕疵。但即便不是這樣,通過算法也不難解釋。

我們知道,就算深度學(xué)習(xí)可以幫助電腦評(píng)估局面,但每一個(gè)變化都評(píng)估,再好的計(jì)算能力也吃不消。就算是工作簡單得多的“國際象棋之神”深藍(lán),也是每向深處考慮多步才評(píng)估一次局面的。如哈薩比斯自己說,到79手的時(shí)候AlphaGo還認(rèn)為自己的勝率很高,又走10手之后才發(fā)現(xiàn)形勢已非。那時(shí)已無后悔藥可吃,手忙腳亂也不難理解了。

至于AlphaGo為什么無厘頭地在右邊二路立下呢?我的理解是這樣的。還記得前文提到的minmax算法嗎?計(jì)算機(jī)會(huì)優(yōu)先選擇不管對(duì)方怎么應(yīng),我都不會(huì)太差的招。那一手立,不管對(duì)方如何應(yīng),恐怕都不會(huì)讓當(dāng)前的形勢變得更差吧!這樣的策略應(yīng)該也可以解釋,為什么AlphaGo總有局面領(lǐng)先了就等等你的感覺。這倒是為人類棋手提供了一個(gè)思路:因?yàn)閙inmax算法,AlphaGo不太會(huì)走冒險(xiǎn)和過分的棋,那么它在逆境下如何翻盤真是一個(gè)有趣的問題。至于左下那個(gè)虧到姥姥家的“挖”,筆者就真的不懂了。

十三,狗不是圍棋之神,人工智能還很青澀

AlphaGo在自己左右互搏中練棋,真的能武功大進(jìn)嗎?這又是一個(gè)有趣的問題。

我覺得,自我對(duì)弈會(huì)有效果,但不可能不斷提高棋力。

在《自然》那篇論文里可以看到,自我對(duì)弈主要是為了解決從人類棋譜中深度學(xué)習(xí)帶來的過擬合的問題。從機(jī)器學(xué)習(xí)的角度看,它并不能不斷提升武功。南大的周志華教授把自我對(duì)弈比作武當(dāng)?shù)奶菰瓶v,非常妙!在空中左腳踩右腳,真能不斷往上飛嗎?沒有外物借力,這顯然是不符合物理規(guī)律的。物理沒有永動(dòng)機(jī),人工智能也沒有。

兩個(gè)AlphaGo同鉆一個(gè)牛角尖,對(duì)的更對(duì),錯(cuò)的更錯(cuò)。

比起把有限的計(jì)算資源用來自我對(duì)弈,我更擔(dān)心谷歌把它用在創(chuàng)造拉斯維加斯搜索樹上,那可是一個(gè)真正不犯錯(cuò)誤的家伙。

那AlphaGo究竟有沒有可能,不借助與人類的對(duì)局來提升棋力呢?當(dāng)然有,但那需要兩個(gè)棋力極高,而且武功路數(shù)迥然不同的AlphaGo。

下過棋的人都知道,和高手下受益無窮,和低手下也許偶有收獲,而和自己下嘛,只能叫做擺棋吧。我們很期待看見AlphaGo和黑暗森林的十番棋或是史無前例的百番棋。

AlphaGo帶給人們無窮的興奮,也帶來了前所未有的浮躁與恐慌:

  • 人工智能會(huì)搶走我的工作嗎?
  • 機(jī)器會(huì)統(tǒng)治人嗎?
  • 人類是否自掘墳?zāi)鼓?

其實(shí),人工智能遠(yuǎn)遠(yuǎn)沒有到值得恐慌的地步。

它會(huì)搶走我們的工作嗎?蒸汽機(jī)到來的時(shí)候人們恐慌過,PC到來的時(shí)候人們也恐慌過。但它們并沒有“搶走”人類的工作,而只是把我們從不擅長的工作中解放出來,提高了效率,去做更擅長、更重要的事情。

想想會(huì)聊天的微軟小冰,掃地的機(jī)器人,和無人駕駛的汽車。它們是我們的朋友而不是掘墓人。

它無所不能了嗎?不是的,人工智能還很年輕,還有很長的路要走。君不見從深藍(lán)到AlphaGo整整20年,時(shí)間長得讓人們幾乎忘記了它。

它會(huì)統(tǒng)治人類嗎?在我能預(yù)見的將來,應(yīng)該不會(huì)。要這么做,它首先得擁有創(chuàng)造力,可是作為一個(gè)人工智能的擁躉,我能看到的,還是漫漫長夜。

鑰匙永遠(yuǎn)掌握在人類的手里。即使人工智能有了統(tǒng)治人類的能力,那一天來臨的時(shí)候,我們至少還可以切斷電源,不是嗎:)

責(zé)任編輯:武曉燕 來源: 程序員之家
相關(guān)推薦

2011-08-23 09:52:31

CSS

2015-11-18 14:14:11

OPNFVNFV

2025-02-12 11:25:39

2014-07-30 10:55:27

2013-05-23 16:23:42

Windows Azu微軟公有云

2014-07-15 10:31:07

asyncawait

2021-06-17 07:08:19

Tapablewebpack JavaScript

2012-05-18 16:54:21

FedoraFedora 17

2014-07-21 12:57:25

諾基亞微軟裁員

2016-12-29 18:21:01

2019-06-04 09:00:07

Jenkins X開源開發(fā)人員

2016-11-08 19:19:06

2016-11-03 13:33:31

2011-05-13 09:43:27

產(chǎn)品經(jīng)理PM

2013-11-14 16:03:23

Android設(shè)計(jì)Android Des

2019-08-05 10:08:25

軟件操作系統(tǒng)程序員

2019-04-28 09:34:06

2015-06-11 11:10:09

對(duì)象存儲(chǔ)云存儲(chǔ)

2021-04-15 07:01:28

區(qū)塊鏈分布式DLT

2022-11-07 14:23:35

RPA人工智能流程自動(dòng)化管理
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)