人工智能發(fā)展史-從圖靈測試到大數(shù)據(jù)
我一直很好奇人工智能是如何提出來的,它背后有什么樣的故事,在人工智能發(fā)展的這60年的時間中,又經(jīng)歷了什么?為什么現(xiàn)在才是人工智能的爆發(fā)點,未來人工智能又將走向何處?帶著這樣的問題我讀了吳軍博士的《智能時代》這本書,打開了我對人工智能的了解,這篇文章主要內(nèi)容也來自于這本書。
我們這代人對人工智能的關(guān)注,來自于2016年AlphaGo大戰(zhàn)世界著名圍棋選手李世民,在比賽之前各方關(guān)注度非常高,國內(nèi)各方媒體爭相報道,預測這場比賽的結(jié)果,人們好奇人工智能現(xiàn)在智能到什么程度以及計算機如何和人下圍棋,最終AlphaGo以4:1勝了李世明,大家都在感慨人工智能時代即將來臨。僅僅過了一年,2017年5月27日AlphaGo的2.0版本3:0戰(zhàn)勝圍棋世界排名第一的柯潔九段,從此在AlphaGo面前已無人類對手。
計算機之所以能夠戰(zhàn)勝人類,是因為機器獲得智能的方式和人類不同,它不是靠邏輯推理,而是靠大數(shù)據(jù)和算法。Google使用了幾十萬盤圍棋高手之間的對弈的數(shù)據(jù)來訓練AlphaGo,這是它獲得所謂“智能”的原因。在計算方面,Google使用了幾十萬臺服務器來訓練AlphaGo下棋模型,并讓不同的AlphaGo相互對弈上千萬盤。第二個關(guān)鍵技術(shù)是啟發(fā)式搜索算法-蒙特卡洛樹搜索算法(英語:Monte Carlo tree search;簡稱:MCTS),它能將搜索的空間限制在非常有限的范圍內(nèi),保證計算機能夠快速找到好的下法。由此可見,下圍棋這個看似智能型的問題,從本質(zhì)上講,是一個大數(shù)據(jù)和算法的問題。
說到人工智能,就不得不提計算機屆的一個傳奇人物:阿蘭.圖靈博士。1950年,圖靈在《思想》(mind)雜志上發(fā)表了一篇《計算的機器和智能》的論文。在論文中,圖靈既沒有講計算機怎樣才能獲得智能,也沒有提出如何解決復雜問題的智能方法,知識提出了一個驗證機器有無智能的的判別方法。
讓一臺機器和一個人坐在幕后,讓一個裁判同時與幕后的人和機器進行交流,如果這個裁判無法判斷自己交流的對象是人還是機器,就說明這臺機器有了和人同等的智能。就是大名鼎鼎的圖靈測試。后來,計算機科學家對此進行了補充,如果計算機實現(xiàn)了下面幾件事情中的一件,就可以認為它有圖靈所說的那種智能:
1、語音識別
2、機器翻譯
3、文本的自動摘要或者寫作
4、戰(zhàn)勝人類的國際象棋冠軍
5、自動回答問題
今天,計算機已經(jīng)做到了上述的這幾件事情,甚至還超額完成了任務,比如現(xiàn)在的圍棋比國際象棋要高出6-8個數(shù)量級,當然,人類走到這一步并非一帆風順,而是走了幾十年的彎路。
人工智能的誕生:1943 – 1956
在20世紀40年代和50年代,來自不同領(lǐng)域(數(shù)學,心理學,工程學,經(jīng)濟學和政治學)的一批科學家開始探討制造人工大腦的可能性。1956年,人工智能被確立為一門學科。
1956年的夏天,香農(nóng)和一群年輕的學者在達特茅斯學院召開了一次頭腦風暴式研討會。會議的組織者是馬文·閔斯基,約翰·麥卡錫和另兩位資深科學家Claude Shannon以及Nathan Rochester,后者來自IBM。與會者包括Ray Solomonoff,Oliver Selfridge,Trenchard More,Arthur Samuel,Newell和Simon,他們中的每一位都將在AI研究的第一個十年中作出重要貢獻。
會議雖然叫做“達特茅斯夏季人工智能研究會議”,其實它不同于今天我們召開幾天的學術(shù)會議,因為一來沒有什么可以報告的科研成果,二來這個會議持續(xù)了一個暑假。事實上,這是一次頭腦風暴式的討論會,這10位年輕的學者討論的是當時計算機尚未解決,甚至尚未開展研究的問題,包括人工智能、自然語言處理和神經(jīng)網(wǎng)絡等。
會上紐厄爾和西蒙討論了“邏輯理論家”,而麥卡錫則說服與會者接受“人工智能”一詞作為本領(lǐng)域的名稱。1956年達特矛斯會議上人工智能的名稱和任務得以確定,同時出現(xiàn)了最初的成就和最早的一批研究者,因此這一事件被廣泛承認為人工智能誕生的標志。
60年前的達特茅斯大學
黃金年代:1956 – 1974
達特茅斯會議之后的數(shù)年是大發(fā)現(xiàn)的時代。對許多人而言,這一階段開發(fā)出的程序堪稱神奇:計算機可以解決代數(shù)應用題,證明幾何定理,學習和使用英語。當時大多數(shù)人幾乎無法相信機器能夠如此“智能”。研究者們在私下的交流和公開發(fā)表的論文中表達出相當樂觀的情緒,認為具有完全智能的機器將在二十年內(nèi)出現(xiàn)。ARPA(國防高等研究計劃署)等政府機構(gòu)向這一新興領(lǐng)域投入了大筆資金。
第一代AI研究者們非常樂觀,曾作出了如下預言:
1958年,H. A. Simon,Allen Newell:“十年之內(nèi),數(shù)字計算機將成為國際象棋世界冠軍。” “十年之內(nèi),數(shù)字計算機將發(fā)現(xiàn)并證明一個重要的數(shù)學定理。”
1965年,H. A. Simon:“二十年內(nèi),機器將能完成人能做到的一切工作。”
1967年,Marvin Minsky:“一代之內(nèi)……創(chuàng)造‘人工智能’的問題將獲得實質(zhì)上的解決。”
1970年,Marvin Minsky:“在三到八年的時間里我們將得到一臺具有人類平均智能的機器。”
早期,人工智能使用傳統(tǒng)的人工智能方法進行研究,什么是傳統(tǒng)的人工智能研究呢?簡單的講,就是首先了解人類是如何產(chǎn)生智能的,然后讓計算機按照人的思路去做。因此在語音識別、機器翻譯等領(lǐng)域遲遲不能突破,人工智能研究陷入低谷。
第一次AI低谷:1974 – 1980
由于人工智能研究者們對項目難度評估不足,這除了導致承諾無法兌現(xiàn)外,還讓人們當初的樂觀期望遭到嚴重打擊。到了70年代,人工智能開始遭遇批評,研究經(jīng)費也被轉(zhuǎn)移到那些目標明確的特定項目上。
1972年康奈爾大學的教授弗雷德.賈里尼克(Fred Jelinek)被要求到IBM做語音識別。在之前各個大學和研究這個問題已經(jīng)花了20多年的時間,主流的研究方法有兩個特點,一個是讓計算機盡可能地模擬人的發(fā)音特點和聽覺特征,一個是讓計算機盡可能的方法理解人所講的完整的語句。對于前一項研究,有被稱為特征提取,后一項的研究大都使用傳統(tǒng)人工智能的方法,它基于規(guī)則和語義。
賈里尼克任務,人的大腦是一個信息源,從思考到找到合適的語句,再通過發(fā)音說出來,是一個編碼的過程,經(jīng)過媒介傳播到耳朵,是一個解碼的過程。既然是一個典型的通訊問題,那就可以用解決通訊方法來解決問題,為此賈里尼克用兩個數(shù)據(jù)模型(馬爾科夫模型)分別描述信源和信道。然后使用大量的語音數(shù)據(jù)來訓練。最后,賈里尼克團隊花了4年團隊,將語音識別從過去的70%提高到90%。后來人們嘗試使用此方法來解決其他智能問題,但因為缺少數(shù)據(jù),結(jié)果不太理想。
在當時,由于計算機性能的瓶頸、計算復雜性的指數(shù)級增長、數(shù)據(jù)量缺失等問題,一些難題看上去好像完全找不到答案。比如像今天已經(jīng)比較常見的機器視覺功能在當時就不可能找到一個足夠大的數(shù)據(jù)庫來支撐程序去學習,機器無法吸收足夠的數(shù)據(jù)量自然也就談不上視覺方面的智能化。
項目的停滯不但讓批評者有機可乘——1973年Lighthill針對英國人工智能研究狀況的報告批評了人工智能在實現(xiàn)其“宏偉目標”上的完全失敗,也影響到了項目資金的流向。人工智能遭遇了6年左右的低谷。
繁榮:1980 – 1987
在80年代,一類名為“專家系統(tǒng)”的AI程序開始為全世界的公司所采納,而“知識處理”成為了主流AI研究的焦點。1981年,日本經(jīng)濟產(chǎn)業(yè)省撥款八億五千萬美元支持第五代計算機項目。其目標是造出能夠與人對話,翻譯語言,解釋圖像,并且像人一樣推理的機器。
受到日本刺激,其他國家紛紛作出響應。英國開始了耗資三億五千萬英鎊的Alvey工程。美國一個企業(yè)協(xié)會組織了MCC(Microelectronics and Computer Technology Corporation,微電子與計算機技術(shù)集團),向AI和信息技術(shù)的大規(guī)模項目提供資助。DARPA也行動起來,組織了戰(zhàn)略計算促進會(Strategic Computing Initiative),其1988年向AI的投資是1984年的三倍。人工智能又迎來了大發(fā)展。
早期的專家系統(tǒng)Symbolics 3640
專家系統(tǒng)是一種程序,能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。最早的示例由Edward Feigenbaum和他的學生們開發(fā)。1965年起設(shè)計的Dendral能夠根據(jù)分光計讀數(shù)分辨混合物。1972年設(shè)計的MYCIN能夠診斷血液傳染病。它們展示了這一方法的威力。專家系統(tǒng)僅限于一個很小的知識領(lǐng)域,從而避免了常識問題;其簡單的設(shè)計又使它能夠較為容易地編程實現(xiàn)或修改??傊瑢嵺`證明了這類程序的實用性。直到現(xiàn)在AI才開始變得實用起來。
專家系統(tǒng)的能力來自于它們存儲的專業(yè)知識。這是70年代以來AI研究的一個新方向。Pamela McCorduck在書中寫道,“不情愿的AI研究者們開始懷疑,因為它違背了科學研究中對最簡化的追求。智能可能需要建立在對分門別類的大量知識的多種處理方法之上。” “70年代的教訓是智能行為與知識處理關(guān)系非常密切。有時還需要在特定任務領(lǐng)域非常細致的知識。”知識庫系統(tǒng)和知識工程成為了80年代AI研究的主要方向。
1982年,物理學家John Hopfield證明一種新型的神經(jīng)網(wǎng)絡(現(xiàn)被稱為“Hopfield網(wǎng)絡”)能夠用一種全新的方式學習和處理信息。大約在同時(早于Paul Werbos),David Rumelhart推廣了反向傳播算法,一種神經(jīng)網(wǎng)絡訓練方法。這些發(fā)現(xiàn)使1970年以來一直遭人遺棄的聯(lián)結(jié)主義重獲新生。
第二次AI低谷:1987 – 1993
“AI之冬”一詞由經(jīng)歷過1974年經(jīng)費削減的研究者們創(chuàng)造出來。他們注意到了對專家系統(tǒng)的狂熱追捧,預計不久后人們將轉(zhuǎn)向失望。事實被他們不幸言中:從80年代末到90年代初,AI遭遇了一系列財政問題。
變天的最早征兆是1987年AI硬件市場需求的突然下跌。Apple和IBM生產(chǎn)的臺式機性能不斷提升,到1987年時其性能已經(jīng)超過了Symbolics和其他廠家生產(chǎn)的昂貴的Lisp機。老產(chǎn)品失去了存在的理由:一夜之間這個價值五億美元的產(chǎn)業(yè)土崩瓦解。
XCON等最初大獲成功的專家系統(tǒng)維護費用居高不下。它們難以升級,難以使用,脆弱(當輸入異常時會出現(xiàn)莫名其妙的錯誤),成了以前已經(jīng)暴露的各種各樣的問題的犧牲品。專家系統(tǒng)的實用性僅僅局限于某些特定情景。到了80年代晚期,戰(zhàn)略計算促進會大幅削減對AI的資助。DARPA的新任領(lǐng)導認為AI并非“下一個浪潮”,撥款將傾向于那些看起來更容易出成果的項目。
1991年人們發(fā)現(xiàn)十年前日本人宏偉的“第五代工程”并沒有實現(xiàn)。事實上其中一些目標,比如“與人展開交談”,直到2010年也沒有實現(xiàn)。與其他AI項目一樣,期望比真正可能實現(xiàn)的要高得多。
走在正確的路上:1993 – 2005
現(xiàn)已年過半百的AI終于實現(xiàn)了它最初的一些目標。它已被成功地用在技術(shù)產(chǎn)業(yè)中,不過有時是在幕后。這些成就有的歸功于計算機性能的提升,有的則是在高尚的科學責任感驅(qū)使下對特定的課題不斷追求而獲得的。不過,至少在商業(yè)領(lǐng)域里AI的聲譽已經(jīng)不如往昔了。
“實現(xiàn)人類水平的智能”這一最初的夢想曾在60年代令全世界的想象力為之著迷,其失敗的原因至今仍眾說紛紜。各種因素的合力將AI拆分為各自為戰(zhàn)的幾個子領(lǐng)域,有時候它們甚至會用新名詞來掩飾“人工智能”這塊被玷污的金字招牌。AI比以往的任何時候都更加謹慎,卻也更加成功。
第一次讓全世界感到計算機智能水平有了質(zhì)的飛躍實在1966年,IBM的超級計算機深藍大戰(zhàn)人類國際象棋冠軍卡斯伯羅夫,卡斯伯羅夫是世界上最富傳奇色彩的國際象棋世界冠軍,這次比賽最后以4:2比分戰(zhàn)勝了深藍。對于這次比賽媒體認為深藍雖然輸了比賽,但這畢竟是國際象棋上計算機第一次戰(zhàn)勝世界冠軍兩局。時隔一年后,改進后的深藍卷土重來,以3.5:2.5的比分戰(zhàn)勝了斯伯羅夫。自從1997年以后,計算機下棋的本領(lǐng)越來越高,進步超過人的想象。到了現(xiàn)在,棋類游戲中計算機已經(jīng)可以完敗任何人類。
深藍實際上收集了世界上百位國際大師的對弈棋譜,供計算機學習。這樣一來,深藍其實看到了名家們在各種局面下的走法。當然深藍也會考慮卡斯伯羅夫可能采用的走法,對不同的狀態(tài)給出可能性評估,然后根據(jù)對方下一步走法對盤面的影響,核實這些可能性的估計,找到一個最有利自己的狀態(tài),并走出這步棋。因此深藍團隊其實把一個機器智能問題變成了一個大數(shù)據(jù)和大量計算的問題。
IBM“深藍”戰(zhàn)勝國際象棋世界冠軍
越來越多的AI研究者們開始開發(fā)和使用復雜的數(shù)學工具。人們廣泛地認識到,許多AI需要解決的問題已經(jīng)成為數(shù)學,經(jīng)濟學和運籌學領(lǐng)域的研究課題。數(shù)學語言的共享不僅使AI可以與其他學科展開更高層次的合作,而且使研究結(jié)果更易于評估和證明。AI已成為一門更嚴格的科學分支。
Judea Pearl發(fā)表于1988年的名著將概率論和決策理論引入AI。現(xiàn)已投入應用的新工具包括貝葉斯網(wǎng)絡,隱馬爾可夫模型,信息論,隨機模型和經(jīng)典優(yōu)化理論。針對神經(jīng)網(wǎng)絡和進化算法等“計算智能”范式的精確數(shù)學描述也被發(fā)展出來。
大數(shù)據(jù):2005 – 現(xiàn)在
從某種意義上講,2005年是大數(shù)據(jù)元年,雖然大部分人感受不到數(shù)據(jù)帶來的變化,但是一項科研成果卻讓全世界從事機器翻譯的人感到震驚,那就是之前在機器翻譯領(lǐng)域從來沒有技術(shù)積累、不為人所知的Google,以巨大的優(yōu)勢打敗了全世界所有機器翻譯研究團隊,一躍成為這個領(lǐng)域的領(lǐng)頭羊。
就是Google花重金請到了當時世界上水平最高的機器翻譯專家弗朗茲·奧科 (Franz Och)博士。奧科用了上萬倍的數(shù)據(jù)來訓練系統(tǒng)。量變的積累就導致了質(zhì)變的發(fā)生。奧科能訓練出一個六元模型,而當時大部分研究團隊的數(shù)據(jù)量只夠訓練三元模型。簡單地講,一個 好的三元模型可以準確地構(gòu)造英語句子中的短語和簡單的句子成分之間的搭配,而六元模型則可以構(gòu)造整個從句和復雜的句子成分之間的搭配,相當于將這些片段從一種語言到另一種語言直接對譯過去了。不難想象,如果一個系統(tǒng)對大部分句子在很長的片段上直譯,那么其準確性相比那些在詞組單元做翻譯的系統(tǒng)要準確得多。
如今在很多與“智能”有關(guān)的研究領(lǐng)域,比如圖像識別和自然語言理解,如果所采用的方法無法利用數(shù)據(jù)量的優(yōu)勢,會被認為是落伍的。
數(shù)據(jù)驅(qū)動方法從20世紀70年代開始起步,在八九十年代得到緩慢但穩(wěn)步的發(fā)展。進入21世紀后,由于互聯(lián)網(wǎng)的出現(xiàn),使得可用的數(shù)據(jù)量劇增,數(shù)據(jù)驅(qū)動方法的優(yōu)勢越來越明顯,最終完成了從量變到質(zhì)變的飛躍。如今很多需要類似人類智能才能做的事情,計算機已經(jīng)可以勝任了,這得益于數(shù)據(jù)量的增加。
全世界各個領(lǐng)域數(shù)據(jù)不斷向外擴展,漸漸形成了另外一個特點,那就是很多數(shù)據(jù)開始出現(xiàn)交叉,各個維度的數(shù)據(jù)從點和線漸漸連成了網(wǎng),或者說,數(shù)據(jù)之間的關(guān)聯(lián)性極大地增強,在這樣的背景下,就出現(xiàn)了大數(shù)據(jù)。
大數(shù)據(jù)是一種思維方式的改變。現(xiàn)在的相比過去大了很多,量變帶來了質(zhì)變,思維方式、做事情的方法就應該和以往有所不同。這其實是幫助我們理解大數(shù)據(jù)概念的一把鑰匙。在有大數(shù)據(jù)之前,計算機并不擅長解決需要人類智能來解決的問題,但是今天這些問題換個思路就可以解決了,其核心就是變智能問題為數(shù)據(jù)問題。由此,全世界開始了新的一輪技術(shù)革命——智能革命。