一圖看懂AI陣營:學習AI 站錯隊可導致自取滅亡
AI的方法有許多,除了我們較為熟悉的“五大流派”,本文作者對AI的各流派進行細分,梳理了起碼17種方法,并用一張圖直觀地展現。作者說,各種AI方法并不平等,站錯隊可能導致自取滅亡。
“人工智能”是一個非常含糊的術語。這是因為人工智能(AI)是1955年在一種非常傲慢的情境下被創(chuàng)造出來的一個術語:
我們建議于1956年夏天在新罕布什爾漢諾威的達特茅斯學院進行一個為期2個月,10個人參加的人工智能研討會。
該研討會將基于如下設想進行:學習的每個方面或有關智能的其他特征原則上可以非常精確地進行描述,以至于能被機器模擬。我們將嘗試找到讓機器使用語言、形式抽象和概念的方式,解決現在只能由人類解決的問題,并提升人類智能。
——達特茅斯AI項目計劃提議書;J. McCarthy et al.; Aug. 31, 1955.
AI經歷了半個多世紀,也帶上了太多其他學科的印記。在很長一段時間里,AI被符號主義者統(tǒng)治。符號主義是一種基于規(guī)則的系統(tǒng),具有“零學習”(Zero Learning)特點。20世紀80年代,一種新的AI方法開始出現,我們稱之為機器學習。最后,還有“簡單學習”(Simple Learning)。然而,在最近十年里,最大的變化是我們偶然發(fā)現了“深度學習”,而且它殺傷力極強,似乎無所不能。
當然,這是一個非常簡化的AI歷史。實際上,AI領域有許多不同的方法和流派。Pedro Domingo在《終極算法》一書中描述了5個不同的AI “學派”。一位名為solidrocketfuel的Y Combinator用戶不甘示弱,發(fā)了條帖子,說AI 至少有“21個不同的流派”。
對于任何計劃搞AI 的人來說,一個非常重要的事情是了解AI 的這些不同學派和方法之間之間的差異。AI 不是一個同質的領域,而是不斷發(fā)生不同學派之間的爭議的領域。下圖是一個概況:
符號學派(Symbolists):是使用基于規(guī)則的符號系統(tǒng)做推理的人。大部分AI 都圍繞著這種方法。使用 Lisp 和 Prolog 的方法屬于這一派,使用 SemanticWeb,RDF 和 OWL 的方法也屬于這一派。其中一個最雄心勃勃的嘗試是 Doug Lenat 在80年代開發(fā)的 Cyc,試圖用邏輯規(guī)則將我們對這個世界的理解編碼。這種方法主要的缺陷在于其脆弱性,因為在邊緣情況下,一個僵化的知識庫似乎總是不適用。但在現實中存在這種模糊性和不確定性是不可避免的。
進化學派(Evolutionists):是應用進化的過程,例如交叉和突變以達到一種初期的智能行為的一派。這種方法通常被稱為遺傳算法(Genetic Algorithm,GA)。在深度學習中,GA 確實有被用來替代梯度下降法,所以它不是一種孤立的方法。這個學派的人也研究細胞自動機(cellular automata ),例如 Conway 的“生命游戲”和復雜自適應系統(tǒng)(GAS)。
貝葉斯學派(Bayesians):是使用概率規(guī)則及其依賴關系進行推理的一派。概率圖模型(PGM)是這一派通用的方法,主要的計算機制是用于抽樣分布的蒙特卡羅方法。這種方法與符號學方法的相似之處在于,可以以某種方式得到對結果的解釋。這種方法的另一個優(yōu)點是存在可以在結果中表示的不確定性的量度。Edward 是一個將這種方法與深度學習相結合的庫。
核保守派(Kernel Conservatives):在深度學習之前,最成功的方法之一是 SVM。Yann LeCun 曾稱這種方法為模板匹配方法。該方法有一個被稱為核的技巧,可以使非線性分離問題變成線性問題。這一派的研究者喜歡他們的方法所具有的數學美感。他們認為深度學習派只不過是煉金術士,在沒有對后果有所了解的情況下就念起咒語。
Tree Huggers?:是使用基于樹的模型的人,例如隨機森林和梯度提升決策樹。這些本質上都是邏輯規(guī)則樹,它們遞歸地分割域以構建分類器。這種方法實際上在許多 Kaggle 比賽中都相當有效。微軟提出的一種方法是將基于樹的模型與深度學習結合起來。
聯(lián)結學派(Connectionists):這一派的研究者相信智能起源于高度互聯(lián)的簡單機制。這種方法的第一個具體形式是出現于1959年的感知器。自那以后,這種方法消亡又復活了好幾次。其最新的形式是深度學習。
深度學習中包含許多子方法。包括:
The Canadian Conspirators?:Hinton,LeCun,Bengio 等人,推崇無需人工進行特征工程的端到端深度學習。
Swiss Posse:基本上是 LSTM,以及兩種結合的 RNN 解決知覺的問題。根據 LeCun 的說法,GAN 是“最近20世紀最酷的東西”,也被聲稱是這幫人發(fā)明的。
British AlphaGoist:這幫人相信,AI = 深度學習 + 強化學習,盡管 LeCun 稱強化學習只是蛋糕上的櫻桃。DeepMind 是這一派的主要支持者。
Predictive Learners:這個詞是 Yann LeCun 用來形容無監(jiān)督學習的,這是 AI 主要的一個未解決的領域。然而,我傾向于相信解決方案在于“元學習”(Meta-Learning)。
除了上面描述的主流方法外,還有一些不是特別主流的方法:
Compressionists:認為認知和學習就是壓縮(compression),這實際上也是其他學派共同的觀點。信息理論起源于關于壓縮的論證。這是一個普遍的概念,比所有經常被濫用的集合統(tǒng)計工具更強大。
Complexity Theorists:這一派的人采用來自物理學,基于能量的模型,復雜性理論,混沌理論和統(tǒng)計力學的方法。Swarm AI 可以說屬于這一派。如果任何團隊稱他們能找到深度學習為什么能起效的很好的解釋,那么他們可能是這一派的。
Fuzzy Logicians?:這種方法曾經很受歡迎,但最近比較少見。最近有一個使用模糊規(guī)則在 mock dogfight 中打敗一個戰(zhàn)斗機飛行員的研究。
Biological Inspirationalists:這一派傾向于創(chuàng)造更接近于生物學中的神經元的模型。例子是 Numenta,pike-and-Integrate,以及 IBM 的 TrueNorth 芯片。
Connectomeist:這些人相信大腦的互連(即:Connectome)是智能的來源。有一個項目試圖復制一個虛擬的蠕蟲,也有一些得到雄厚資助的研究,試圖以這種方式映射大腦。
Information Integration Theorists:認為意識來源于機器的內部想象,反映了現實的因果關系。這一派的動機是,如果我們想要理解意識,那么我們至少需要開始思考意識。然而,我沒法在他們的方法中找到學習和意識的關系。在他們認為,這兩者可能是不相關的。
PAC Theorists:這一派的人并不是真的想討論人工智能,而只是喜歡研究智能,因為至少他們承認智能的存在。他們的整體思想是自適應系統(tǒng)可以方便地執(zhí)行計算,其結果都能大致正確。簡言之,在他們看來智能不需要大規(guī)模的計算。
總而言之,這些 AI 的方法令人眼花繚亂。而且我確信還有我沒發(fā)現的別的方法。有些方法彼此水火不容,而另一些方法可以結合使用。但是,寫這篇文章我想指出的是,對這些眼花繚亂的方法都了解一點,有助于讓你在這個領域找到路徑。
最后,讓我們看看 Shivon Zilis 制作的《機器學習生態(tài)全景圖》:
有很多公司聲稱自己是 AI 公司,在搞 AI 研究。你需要向他們提一個直截了當的問題。就是這些公司都在使用什么 AI 方法?因為這里面的一個嚴峻的現實是,并不是所有的 AI 都是平等的。換句話說,“有些 AI 比其他 AI 更平等”。我們的提議是,現在與深度學習相關的方法勢頭正猛。很簡單,因為它與學習有關。如果你的 AI 方法沒有一個強大的學習機制,那么注定是 Doug Lenat 那般的命運,也就是必須人工編寫所有規(guī)則!其他的方法往往都是死胡同。
最好的方法之一是將深度學習與其他算法相結合。AlphaGo 便是這樣,使用了蒙特卡洛樹搜索技術和深度學習的結合??紤]到符號學的方法與深度學習具有互補的優(yōu)勢和弱點,它們的結合也是非常有前途的。展望未來,將是深度學習一統(tǒng) AI 之天下。不過,深度學習與其他 AI 方法相結合同樣有前途。不要忽視這個現實,否則只會自取滅亡。
關注網易智能菌(微信公眾號:smartman163),獲取專業(yè)人工智能資訊與AI報告。