想知道人工智能還能干什么?必須有個(gè)清醒的“貝葉斯意識”
有很多讀者在跟我們交流時(shí),都會(huì)提到非常驚訝于人工智能居然可以做這么多令人意想不到的事。從下圍棋到自動(dòng)駕駛,從辨識古文字到宇宙測繪,似乎有點(diǎn)無所不能的意思。也有讀者希望我們做個(gè)專題,專門列一個(gè)“你想不到AI居然可以做這些”的清單。
非常非常不好意思,我可以非常負(fù)責(zé)任的說,這清單太容易了,但問題是根本列不完。即使不考慮技術(shù)的可能性,僅僅是每天統(tǒng)計(jì)新的論文和研究報(bào)告里又讓AI能做什么了,那都是個(gè)近乎無法完成的工作。
但這并不是說AI已經(jīng)無所不能。事實(shí)上,AI在絕大多數(shù)基礎(chǔ)工作中并沒有傳統(tǒng)計(jì)算機(jī)效率高,完全談不上取而代之。AI總能在意想不到的領(lǐng)域冒出來,是因?yàn)樗扇×送耆煌牡讓硬呗?,專注于解決那些經(jīng)典計(jì)算和人工無法解決的問題。
所謂魚不如漁,與其大家一起感嘆“AI居然能做這個(gè)!”不如來思考“如何知道AI還能做哪些”。想要獲得這個(gè)能力,就需要知道今天主流AI解決方案的依據(jù)是什么。這就不得不提一個(gè)對AI發(fā)展至關(guān)重要的名字:貝葉斯。
想要尋找上帝,卻找到了人工智能
假如沒有貝葉斯他老人家,實(shí)在很難想象今天的人工智能會(huì)怎樣。也不僅是人工智能,可能統(tǒng)計(jì)學(xué)、應(yīng)用數(shù)學(xué)、測繪學(xué)、醫(yī)學(xué),甚至犯罪學(xué)都會(huì)受到巨大的影響。
但對學(xué)術(shù)如此重要的一個(gè)人,卻根本不是一位科學(xué)家。生活在300年前的托馬斯·貝葉斯,是英國的一名牧師。當(dāng)然,同時(shí)還是一位業(yè)余數(shù)學(xué)家。
可能是出于把愛好和工作融合到一起的考慮吧。貝葉斯提出了將歸納法應(yīng)用于概率統(tǒng)計(jì)的方法,希望能以此向世人證明上帝是存在的。但很不幸,三百年之后上帝存在的依據(jù)依然未找到,但貝葉斯決策卻在無數(shù)科學(xué)領(lǐng)域開花結(jié)果。
所謂貝葉斯歸納,其實(shí)基礎(chǔ)原理非常簡單。比如說一個(gè)人做了一件好事,那他是不是個(gè)好人呢?顯然不一定。但是假如一個(gè)人每天都做好事,那他是不是一個(gè)好人呢?其實(shí)也不一定,也可能他在背后十惡不赦喪盡天良,但假如沒有他做壞事的證據(jù),每天做好事就是好人顯然已經(jīng)概率非常大了。這就是貝葉斯歸納的核心邏輯:不必獲取所有證據(jù)之后再進(jìn)行判斷,而是結(jié)合已知條件先進(jìn)行判斷,再通過數(shù)據(jù)不斷去驗(yàn)證、調(diào)整、修改這個(gè)判斷,讓它無盡趨于合理化。
這個(gè)邏輯聽起來蠻簡單的,并且好像還有點(diǎn)不靠譜,在貝葉斯生前他的想法甚至沒有發(fā)表出來。即使其死后的兩百多年里,貝葉斯歸納也沒有得到多少重視。因?yàn)閺臄?shù)據(jù)嚴(yán)謹(jǐn)性出發(fā)的經(jīng)典統(tǒng)計(jì)學(xué)顯然可以更好的接觸事物本質(zhì),而不是像貝葉斯歸納一樣用“猜”來開啟計(jì)算。
直到上世紀(jì)七八十年代之后,沉寂百多年的貝葉斯理論開始重新在統(tǒng)計(jì)學(xué)中被重視。
因?yàn)榻?jīng)典統(tǒng)計(jì)學(xué)雖然可靠,但是卻需要依靠完整的數(shù)據(jù)模型,往往效率太低,無法滿足實(shí)際需求。比如說在搜尋海面遇難船只時(shí),經(jīng)典統(tǒng)計(jì)學(xué)需要每個(gè)海域的氣象數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)、過往船只數(shù)據(jù),然后綜合計(jì)算這些因素來精準(zhǔn)定位。但事實(shí)上,這些數(shù)據(jù)是不可能馬上齊全的,即使可以,分秒必爭的搜救工作也不能等。而用貝葉斯理論來解決這個(gè)問題,會(huì)先讓有經(jīng)驗(yàn)的專家主觀判斷船只失事海域,然后通過不斷獲得的數(shù)據(jù)一點(diǎn)點(diǎn)修正專家的判斷,爭取在最短時(shí)間內(nèi)解決問題——這就是著名的1968年美國天蝎號潛艇失事事件,也是貝葉斯理論進(jìn)入應(yīng)用化的標(biāo)志。
貝葉斯理論在工作中強(qiáng)調(diào)從人類先驗(yàn)知識出發(fā),對目標(biāo)進(jìn)行模糊判斷,然后不斷學(xué)習(xí)進(jìn)行判斷校對,這成為了后來大量人工智能技術(shù)的誕生起點(diǎn)。
300年前,本來希望用來證明上帝存在的理論,在300年后卻成為了人工智能的基礎(chǔ),這是一個(gè)悲傷的故事呢?
還是說貝葉斯牧師其實(shí)已經(jīng)找到了正確答案?
貝葉斯意識:一切學(xué)習(xí)型AI的基礎(chǔ)
與0和1組成的經(jīng)典計(jì)算不同,貝葉斯計(jì)算不需要建立在完整的數(shù)據(jù)基礎(chǔ)上就能獲得答案。這種不完全數(shù)據(jù)推理能力,與人類思維中的認(rèn)知與判斷過程非常相似。于是產(chǎn)生了數(shù)量眾多的貝葉斯理論與AI結(jié)合,運(yùn)用于不完全信息推導(dǎo)的技術(shù)模型。
比如說貝葉斯網(wǎng)絡(luò)、貝葉斯分類器、貝葉斯邏輯,都是如今非?;A(chǔ)的AI工具。貝葉斯網(wǎng)絡(luò)更是可以看做機(jī)器學(xué)習(xí)理論自證有效的基礎(chǔ)條件。而貝葉斯方法也被廣泛運(yùn)用在NLP、機(jī)器視覺、知識圖譜等領(lǐng)域,成為優(yōu)化結(jié)果型算法與技術(shù)的支撐。
在我們的生活中,貝葉斯可謂無處不在。比如說有沒有感覺你的手機(jī)拍視頻或者直播正在越來越清晰?這其中很大一個(gè)原因在于攝像算法中運(yùn)用了貝葉斯邏輯加持下的視頻優(yōu)化算法,通過對抗生成來獲得更清晰自然的拍攝效果,也就是所謂的視頻美顏。
從另一個(gè)角度也可以論證貝葉斯對人工智能的重要性。上世紀(jì)70年代,曾經(jīng)有過一次比較短暫的AI復(fù)興。當(dāng)時(shí)知識表示和專家系統(tǒng)成為了人工智能的主角,人們希望用超級計(jì)算機(jī)來歸納人類的所有知識,進(jìn)行網(wǎng)絡(luò)化。最終所有問題都可以在其中找到答案。
這種模式在當(dāng)時(shí)贏得了大量資金與關(guān)注,卻在短短幾年間宣告破產(chǎn)。因?yàn)槿祟愔R和數(shù)據(jù)太復(fù)雜了,收集所有知識只具有理論上的可能性,現(xiàn)實(shí)操作遙遙無期。
而今天以機(jī)器學(xué)習(xí)為主要特征的AI二次復(fù)興,很大程度收益于貝葉斯意識帶來的思維轉(zhuǎn)變:人類不用收集一大堆知識,只需要從一部分已有知識出發(fā),讓機(jī)器不斷去學(xué)習(xí)和驗(yàn)證自身能力,不斷提高就可以了。畢竟人類需要的不是全能全知的存在,只要智能體可以比人類更強(qiáng)就夠了。
可以說,貝葉斯意識依靠著對現(xiàn)實(shí)變化的高度敏感,已經(jīng)成為今天一切學(xué)習(xí)型AI的基礎(chǔ)。了解了貝葉斯意識中從不完整出發(fā),逐步向完整邁進(jìn)的邏輯,也就懂了未來AI還能做出什么。
人類大腦和技術(shù)未來的殊途同歸
有學(xué)者認(rèn)為,貝葉斯意識可能是最接近人類大腦思維模式的應(yīng)用數(shù)學(xué)邏輯。就像讓一個(gè)孩子去認(rèn)識狗,不必教他狗的種類、科屬、習(xí)性,也用把狗的耳朵、鼻子、四肢都變成數(shù)據(jù)讓他理解。孩子會(huì)馬上知道這是狗,然后在自己不斷的學(xué)習(xí)里去加強(qiáng)對狗的認(rèn)識,知道狗有不同種類,知道狼與狗的區(qū)別等等。
所以我們過去在思考很多問題時(shí),會(huì)主動(dòng)的讓大腦像計(jì)算機(jī)一樣去想象。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,我們又習(xí)慣了以手機(jī)為中心去思考一切。但在人工智能時(shí)代,貝葉斯意識告訴我們:也許人類該像人類自己一樣去思考了。
在某些技術(shù)奇點(diǎn)之后,機(jī)器已經(jīng)可以在局部區(qū)域像人類一樣通過局部知識去認(rèn)知、推理和判斷復(fù)雜問題。最好的例子可能就是AlphaGo ZERO的出現(xiàn)。其實(shí)AlphaGo的邏輯就是一種貝葉斯思維,要知道對圍棋來說經(jīng)典計(jì)算是無法窮盡所有變化的,暴力窮舉只能帶來死機(jī)。
而AlphaGo采取的,是讓智能體去學(xué)習(xí)圍棋規(guī)則,然后大量學(xué)習(xí)人類棋譜,這就是貝葉斯歸納中不斷吸收數(shù)據(jù)校準(zhǔn)目標(biāo)。在實(shí)戰(zhàn)的時(shí)候,智能體內(nèi)部算法還會(huì)自我驗(yàn)證每一步預(yù)測的合理性,最終求得最優(yōu)解。
而在一定的積累后,AlphaGo這個(gè)貝葉斯體系就可以不再依賴人類提供的數(shù)據(jù),而是通過對優(yōu)質(zhì)數(shù)據(jù)進(jìn)行自我學(xué)習(xí),從而在短時(shí)間內(nèi)產(chǎn)生了秒殺上一代的能力。這可以看做貝葉斯體系拜托了對初級數(shù)據(jù)的依賴,進(jìn)入了進(jìn)一步自我校準(zhǔn)的過程。
有理由相信,此后這類現(xiàn)象會(huì)陸續(xù)出現(xiàn)更多。因?yàn)槿四X的學(xué)習(xí)能力有若干限制,但貝葉斯智能體卻沒有。
通過模糊知識,進(jìn)行不斷學(xué)習(xí),最終通往廣義未知。很可能是人腦與技術(shù)未來的共同方向。至少目前來看,這種技術(shù)邏輯在前瞻性科學(xué)中的應(yīng)用已經(jīng)越來越多。比如量子貝葉斯、貝葉斯基因算法等等。
而另一方面,想知道人工智能還能在哪些領(lǐng)域做出驚人之舉。不妨也像貝葉斯一樣去思考:首先這個(gè)領(lǐng)域是否存在效率、可靠性、成本比率、盲目性等問題,如果有的話是否必要引入AI。其次看一下這個(gè)領(lǐng)域是不是存在先驗(yàn)知識,作為智能體的基礎(chǔ)。再次看一下這個(gè)領(lǐng)域能否源源不斷產(chǎn)生提供給機(jī)器學(xué)習(xí)的數(shù)據(jù)和知識。
如果這幾個(gè)條件都確立,那么AI已經(jīng)不遠(yuǎn)了。
經(jīng)過PC到手機(jī)的漫長教化,我們可能已經(jīng)習(xí)慣了數(shù)字化的世界運(yùn)行。但人工智能卻可能打破人與計(jì)算機(jī)的經(jīng)典搭配,利用人的感知與學(xué)習(xí)能力和計(jì)算機(jī)的運(yùn)算能力來打開另一條路。也許已經(jīng)是時(shí)候改變一下互聯(lián)網(wǎng)思維,讓大腦去和人工智能產(chǎn)生多一點(diǎn)點(diǎn)默契了。