來(lái)看看人工智能AI創(chuàng)造的精彩“世界”
文/驢打滾
第一次工業(yè)革命,18世紀(jì)60年代——19世紀(jì)中期,人類開始進(jìn)入蒸汽時(shí)代。從此以后,人類的動(dòng)力來(lái)源由當(dāng)初的動(dòng)物或者人變成了蒸汽機(jī)和煤炭,機(jī)械代替了手工作坊;
第二次工業(yè)革命,19世紀(jì)下半葉——20世紀(jì)初,人類進(jìn)入電器時(shí)代,同時(shí)內(nèi)燃機(jī)出現(xiàn)。電能的規(guī)?;褂?,極大提高了生產(chǎn)效率;
第三次工業(yè)革命,20世紀(jì)四五十年代-至今,人類進(jìn)入計(jì)算機(jī)時(shí)代,同時(shí)還出現(xiàn)原子能技術(shù)、航天技術(shù)、人工合成材料、分子生物學(xué)和遺傳工程等高新技術(shù)。計(jì)算機(jī)使信息數(shù)字化,推動(dòng)智能化的發(fā)展;
第四次工業(yè)革命,正在發(fā)生,讓機(jī)器能夠模仿人類學(xué)習(xí)以及其他方面的智能,進(jìn)行深度思考并且做出決策是第四次工業(yè)化革命最重要的事情。
來(lái)讓我們看看AI給我們帶來(lái)的精彩的世界。
人工智能的發(fā)展史與大事件
1956年8月,在美國(guó)漢諾斯小鎮(zhèn)寧?kù)o的達(dá)特茅斯學(xué)院中,約翰·麥卡錫(JohnMcCarthy)、馬文·閔斯基(Marvin Minsky,人工智能與認(rèn)知學(xué)專家)、克勞德·香農(nóng)(ClaudeShannon,信息論的創(chuàng)始人)、艾倫·紐厄爾(Allen Newell,計(jì)算機(jī)科學(xué)家)、赫伯特·西蒙(HerbertSimon,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主)等科學(xué)家正聚在一起,討論著一個(gè)完全不食人間煙火的主題:用機(jī)器來(lái)模仿人類學(xué)習(xí)以及其他方面的智能。
會(huì)議足足開了兩個(gè)月的時(shí)間,雖然大家沒(méi)有達(dá)成普遍的共識(shí),但是卻為會(huì)議討論的內(nèi)容起了一個(gè)名字:人工智能。因此,1956年也就成為了人工智能元年。AI由此誕生,在隨后的日子里,AI成為實(shí)驗(yàn)室的“幻想對(duì)象”。
受限于工業(yè)條件和認(rèn)知程度,人工智能在此后近30年的時(shí)間里并沒(méi)有太大進(jìn)步。直到上世紀(jì)90年代,人工智能才得到了突飛猛進(jìn)的發(fā)展。
1997年,國(guó)際象棋程序“深藍(lán)”擊敗了世界冠軍卡斯帕羅夫,人工智能的“腦力”優(yōu)勢(shì)現(xiàn)出端倪;
2007年,西洋跳棋程序奇努克正式將跳棋完成破解,最強(qiáng)大的跳棋高手在零失誤的情況下,也只能和奇努克打成平局;
2008年,在拉斯維加斯的德州撲克大賽中,人工智能“北極星2”依然在常規(guī)時(shí)間里輕松擊敗眾人;
2016年谷歌人工智能AlphaGo4:1戰(zhàn)勝韓國(guó)棋手李世石九段。
人工智能已然做到了顛覆人類認(rèn)知。
AI發(fā)展史與大事件
人工智能的智能水平及算法
AI,機(jī)器來(lái)模仿人類學(xué)習(xí)以及其他方面的智能,展現(xiàn)人類的智力。
回到1956年夏天,在當(dāng)時(shí)的會(huì)議上,AI先驅(qū)的夢(mèng)想是建造一臺(tái)復(fù)雜的機(jī)器(讓當(dāng)時(shí)剛出現(xiàn)的計(jì)算機(jī)驅(qū)動(dòng)),然后讓機(jī)器呈現(xiàn)出人類智力的特征。
這一概念就是我們所說(shuō)的“強(qiáng)人工智能Artificial General Intelligence (AGI)”,讓機(jī)器擁有人類的所有感知,甚至還可以超越人類感知,它可以像人一樣思考。
還有一個(gè)概念是“弱人工智能Artificial Narrow Intelligence (ANI)”。簡(jiǎn)單來(lái)講,“弱人工智能”可以像人類一樣完成某些具體任務(wù),有可能比人類做得更好,例如,Pinterest服務(wù)用AI給圖片分類,F(xiàn)acebook用AI識(shí)別臉部,阿爾法狗(AlphaGo)只會(huì)下圍棋。
“弱人工智能”實(shí)際使用的案例,這些應(yīng)用已經(jīng)體現(xiàn)了一些人類智力的特點(diǎn)。怎樣實(shí)現(xiàn)的?這些智力來(lái)自何處?帶著問(wèn)題我們深入理解,就來(lái)到下一個(gè)圓圈,它就是機(jī)器學(xué)習(xí),而如何實(shí)現(xiàn)機(jī)器學(xué)習(xí)呢?就是算法。機(jī)器學(xué)習(xí)就是用算法真正解析數(shù)據(jù),不斷學(xué)習(xí),然后對(duì)世界中發(fā)生的事做出判斷和預(yù)測(cè)。
算法
1、決策樹
分類決策樹模型是一種描述對(duì)實(shí)例進(jìn)行分類的樹形結(jié)構(gòu)。決策樹由結(jié)點(diǎn)和有向邊組成。結(jié)點(diǎn)有兩種類型:內(nèi)部節(jié)點(diǎn)和葉節(jié)點(diǎn),內(nèi)部節(jié)點(diǎn)表示一個(gè)特征或?qū)傩裕~節(jié)點(diǎn)表示一個(gè)類。
分類的時(shí)候,從根節(jié)點(diǎn)開始,對(duì)實(shí)例的某一個(gè)特征進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果,將實(shí)例分配到其子結(jié)點(diǎn);此時(shí),每一個(gè)子結(jié)點(diǎn)對(duì)應(yīng)著該特征的一個(gè)取值。如此遞歸向下移動(dòng),直至達(dá)到葉結(jié)點(diǎn),最后將實(shí)例分配到葉結(jié)點(diǎn)的類中。
舉一個(gè)通俗的栗子,各位立志于脫單的單身男女在找對(duì)象的時(shí)候就已經(jīng)完完全全使用了決策樹的思想。假設(shè)一位母親在給女兒介紹對(duì)象時(shí),有這么一段對(duì)話:
母親與女兒對(duì)話
這個(gè)女生的決策過(guò)程就是典型的分類決策樹。相當(dāng)于對(duì)年齡、外貌、收入和是否公務(wù)員等特征將男人分為兩個(gè)類別:見(jiàn)或者不見(jiàn)。假設(shè)這個(gè)女生的決策邏輯如下:
決策流程
上圖完整表達(dá)了這個(gè)女孩決定是否見(jiàn)一個(gè)約會(huì)對(duì)象的策略,其中綠色結(jié)點(diǎn)(內(nèi)部結(jié)點(diǎn))表示判斷條件,橙色結(jié)點(diǎn)(葉結(jié)點(diǎn))表示決策結(jié)果,箭頭表示在一個(gè)判斷條件在不同情況下的決策路徑,圖中紅色箭頭表示了上面例子中女孩的決策過(guò)程。
決策樹的應(yīng)用用往往都是和某一應(yīng)用分析目標(biāo)和場(chǎng)景相關(guān)的,比如:金融行業(yè)可以用決策樹做貸款風(fēng)險(xiǎn)評(píng)估,保險(xiǎn)行業(yè)可以用決策樹做險(xiǎn)種推廣預(yù)測(cè),醫(yī)療行業(yè)可以用決策樹生成輔助診斷處置模型等等,當(dāng)一個(gè)決策樹的應(yīng)用分析目標(biāo)和場(chǎng)景確定,那該應(yīng)用分析目標(biāo)和場(chǎng)景所處的行業(yè)也就自然成為了決策樹的應(yīng)用領(lǐng)域。
2、貝葉斯
貝葉斯的統(tǒng)計(jì)學(xué)中有一個(gè)基本的工具叫貝葉斯公式,又被稱為貝葉斯定理。如果你看到一個(gè)人總是做一些好事,則那個(gè)人多半會(huì)是一個(gè)好人。這就是說(shuō),當(dāng)你不能準(zhǔn)確知悉一個(gè)事物的本質(zhì)時(shí),你可以依靠與事物特定本質(zhì)相關(guān)的事件出現(xiàn)的多少去判斷其本質(zhì)屬性的概率。
用貝葉斯定理過(guò)濾垃圾郵件
全球垃圾郵件的高峰出現(xiàn)在2006年,那時(shí)候所有郵件中90%都是垃圾,2015年6月份全球垃圾郵件的比例數(shù)字首次降低到50%以下。
最初的垃圾郵件過(guò)濾是靠靜態(tài)關(guān)鍵詞加一些判斷條件來(lái)過(guò)濾,效果不好,漏網(wǎng)之魚多,冤枉的也不少。
利用貝葉斯定理過(guò)濾郵件,首先選正常郵件和垃圾郵件做訓(xùn)練,兩種郵件數(shù)量越多之后效果越好,訓(xùn)練的過(guò)程就是統(tǒng)計(jì)在垃圾郵件中出現(xiàn)過(guò)的所有詞匯的頻次,和正常郵件中出現(xiàn)的所有的詞匯的頻次。
因?yàn)榈湫偷睦]件詞匯在垃圾郵件中會(huì)以更高的頻率出現(xiàn),所以在做貝葉斯公式計(jì)算時(shí),肯定會(huì)被識(shí)別出來(lái)。之后用最高頻的15個(gè)垃圾詞匯做聯(lián)合概率計(jì)算,聯(lián)合概率的結(jié)果超過(guò)90%將說(shuō)明它是垃圾郵件。
用貝葉斯過(guò)濾器可以識(shí)別很多改寫過(guò)的垃圾郵件,而且錯(cuò)判率非常低。甚至不要求對(duì)初始值有多么精確,精度會(huì)在隨后計(jì)算中逐漸逼近真實(shí)情況
3、神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一門重要的機(jī)器學(xué)習(xí)技術(shù)。它是目前最為火熱的研究方向--深度學(xué)習(xí)的基礎(chǔ)。
圖1 神經(jīng)細(xì)胞的結(jié)構(gòu)
人類大約有幾百億個(gè)腦細(xì)胞,每個(gè)腦細(xì)胞大約有幾百條腦神經(jīng),每條神經(jīng)上大約有幾百個(gè)突觸,每個(gè)突觸有幾百到幾千個(gè)蛋白質(zhì),一個(gè)腦細(xì)胞的作用大約相當(dāng)于一臺(tái)大型計(jì)算機(jī),一個(gè)突觸的作用大約相當(dāng)于計(jì)算機(jī)的一塊芯片??梢院芎?jiǎn)單地推算出來(lái),人的大腦相當(dāng)于上千億塊或上萬(wàn)億塊芯片。
神經(jīng)細(xì)胞和人身上任何其他類型細(xì)胞十分不同,每個(gè)神經(jīng)細(xì)胞都長(zhǎng)著一根像電線一樣的稱為軸突(axon)的東西,它的長(zhǎng)度有時(shí)伸展到幾厘米,用來(lái)將信號(hào)傳遞給其他的神經(jīng)細(xì)胞。神經(jīng)細(xì)胞的結(jié)構(gòu)如圖1 所示。它由一個(gè)細(xì)胞體(soma)、一些樹突(dendrite) 、和一根可以很長(zhǎng)的軸突組成。神經(jīng)細(xì)胞體是一顆星狀球形物,里面有一個(gè)核(nucleus)。樹突由細(xì)胞體向各個(gè)方向長(zhǎng)出,本身可有分支,是用來(lái)接收信號(hào)的。軸突也有許多的分支。軸突通過(guò)分支的末梢(terminal)和其他神經(jīng)細(xì)胞的樹突相接觸,形成所謂的突觸(Synapse), (圖中未畫出),一個(gè)神經(jīng)細(xì)胞通過(guò)軸突和突觸把產(chǎn)生的信號(hào)送到其他的神經(jīng)細(xì)胞。
有趣的事實(shí)
曾經(jīng)有人估算過(guò),如果將一個(gè)人的大腦中所有神經(jīng)細(xì)胞的軸突和樹突依次連接起來(lái),并拉成一根直線,可從地球連到月亮,再?gòu)脑铝练祷氐厍颉H绻训厍蛏纤腥说哪X中的神經(jīng)細(xì)胞的軸突和樹突連接起來(lái),則可以伸展到離開我們最近的星系!
神經(jīng)細(xì)胞利用電-化學(xué)過(guò)程交換信號(hào)。輸入信號(hào)來(lái)自另一些神經(jīng)細(xì)胞。這些神經(jīng)細(xì)胞的軸突末梢(也就是終端)和本神經(jīng)細(xì)胞的樹突相遇形成突觸(synapse),信號(hào)就從樹突上的突觸進(jìn)入本細(xì)胞。信號(hào)在大腦中實(shí)際怎樣傳輸是一個(gè)相當(dāng)復(fù)雜的過(guò)程,但就我們而言,重要的是把它看成和現(xiàn)代的計(jì)算機(jī)一樣,利用一系列的0和1來(lái)進(jìn)行操作。就是說(shuō),大腦的神經(jīng)細(xì)胞也只有兩種狀態(tài):興奮(fire)和不興奮(即抑制)。發(fā)射信號(hào)的強(qiáng)度不變,變化的僅僅是頻率。神經(jīng)細(xì)胞利用一種我們還不知道的方法,把所有從樹突突觸上進(jìn)來(lái)的信號(hào)進(jìn)行相加,如果全部信號(hào)的總和超過(guò)某個(gè)閥值,就會(huì)激發(fā)神經(jīng)細(xì)胞進(jìn)入興奮(fire)狀態(tài),這時(shí)就會(huì)有一個(gè)電信號(hào)通過(guò)軸突發(fā)送出去給其他神經(jīng)細(xì)胞。如果信號(hào)總和沒(méi)有達(dá)到閥值,神經(jīng)細(xì)胞就不會(huì)興奮起來(lái)。
正是由于數(shù)量巨大的連接,使得大腦具備難以置信的能力。盡管每一個(gè)神經(jīng)細(xì)胞僅僅工作于大約100Hz的頻率,但因各個(gè)神經(jīng)細(xì)胞都以獨(dú)立處理單元的形式并行工作著,使人類的大腦具有下面這些非常明顯的特點(diǎn):
能實(shí)現(xiàn)無(wú)監(jiān)督的學(xué)習(xí)。 你不會(huì)給一個(gè)孩子看一萬(wàn)輛車和一萬(wàn)匹馬來(lái)讓他學(xué)會(huì)識(shí)別馬和車。在看到了一些例子后他就充分理解了兩者的不同。就是它們能夠自己進(jìn)行學(xué)習(xí),而不需要導(dǎo)師的監(jiān)督教導(dǎo)。
Yann LeCun認(rèn)為無(wú)監(jiān)督學(xué)習(xí)才是人類和動(dòng)物智能發(fā)展的主要途徑。從某種意義上,無(wú)監(jiān)督學(xué)習(xí)讓人們看到了強(qiáng)人工智能的希望。
高度并行性,處理信息的效率極高。 由于人腦是超級(jí)巨大的并行運(yùn)算系統(tǒng),所有突觸以及每個(gè)突觸上的所有蛋白質(zhì),都可以瞬間同時(shí)運(yùn)動(dòng),蛋白質(zhì)之間又只有幾納米距離,電流在這個(gè)距離上一秒可運(yùn)行幾千億次,人腦運(yùn)算速度的數(shù)量級(jí)就大得沒(méi)法形容,大約1后面跟27個(gè)零到30個(gè)零。要知道,40億次,才不過(guò)是4后面跟9個(gè)零而已,差了大約20個(gè)數(shù)量級(jí)。
例如,大腦視覺(jué)皮層在處理通過(guò)我們的視網(wǎng)膜輸入的一幅圖象信號(hào)時(shí),大約只要100ms的時(shí)間就能完成。考慮到你的神經(jīng)細(xì)胞的平均工作頻率只有100Hz,100ms的時(shí)間就意味每秒只能完成10個(gè)計(jì)算步驟!想一想通過(guò)我們眼睛的數(shù)據(jù)量有多大,你就可以看到這真是一個(gè)難以置信的浩大工程了。
善于歸納推廣。 一種是形式化思維,是人腦演繹能力的表現(xiàn),具有邏輯的循序的特點(diǎn):一種是模糊性的思維,是人腦歸納能力的表現(xiàn),可同時(shí)進(jìn)行綜合的整體的思考。大腦和數(shù)字計(jì)算機(jī)不同,它極擅長(zhǎng)的事情之一就是模式識(shí)別,并能根據(jù)已熟悉信息進(jìn)行歸納推廣(generlize)。
例如,我們能夠閱讀他人所寫的手稿上的文字,即使我們以前從來(lái)沒(méi)見(jiàn)過(guò)他所寫的東西。
它是有意識(shí)的。人腦最獨(dú)特的是思維意識(shí) ,意識(shí)(consciousness)是神經(jīng)學(xué)家和人工智能的研究者廣泛而又熱烈地在辯論的一個(gè)話題。就目前的世界頂級(jí)科學(xué)家們也無(wú)法得知人的思維意識(shí)是怎樣產(chǎn)生的??涩F(xiàn)在的電腦想要做到那種程度要過(guò)多長(zhǎng)時(shí)間還是個(gè)未知數(shù)。而人腦和電腦最大的差別就在于,人腦的進(jìn)化速度要比電腦的進(jìn)化速度快多了。
因此,一個(gè)人工神經(jīng)網(wǎng)絡(luò)( Artificial neural network, ANN)簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò)(NN) 就是要在當(dāng)代數(shù)字計(jì)算機(jī)現(xiàn)有規(guī)模的約束下,來(lái)模擬這種大量的并行性, 并在實(shí)現(xiàn)這一工作時(shí),使它能顯示許多和人或動(dòng)物大腦相類似的特性。
在某些領(lǐng)域,AI還是“打敗”了人類。深度神經(jīng)網(wǎng)絡(luò)已經(jīng)可以應(yīng)用在交談、駕駛汽車,已經(jīng)能夠打敗電子游戲和圍棋冠軍,還能利用其繪制圖片,并進(jìn)行科學(xué)發(fā)現(xiàn)。
例如,圖片的設(shè)計(jì)和修改。在網(wǎng)站的更新和修改上,人工智能可以做得比人類更快速、更精準(zhǔn)。這種基礎(chǔ)技術(shù)可以給出普通用戶對(duì)于網(wǎng)站樣式的意見(jiàn),以告訴設(shè)計(jì)師這個(gè)網(wǎng)站設(shè)計(jì)得好不好。阿里的AI設(shè)計(jì)應(yīng)用“魯班",現(xiàn)更名為“鹿班”,可謂讓設(shè)計(jì)師瑟瑟發(fā)抖。
4、深度學(xué)習(xí)
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。有了深度學(xué)習(xí),機(jī)器學(xué)習(xí)才有了許多實(shí)際的應(yīng)用,它還拓展了AI的整體范圍。 深度學(xué)習(xí)將任務(wù)分拆,使得各種類型的機(jī)器輔助變成可能。無(wú)人駕駛汽車、更好的預(yù)防性治療、更好的電影推薦要么已經(jīng)出現(xiàn),要么即將出現(xiàn)。AI既是現(xiàn)在,也是未來(lái)。有了深度學(xué)習(xí)的幫助,也許到了某一天AI會(huì)達(dá)到科幻小說(shuō)描述的水平,這正是我們期待已久的。
AI是一個(gè)太龐大、太復(fù)雜的系統(tǒng)。AI給了世界,給了人們無(wú)限的想象空間和無(wú)線的可能。后面將會(huì)對(duì)AI的應(yīng)用作一篇詳細(xì)的論述,讓我們繼互聯(lián)網(wǎng)+之后認(rèn)識(shí)一下AI+。