神經(jīng)網(wǎng)絡與人類思維間的深層關系
本文轉(zhuǎn)載自公眾號“讀芯術”(ID:AI_Discovery)。
人工智能席卷了世界,所謂的“機器學習算法”已經(jīng)滲透到現(xiàn)代技術各個可能的層面,它已成為義務而不是創(chuàng)新。有些人可能會爭論,我們今天使用的機器學習算法是否足夠自主到可以稱為真正的AI,這個爭論過于寬泛,并不是本文的重點。
在這篇文章中,我試圖探索神經(jīng)網(wǎng)絡與人類思維之間的深刻復雜性和深層關系。
當你開始在谷歌上輸入時,瀏覽器怎么就已經(jīng)猜到你在找什么呢?移動相機又如何在我們稱為照片的微小像素海洋中識別人臉呢?像Alexa、Siri或Google Home這樣的虛擬助理如何實現(xiàn)復雜的任務,例如安排會議、獲取天氣信息、閱讀睡前故事等呢?
所有這些問題的答案正是機器學習,更具體地說,是神經(jīng)網(wǎng)絡。
什么是神經(jīng)網(wǎng)絡?
本節(jié)意在告訴完全不了解深度學習的人什么是基本的神經(jīng)網(wǎng)絡。雖然實際涉及的數(shù)學更復雜,但這里的重點不是神經(jīng)網(wǎng)絡的工作方式,而是試圖理解他們與人類思維的聯(lián)系。
神經(jīng)元
神經(jīng)元是神經(jīng)網(wǎng)絡中最簡單的單位。神經(jīng)元所做的是從上一層中的所有神經(jīng)元接收輸入值(此案例中神經(jīng)元y的上一層用藍色表示,如x1, x2 , x3等等),并將每個輸入值與來自輸入值的神經(jīng)元相關的權(quán)重相乘。所以這里x1與w1相乘,x2與w2相乘等以此類推,所有這些乘法都是在神經(jīng)元y內(nèi)部增加的。
y=x1.w1 + x2*w2 +x3*w3……xm.wm
然后使用激活函數(shù)如Sigmoid、tanH、ReLU等將該求和值轉(zhuǎn)換為輸出值。那么這些激活函數(shù)又是什么呢?下面舉個sigmoid激活函數(shù)的例子。
Sigmoid激活函數(shù)
Sigmoid激活函數(shù)將任何輸入值(本案例中求和y即是Sigmoid函數(shù)的輸入值)轉(zhuǎn)換為0至1范圍內(nèi)的值。就這么簡單,添加輸入值和各自的權(quán)重到激活函數(shù)中就好啦。你的神經(jīng)元就會給你一個輸出值。
簡單的神經(jīng)網(wǎng)絡
這和神經(jīng)網(wǎng)絡一樣簡單。如你所見,這里的每個灰色圓圈都是一個神經(jīng)元,這個神經(jīng)網(wǎng)絡有三層:輸入層、隱藏層和輸出層。
現(xiàn)在,神經(jīng)網(wǎng)絡學會了自行處理任務,但它們是如何學習的呢?當然是通過數(shù)據(jù)。我們將在下一節(jié)中討論更多關于從數(shù)據(jù)中學習的內(nèi)容,但我們現(xiàn)在知道了,數(shù)據(jù)通過輸入層輸入到神經(jīng)網(wǎng)絡,在中間層進行處理,然后由輸出層輸出。
將圖像分類為貓和狗的神經(jīng)網(wǎng)絡
例如,如果你想讓一個神經(jīng)網(wǎng)絡從圖像中識別貓和狗,那么貓和狗的標簽圖像(標簽圖像意味著我們給神經(jīng)網(wǎng)絡一個正確的答案)就會輸入到神經(jīng)網(wǎng)絡,進行處理,神經(jīng)層猜測它是貓還是狗。現(xiàn)在,由于它有了圖像答案,便以這種方式調(diào)整不同神經(jīng)元之間的權(quán)重,來提高準確度。
人類思維——一個巨型神經(jīng)網(wǎng)絡
你有沒有觀察過蹣跚學步的孩子玩耍?他們總是如此好奇,渴望與周圍的世界互動。幼兒的大腦就像簡單而未經(jīng)訓練的神經(jīng)網(wǎng)絡,他們一出生就開始學習。由于神經(jīng)網(wǎng)絡在早期階段非常簡單,所以幼兒最早學的都是完成非?;镜娜蝿?,如行動、吃飯和爬行等等。
當一個初學走路的孩子拿著一個球時,他會觀察它的重量、形狀、握著它的感覺與皮膚周圍的變化等。這一觀察是他最初的部分學習過程,事實上也是在幫助他學習。幼兒玩球訓練了他的大腦,為下次的活動做好準備。
圖源:unsplash
現(xiàn)在,當他看到一個球,他就記得它是什么,拿著球和丟球的感覺如何。當孩子玩球次數(shù)越來越多,訓練就形成了。青少年幾乎是玩耍和投擲球的專家,盡管人們可能會認為投球是一項非常簡單的任務,但你為之所經(jīng)歷的學習,無論如何都不是捷徑。
正如前文所述,孩子的大腦就像一個簡單的神經(jīng)網(wǎng)絡,實現(xiàn)基本的任務,如走路、吃飯、說話等。隨著孩子的成長,他學會了更復雜的過程,如手和眼睛協(xié)調(diào),說話流利,吃飯不灑等。
有訓練神經(jīng)網(wǎng)絡經(jīng)驗的人認為,訓練一個簡單的網(wǎng)絡相對容易,但隨著增加更多神經(jīng)層,讓數(shù)據(jù)和終端輸出更加復雜,學習速度就會減慢。童年是學習一項新技能的最佳時機,因為與成年人相比,他們的神經(jīng)網(wǎng)絡更簡單,大腦沒有受過訓練,因此更容易將神經(jīng)元彎曲到你的意愿上。
當孩子長大后,隨著任務變得復雜,學習也變得困難。例如,解決棘手的問題、做出決策和判斷就是復雜任務,即便我們成年人也沒有停止學習和發(fā)展。大腦一直在學習,那么這種學習到底是如何發(fā)生的呢?
答案是——大腦重塑自己。就像神經(jīng)網(wǎng)絡中神經(jīng)元之間的權(quán)重和連接發(fā)生變化一樣,大腦也改變了數(shù)十億神經(jīng)元的連接,為了讓復雜的神經(jīng)網(wǎng)絡不僅保留之前接受的訓練,還能在此基礎上再接再厲,提升最終過程的復雜性。
正如你在閱讀這篇文章的時候,你大腦中的每個神經(jīng)元都在改變自己,改變它與數(shù)十億其他神經(jīng)元的聯(lián)系,在你自出生以來獲得的經(jīng)驗的基礎上增加經(jīng)驗。這就是學習的方式。每次你在學習,大腦都會重塑自己,這個過程就像訓練神經(jīng)網(wǎng)絡一樣。
數(shù)據(jù)就是一切
如今對科技巨頭來說,沒有什么比基于消費者的數(shù)據(jù)更重要。原因在于數(shù)據(jù)驅(qū)動“機器學習算法”。數(shù)據(jù)訓練神經(jīng)網(wǎng)絡,沒有數(shù)據(jù)就不可能學習。你一定遇到過下面這種驗證碼:
圖源:unsplash
答對這個驗證碼可能對你來說小菜一碟,但讓一個孩子來做,他可能答對但速度很慢。事實上,每次你在網(wǎng)絡上回答這樣的驗證碼,都可以幫助訓練機器人或神經(jīng)網(wǎng)絡。你實際上是在幫助準備數(shù)據(jù),訓練真正為你服務的模型??梢哉f,你已經(jīng)訓練了大量重要的模型。
就像我們?yōu)槿藶橹圃斓哪P蜏蕚涞臄?shù)據(jù)是最重要的一樣,人類的頭腦也是一個貪婪的網(wǎng)絡,在你生活的每個瞬間獲取大量的數(shù)據(jù)。數(shù)據(jù)在建設你,幫助你學習,把你變成智能機器。這就帶我們進入了人類大腦學習周圍數(shù)據(jù)的最終層面,即輸入層或者五官感覺。
五種感官

神經(jīng)網(wǎng)絡有一個輸入層,數(shù)據(jù)通過它理解和處理的模型形式進入網(wǎng)中。然后數(shù)據(jù)傳遞到隱藏層進行訓練,權(quán)重發(fā)生變化,最后輸出層給出了一個預測,無論區(qū)分出它是貓還是狗,還是根據(jù)學過的單詞完成一個句子。
由于我們把人類思維比作一個巨大的神經(jīng)網(wǎng)絡,只有當這個網(wǎng)絡也有一個輸入層時,它才是清楚的。視覺、聽覺、觸覺、味覺和嗅覺五種感官構(gòu)成了輸入層到大腦中。
視覺是所有五種感覺中最重要的,因為最大的數(shù)據(jù)變化就來自于這種感覺。訓練神經(jīng)網(wǎng)絡最好的數(shù)據(jù)集合要包含不同類型的數(shù)據(jù)和示例,而不止是一種數(shù)據(jù)。只有一種數(shù)據(jù)會導致模型過度擬合,這意味著當數(shù)據(jù)源于經(jīng)受訓練過的同類,可能會給出正確的結(jié)果,但是當數(shù)據(jù)偏離訓練數(shù)據(jù)規(guī)范時,精確度便受到威脅。
生活中大多數(shù)重要的學習過程中,眼睛是最活躍的。從走路到吃飯,從學習騎自行車到彈鋼琴,從與他人互動到電腦上打字,幾乎每一項任務都需要我們的眼睛。
聽覺也很重要,這在以前更為明顯,那時人類不得不在荒野中尋找食物,耳朵都集中在獵物發(fā)出的聲音上,他們的生存取決于這種感官。
觸覺也是人類最珍貴的感官之一。它使我們的手遠離燙爐,防止把沸騰的牛奶喂給嬰兒,讓人類接觸想要觸碰的對象。
雖然嗅覺和味覺對人類神經(jīng)網(wǎng)絡的主要學習貢獻不大,但它們有自身價值。這些感官有利于在生活成長和學習過程中探索趣味。聞到鮮花的芳香,品嘗美酒的醇厚,以及感受美好的生活,都是通過嗅覺和味覺來實現(xiàn)的。
現(xiàn)在,我們已經(jīng)了解了輸入層、數(shù)據(jù)和發(fā)生所有處理過程的神經(jīng)網(wǎng)絡。再舉個例子,把所有的拼圖塊放在一起,看看更大的畫面,即模式識別。
模式識別
以學習閱讀為例。眼睛是這里最重要的感官。孩子們學會閱讀要先學習字母,反復看字母,嘗試發(fā)音并寫出來。每次讀、說、寫都在訓練頭腦,提高準確性,直到寫出完整的字母表。
在神經(jīng)網(wǎng)絡受到相對簡單的訓練后,孩子會把單詞串在一起,現(xiàn)在聽覺起主要的作用。當他提到這些作品時,就在這些單詞中開啟識別模式,26個字母如何不同組合成大量的單詞,形成英語。
這種模式識別非常重要,可幫助孩子識別人臉、動物或玩具。成年人的模式識別變得非常強大,他們接受了大量訓練,處理海量數(shù)據(jù)幫助他們識別周圍的模式。根據(jù)經(jīng)驗預測是否會下雨,根據(jù)記憶和經(jīng)驗預測事件結(jié)果都是模式識別。福爾摩斯發(fā)現(xiàn)商隊里的莫里亞蒂教授,是因為他的袖子上有粉筆灰塵,這也是模式識別。
筆者雖然先解釋了神經(jīng)網(wǎng)絡如何工作,然后將人類的思維與它們進行了比較,但實際上是相反的。人類思維激發(fā)了神經(jīng)網(wǎng)絡。不然為什么你認為這些微小的功能被稱為神經(jīng)元。
人類思維是一個及其復雜的結(jié)構(gòu),它產(chǎn)生了這個世界上的每一個思想、行動、記憶、感覺和經(jīng)驗。進化給了人類一個強大的工具,我們今天嘗試把它復制到人工思維中,這樣類似奇跡的技術,我們稱之為神經(jīng)網(wǎng)絡。