自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

人工智能 深度學(xué)習(xí)
如果對(duì)當(dāng)今人工智能的主流技術(shù)——深度學(xué)習(xí)沒(méi)有了解,可能真的會(huì)有人覺(jué)得,當(dāng)前的科學(xué)家們?cè)趧?chuàng)造無(wú)所不能、無(wú)所不知的電影AI形象。那么,如何用最淺顯的方式,給大眾解釋什么是深度學(xué)習(xí)呢?快來(lái)看看吧!

在對(duì)技術(shù)毫無(wú)了解的人看來(lái),人工智能是什么?

《流浪地球》里的AI語(yǔ)音助手MOSS么?還是《終結(jié)者》里的天網(wǎng)?

如果對(duì)當(dāng)今人工智能的主流技術(shù)——深度學(xué)習(xí)沒(méi)有了解,可能真的會(huì)有人覺(jué)得,當(dāng)前的科學(xué)家們?cè)趧?chuàng)造無(wú)所不能、無(wú)所不知的電影AI形象。

那么,如何用最淺顯的方式,給大眾解釋什么是深度學(xué)習(xí)呢?

法國(guó)博主Jean-Louis Queguiner撰寫(xiě)了這篇《給我8歲的女兒解釋深度學(xué)習(xí)》,以用深度學(xué)習(xí)技術(shù)搭建識(shí)別手寫(xiě)數(shù)字的神經(jīng)網(wǎng)絡(luò)為例,用清晰的方式,解釋了深度學(xué)習(xí)的原理。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

這些數(shù)字每個(gè)人的寫(xiě)法都不一樣,要如何讓計(jì)算機(jī)判斷出這些手寫(xiě)體數(shù)字是幾呢?

1、和數(shù)數(shù)一樣簡(jiǎn)單

首先,考慮到0~9這十個(gè)數(shù)字,本身也是存在各種筆畫(huà)的,那我們就拆解開(kāi)來(lái),看每個(gè)手寫(xiě)體數(shù)字里,有多少橫豎撇捺,曲折彎彎。

左邊豎著的一列是是個(gè)數(shù)字,上方橫著的紅色字符則是拆解出來(lái)的筆畫(huà),用這個(gè)表格,來(lái)統(tǒng)計(jì)每個(gè)字符里有多少個(gè)相應(yīng)的筆畫(huà)。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

現(xiàn)在,我們來(lái)寫(xiě)一些新的數(shù)字,然后數(shù)一數(shù),這些新寫(xiě)的數(shù)字里,有多少個(gè)紅色的筆畫(huà),和上方的表格對(duì)比一下,就能判斷出這些新寫(xiě)的數(shù)字是幾了。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

比如,第一個(gè)數(shù)字里,有一個(gè)“ / ”,一個(gè)“丨”,我們發(fā)現(xiàn)有這種特征的,是“1”這個(gè)數(shù)字,而且完全符合,那第一個(gè)數(shù)字就是“1”。

第二個(gè)數(shù)字,上下左右半圓各有2個(gè),另外還有一個(gè)“ / ”,一個(gè)“丨”,總共10個(gè)筆畫(huà)。比較之下,會(huì)發(fā)現(xiàn)上表中的數(shù)字“8”有8個(gè)筆畫(huà)符合,數(shù)字“9”有6個(gè)筆畫(huà)符合,那么這第二個(gè)數(shù)字就是“8”。

看懂這一步,那恭喜你已經(jīng)搭建了世界上最簡(jiǎn)單的識(shí)別手寫(xiě)數(shù)字神經(jīng)網(wǎng)絡(luò)。

2、圖像即矩陣

矩陣這個(gè)概念,大部分8歲的小學(xué)生肯定是沒(méi)學(xué)過(guò)的,可以簡(jiǎn)單的理解為一串橫豎的格子里,每個(gè)放一個(gè)數(shù)。

對(duì)于計(jì)算機(jī)來(lái)說(shuō),每張照片都是細(xì)微的像素組成的,這些像素排列成矩陣格子,每個(gè)格子一個(gè)顏色,拼起來(lái)便是一副圖像。

比如這些紅紅綠綠的格子,你縮小來(lái)看,原來(lái)是一張草莓圖片的一部分。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

而顏色,對(duì)于計(jì)算機(jī)來(lái)說(shuō),正是用數(shù)表示的,草莓圖片中彩色的顏色是紅綠藍(lán)三種色光,各自有一個(gè)數(shù),總共三個(gè)數(shù);而手寫(xiě)數(shù)字都是黑白的,只要一個(gè)數(shù),0表示純黑色,255表示純白色,兩者中間的數(shù)則是灰色,數(shù)字越小顏色越深,數(shù)字越大顏色越淺。 

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

所以,看這個(gè)手寫(xiě)數(shù)字,一共28行28列,784個(gè)像素格子,沒(méi)有筆畫(huà)的黑色格子就是0,有筆畫(huà)的部分,筆畫(huà)中心是更淺的白色,數(shù)字在一兩百左右,筆畫(huà)邊緣則是灰色,數(shù)字只有幾十,這就構(gòu)成了這個(gè)手寫(xiě)數(shù)字的矩陣。

3、卷積層:找到筆畫(huà)輪廓

現(xiàn)在,我們知道了圖片的每個(gè)像素格子都是數(shù)字,但如何找出這些數(shù)字中的筆畫(huà)呢?

深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)是有許多許多“層”組成的,找輪廓這一步需要用到卷積層,本質(zhì)上就是在前面用數(shù)字表示的圖像上加一個(gè)過(guò)濾器,把沒(méi)有筆畫(huà)的部分過(guò)濾掉,留下有筆畫(huà)的部分。

過(guò)濾器就像下面這個(gè)玩具一樣,識(shí)別出圖案的輪廓,如果輪廓匹配,就可以放進(jìn)盒子里,輪廓不匹配,那就放不進(jìn)去,三角形的過(guò)濾器匹配三角形的木塊,正方形的過(guò)濾器匹配正方形的木塊。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

4、獨(dú)立過(guò)濾

過(guò)濾器過(guò)濾的過(guò)程就像這張動(dòng)畫(huà)一樣,每一次掃描都是獨(dú)立的,所以可以同時(shí)進(jìn)行許多次掃描,每次掃描互不干擾。 

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

5、重復(fù)卷積

前面的過(guò)程,是我們的手寫(xiě)數(shù)字圖像被多個(gè)過(guò)濾器過(guò)濾,但是為了提高準(zhǔn)確性,只要把前一次過(guò)濾的圖像再拿來(lái)過(guò)濾就好了,用的過(guò)濾器越多,過(guò)濾的次數(shù)越多,結(jié)果越準(zhǔn)確。

而且,由于手寫(xiě)的數(shù)字并不像玩具中的三角形、五角星一樣規(guī)整,每個(gè)人寫(xiě)數(shù)字“8”都可能寫(xiě)成不同的樣子,因此筆畫(huà)的布局都不一樣。

為了讓過(guò)濾出來(lái)的筆畫(huà)更清晰,需要不斷創(chuàng)建新的過(guò)濾器,直到過(guò)濾器被精確到我們前面看到的那些紅色橫豎撇捺半圓的形狀。

6、卷積:乘法和加法

但過(guò)濾中具體的掃描過(guò)程是怎樣的呢?

涉及到卷積運(yùn)算,比如下圖,左邊是一張8×8的圖像,中間是一個(gè)3×3的卷積濾波器,3×3的格子在8×8的圖像上逐一移動(dòng),挨個(gè)進(jìn)行卷積。 

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

這里,需要告訴大家卷積是怎樣算的。比如上圖,左邊的3×3格子的左上角是3,中間卷積過(guò)濾器的左上角是-1,那就需要把3和-1乘起來(lái),得到-3。以此類(lèi)推,同一位置的兩個(gè)數(shù)相乘,得到9個(gè)乘積,再把9個(gè)乘積加起來(lái),得到-3,就是卷積的結(jié)果。

當(dāng)然,圖上這個(gè)例子中涉及了負(fù)數(shù),如果小朋友還沒(méi)有學(xué)會(huì)負(fù)數(shù)的運(yùn)算,可以先不要理它,當(dāng)做一個(gè)整數(shù)就好啦。

7、池化層:把圖片變小,易于總結(jié)

經(jīng)過(guò)了復(fù)雜的卷積過(guò)程,我們現(xiàn)在需要進(jìn)行總結(jié)采樣,首先要把矩陣縮小,這里用到的是池化層。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

比如,把四個(gè)格子縮成一個(gè)格子,可以取四個(gè)格子的最大值、最小值、平均值、求和等,這樣矩陣的大小就只有原來(lái)的四分之一了。

8、神經(jīng)網(wǎng)絡(luò)

我們整個(gè)過(guò)程,是為了識(shí)別手寫(xiě)的數(shù)字是幾,這個(gè)過(guò)程叫做圖像分類(lèi),因?yàn)閿?shù)字只有10個(gè),所以需要把每個(gè)不同的手寫(xiě)數(shù)字分到0~9十類(lèi)中。

經(jīng)過(guò)了上面的多層處理,現(xiàn)在需要把它放進(jìn)類(lèi)中,需要準(zhǔn)備10個(gè)神經(jīng)元,每個(gè)代表一類(lèi),連接到最后一個(gè)池化層之后。

下面是Yann LeCun設(shè)計(jì)的最早的LeNet-5卷積神經(jīng)網(wǎng)絡(luò),這是圖像識(shí)別領(lǐng)域的幾個(gè)早期成果之一。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí) 

9、靠反向傳播實(shí)現(xiàn)自我改進(jìn)

不過(guò),整個(gè)過(guò)程不只靠卷積完成,還需要依靠神經(jīng)網(wǎng)絡(luò)自身學(xué)習(xí)和適應(yīng)的能力,比如借助一種叫做反向傳播的方法,靠權(quán)重來(lái)減少神經(jīng)元的數(shù)量。

簡(jiǎn)單來(lái)講,我們看神經(jīng)網(wǎng)絡(luò)的輸出的結(jié)果,如果輸出的這個(gè)分類(lèi)是錯(cuò)的,比如把手寫(xiě)的6認(rèn)成了9,我們就認(rèn)為,其中有一個(gè)過(guò)濾器犯了個(gè)錯(cuò)誤,是個(gè)不靠譜的過(guò)濾器,擔(dān)不起自己的責(zé)任,就把它的權(quán)重降低,下次神經(jīng)網(wǎng)絡(luò)就不會(huì)犯同樣的錯(cuò)誤了。

這樣,整個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)就擁有了學(xué)習(xí)能力,保持自我提升。

10、寫(xiě)在最后

找了數(shù)千張圖片,運(yùn)行了數(shù)十個(gè)過(guò)濾器,采樣輸出……所有的步驟都可以完美的同時(shí)搞定,因此適合在GPU上運(yùn)行。

另外,我們還沒(méi)有討論準(zhǔn)確率的問(wèn)題,在圖像識(shí)別競(jìng)賽ImageNet中,根據(jù)歷年的結(jié)果,我們可以看出,隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的增加,準(zhǔn)確率在不斷提升。 

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

最后,本文講得雖然是識(shí)別手寫(xiě)字母,但所有的圖像識(shí)別,無(wú)論是用于醫(yī)療還是用于自動(dòng)駕駛,原理都是一樣的,靠很多層神經(jīng)網(wǎng)絡(luò)、各種濾波器,在不同的矩陣上做各種變換。

也就是說(shuō),所有圖像識(shí)別都是在GPU上運(yùn)行的矩陣運(yùn)算。

傳送門(mén)

英文原文:

https://www.ovh.com/blog/deep-learning-explained-to-my-8-year-old-daughter/ 

 

責(zé)任編輯:龐桂玉 來(lái)源: 今日頭條
相關(guān)推薦

2022-08-13 13:00:43

SQL語(yǔ)言

2014-01-14 09:14:17

SQL數(shù)據(jù)庫(kù)

2020-09-28 14:25:39

HTTPS加密算法

2012-10-17 09:52:01

2023-02-24 15:10:46

機(jī)器學(xué)習(xí)數(shù)據(jù)集

2009-12-10 09:33:30

Linux驅(qū)動(dòng)開(kāi)發(fā)

2011-05-04 10:52:25

架構(gòu)網(wǎng)站

2010-12-17 17:46:54

負(fù)載均衡負(fù)載均衡配置

2012-08-28 13:13:08

Win 8Hyper-VCentOS

2013-03-05 10:48:59

虛擬桌面系統(tǒng)VDI

2010-05-27 15:50:39

2019-12-17 09:00:00

AI人工智能醫(yī)療診斷

2010-10-11 16:16:52

身份安全訪問(wèn)管理

2012-02-06 09:30:27

System Cent微軟私有云

2015-01-28 11:19:59

2011-12-21 09:41:44

虛擬化服務(wù)器虛擬化

2023-01-26 00:22:01

分布式架構(gòu)大文件

2012-12-28 09:58:50

程序員代碼編程

2018-09-29 10:05:54

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)神經(jīng)元

2014-08-29 10:06:25

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)