什么監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)與深度學(xué)習(xí)?它們之間有什么區(qū)別和聯(lián)系? 原創(chuàng)
“ 監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)既有聯(lián)系,又有區(qū)別”
在學(xué)習(xí)機(jī)器學(xué)習(xí)的過(guò)程中,監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)和深度學(xué)習(xí)是我們經(jīng)常碰到幾個(gè)名詞。但很多人弄明白它們之間的關(guān)系,也不知道它們都能解決什么問(wèn)題。
01、什么是監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)和深度學(xué)習(xí)?
機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的一種方式,今天只從機(jī)器學(xué)習(xí)的角度來(lái)討論監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)和深度學(xué)習(xí)的關(guān)系。
簡(jiǎn)單來(lái)說(shuō),機(jī)器學(xué)習(xí)從學(xué)習(xí)方式來(lái)說(shuō),分為監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
深度學(xué)習(xí)也屬于機(jī)器學(xué)習(xí),只不過(guò)其是通過(guò)模仿人類神經(jīng)元構(gòu)造的神經(jīng)網(wǎng)絡(luò)模型,因?yàn)樯窠?jīng)網(wǎng)絡(luò)模型可以具有多層神經(jīng)網(wǎng)絡(luò),因此又叫深度學(xué)習(xí)。
所以說(shuō),監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)是兩種不同的學(xué)習(xí)方法,而深度學(xué)習(xí)是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的方式。
舉例來(lái)說(shuō),監(jiān)督學(xué)習(xí)相當(dāng)于有老師教,老師會(huì)告訴你怎么學(xué),什么是對(duì)的,什么是錯(cuò)的。而無(wú)監(jiān)督學(xué)習(xí)相當(dāng)于自學(xué),沒(méi)人告訴你應(yīng)該怎么學(xué),學(xué)成什么樣。而深度學(xué)習(xí)就相當(dāng)于是看書(shū)學(xué)習(xí),還是看視頻學(xué)習(xí),還是討論學(xué)習(xí)。
因此,深度學(xué)習(xí)即可以是監(jiān)督學(xué)習(xí),也可以是無(wú)監(jiān)督學(xué)習(xí);同樣,監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)即可以是深度學(xué)習(xí),也可以不是深度學(xué)習(xí)。
什么是監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)?
監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)最直接的體現(xiàn)就是數(shù)據(jù)標(biāo)注和學(xué)習(xí)目標(biāo)的區(qū)別。
監(jiān)督學(xué)習(xí)的特點(diǎn)是其訓(xùn)練數(shù)據(jù)需要進(jìn)行標(biāo)注,比如你想訓(xùn)練一個(gè)識(shí)別貓狗的模型;你就要告訴模型,哪些照片是貓,哪些照片是狗。比如,把貓的照片放到一個(gè)文件夾,狗的照片放一個(gè)文件夾,然后文件夾的名字就是貓和狗。
這樣,文件夾的名字就是數(shù)據(jù)的標(biāo)注/標(biāo)簽;而里面的照片就是訓(xùn)練數(shù)據(jù)。這就是監(jiān)督學(xué)習(xí),你要告訴它數(shù)據(jù)的標(biāo)注是什么,然后模型就可以根據(jù)標(biāo)簽去提取照片特征,然后就知道了什么是貓,什么是狗。
無(wú)監(jiān)督的特點(diǎn)就是不需要給數(shù)據(jù)標(biāo)注,讓它自己進(jìn)行識(shí)別。比如,你弄了一堆貓狗的照片混合在一起,交給模型;這時(shí)模型會(huì)根據(jù)自己的算法去給照片進(jìn)行分類。
這時(shí),模型可能會(huì)把這些照片分成一類或多種類別,雖然模型也不知道這些類別是什么。比如,模型發(fā)現(xiàn)它們身上都有毛,并且都是四肢著地,這時(shí)就可能把它們歸為有毛的一類。
模型也可能會(huì)發(fā)現(xiàn),雖然它們身上都有毛并且四肢著地,但其中一種動(dòng)物的嘴巴是長(zhǎng)的,另一個(gè)是扁的。這時(shí)就可能會(huì)把它們分為兩類。
所以,無(wú)監(jiān)督學(xué)習(xí)的目標(biāo)和監(jiān)督學(xué)習(xí)不同;監(jiān)督學(xué)習(xí)是有具體的學(xué)習(xí)目標(biāo),知道需要認(rèn)出狗和貓。而無(wú)監(jiān)督學(xué)習(xí)它不知道什么是貓,也不知道什么是狗,只知道根據(jù)數(shù)據(jù)的特點(diǎn),做出自己的判斷。
因此,監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的應(yīng)用場(chǎng)景也不同。舉個(gè)生活中的例子,比如你是班長(zhǎng),老師突然丟給你一堆學(xué)生的資料,然后讓你按照性別把資料給分開(kāi),這就是監(jiān)督學(xué)習(xí)。
而同樣的老師丟給你一堆學(xué)生資料,然后讓你整理一下,也沒(méi)告訴你按什么標(biāo)準(zhǔn)整理。這時(shí),你只能按照自己的經(jīng)驗(yàn),按性別分為一類,按住址分為一類,按照成績(jī),是否逃課等等標(biāo)準(zhǔn)進(jìn)行分類,這種行為也叫做聚類。這時(shí)就需要用到無(wú)監(jiān)督學(xué)習(xí)。
基于神經(jīng)網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)代碼如下:
上面兩個(gè)例子很好的說(shuō)明了監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的區(qū)別,一個(gè)目標(biāo)明確知道自己該干什么,一個(gè)目標(biāo)不明確,也不知道該干什么,只能根據(jù)自己的經(jīng)驗(yàn)盡可能的把它弄好。
可能有人會(huì)有疑問(wèn),無(wú)監(jiān)督學(xué)習(xí)這種情況也沒(méi)有明確目標(biāo),那做的有什么意義呢?也不知道有沒(méi)有用,不是在浪費(fèi)時(shí)間嗎?
例來(lái)說(shuō),互聯(lián)網(wǎng)中每天都會(huì)產(chǎn)生巨大的數(shù)據(jù)量,這些數(shù)據(jù)中到底隱藏著什么東西,我們沒(méi)人知道。而如果我們進(jìn)行人工處理,這需要多大的工作量,哪怕是使用大數(shù)據(jù)技術(shù)去處理,這也只能根據(jù)我們?nèi)祟惖慕?jīng)驗(yàn)去對(duì)這些數(shù)據(jù)進(jìn)行分門別類。
但如果交給無(wú)監(jiān)督學(xué)習(xí)模型,它就會(huì)根據(jù)自己的算法,用它自己的方式去處理這些數(shù)據(jù),這時(shí)就有可能會(huì)在我們?nèi)祟愊胂蟛坏降慕嵌劝l(fā)現(xiàn)問(wèn)題。就類似于小孩子,雖然他們的行為不受控制,并且出乎意料,但有時(shí)也會(huì)給我們帶來(lái)意想不到的驚喜和驚嚇。
至于深度學(xué)習(xí),如果把監(jiān)督學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)結(jié)合就可以訓(xùn)練出一個(gè)具有明確目標(biāo)的神經(jīng)網(wǎng)絡(luò)模型;而如果把無(wú)監(jiān)督學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)結(jié)合,那么就會(huì)訓(xùn)練出一個(gè)處理未知數(shù)據(jù)能力的模型。
02、監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)常見(jiàn)的方法
監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)常見(jiàn)的方法有以下幾種:
- 分類
- 回歸
- 序列標(biāo)注
分類常見(jiàn)算法有以下幾種:
- 支持向量機(jī)
- K鄰近算法
- 決策樹(shù)
- 隨機(jī)深林
- 神經(jīng)網(wǎng)絡(luò)
回歸類常見(jiàn)算法有:
- 線性回歸
- 多項(xiàng)式回歸
- 支持向量回歸
- 神經(jīng)網(wǎng)絡(luò)
序列標(biāo)注算法有:
- 馬可夫模型
- 條件隨機(jī)場(chǎng)
- 循環(huán)網(wǎng)絡(luò)
無(wú)監(jiān)督學(xué)習(xí)
而無(wú)監(jiān)督學(xué)習(xí)方法主要有:
- 聚類
- 降維
- 異常檢測(cè)
- 生成模型
聚類常見(jiàn)算法有:
- k均值聚類(k-Means Clustering)
- 層次聚類(Hierarchical Clustering)
- DBSCAN
降維常見(jiàn)算法有:
- 主成分分析(Principal Component Analysis, PCA)
- t分布鄰域嵌入(t-Distributed Stochastic Neighbor Embedding, t-SNE)
- 自編碼器(Autoencoder)的編碼部分
異常檢測(cè)常見(jiàn)算法有:
- 基于統(tǒng)計(jì)方法如均值和標(biāo)準(zhǔn)差
- 基于距離的方法如k近鄰算法
- 基于密度的方法如LOF(Local Outlier Factor)
生成模型常見(jiàn)算法有:
- 生成模型主要是無(wú)監(jiān)督學(xué)習(xí)使用神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)。
- 自編碼器
- 變分自編碼器(Variational Autoencoder, VAE)
- 生成對(duì)抗網(wǎng)絡(luò)(Generative)
目前來(lái)看,無(wú)監(jiān)督學(xué)習(xí)的主要難點(diǎn)在于損失的計(jì)算;因?yàn)闊o(wú)監(jiān)督學(xué)習(xí)沒(méi)用標(biāo)注也就導(dǎo)致其沒(méi)有一個(gè)標(biāo)準(zhǔn)的判斷條件,直接導(dǎo)致你無(wú)法判斷模型訓(xùn)練的到底效果怎么樣,只能在實(shí)際數(shù)據(jù)中去評(píng)估測(cè)試,所以無(wú)監(jiān)督學(xué)習(xí)目前還有很大的缺陷。
不過(guò)無(wú)監(jiān)督學(xué)習(xí)在生成模型方面有巨大的市場(chǎng)潛力,比如在藝術(shù)處理,聲音合成和圖片/視頻生成等領(lǐng)域。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/W2qZN7yIy5Pzazt0LQw4mw??
