人工智能那么火,你分得清機(jī)器學(xué)習(xí)和深度學(xué)習(xí)嗎?
人工智能最近引起了非常多的關(guān)注,深度學(xué)習(xí)和機(jī)器學(xué)習(xí)作為人工智能實(shí)現(xiàn)的技術(shù)的得到了充分的關(guān)注,在計(jì)算機(jī)視覺和自然語言處理等領(lǐng)域產(chǎn)生了巨大的影響,深度學(xué)習(xí)是無人駕駛汽車的關(guān)鍵技術(shù)。
深度學(xué)習(xí)是什么?
在深度學(xué)習(xí)中,計(jì)算機(jī)模型學(xué)習(xí)直接從圖像、文本或聲音中執(zhí)行分類任務(wù)。深度學(xué)習(xí)模式可以達(dá)到新的精確度,有時(shí)甚至超過人類的表現(xiàn)。大多數(shù)深度學(xué)習(xí)方法使用神經(jīng)網(wǎng)絡(luò)的架構(gòu),這也是深度學(xué)習(xí)模型通常被稱為深度神經(jīng)網(wǎng)絡(luò)的原因。
所謂深通常是指神經(jīng)網(wǎng)絡(luò)中隱藏層的數(shù)量,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)只包含2-3個(gè)隱藏層,而深度神經(jīng)網(wǎng)絡(luò)最多可以有150個(gè)。深度神經(jīng)網(wǎng)絡(luò)最受歡迎的類型之一是卷積神經(jīng)網(wǎng)絡(luò)(CNN或ConvNet),CNN通過輸入數(shù)據(jù)來卷積學(xué)習(xí)特征,并通過2D卷積圖層,使得這種架構(gòu)非常適合處理2D數(shù)據(jù)。
以一張圖片為例,一個(gè)訓(xùn)練有素的深度學(xué)習(xí)模型能夠自動(dòng)識(shí)別圖片中的物體,盡管它以前從未見過這些精確的圖片。在某些網(wǎng)站中識(shí)別上傳的照片中特定的人物等就是深度學(xué)習(xí)在發(fā)揮功能,今天在深度學(xué)習(xí)中應(yīng)用的很多技術(shù)已經(jīng)在業(yè)界使用了十多年,已經(jīng)比較成熟。
為什么深度學(xué)習(xí)近來人氣大增?
最主要的原因是準(zhǔn)確性,深度學(xué)習(xí)模式可以達(dá)到前所未有的精確度,有時(shí)甚至超過人類的表現(xiàn)。此外,還有另外兩個(gè)因素使該技術(shù)得到了業(yè)界的關(guān)注:
- 深度學(xué)習(xí)需要大量的標(biāo)記數(shù)據(jù)。如,無人駕駛汽車的發(fā)展需要以數(shù)百萬計(jì)的圖像和數(shù)千小時(shí)的視頻為基礎(chǔ),這些大量的標(biāo)記數(shù)據(jù)現(xiàn)在已經(jīng)可以輕松獲得。
- 深度學(xué)習(xí)需要大量的計(jì)算能力。高性能的GPU具有高效深度學(xué)習(xí)的并行架構(gòu),與集群或云計(jì)算結(jié)合使用時(shí),開發(fā)團(tuán)隊(duì)可以將深度學(xué)習(xí)網(wǎng)絡(luò)的培訓(xùn)時(shí)間從幾周縮短到幾個(gè)小時(shí)甚至更短。
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的差異
深度學(xué)習(xí)和機(jī)器學(xué)習(xí)都提供了訓(xùn)練模型和分類數(shù)據(jù)的方法,那么這兩者到底有什么區(qū)別?
使用標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)的方法,我們需要手動(dòng)選擇圖像的相關(guān)特征,以訓(xùn)練機(jī)器學(xué)習(xí)模型。然后,模型在對(duì)新對(duì)象進(jìn)行分析和分類時(shí)引用這些特征。
通過深度學(xué)習(xí)的工作流程,可以從圖像中自動(dòng)提取相關(guān)功能。另外,深度學(xué)習(xí)是一種端到端的學(xué)習(xí),網(wǎng)絡(luò)被賦予原始數(shù)據(jù)和分類等任務(wù),并且可以自動(dòng)完成。
另一個(gè)關(guān)鍵的區(qū)別是深度學(xué)習(xí)算法與數(shù)據(jù)縮放,而淺層學(xué)習(xí)數(shù)據(jù)收斂。淺層學(xué)習(xí)指的是當(dāng)用戶向網(wǎng)絡(luò)中添加更多示例和訓(xùn)練數(shù)據(jù)時(shí),機(jī)器學(xué)習(xí)的方式能夠在特定性能水平上達(dá)到平臺(tái)級(jí)。
如果需要在深度學(xué)習(xí)和機(jī)器學(xué)習(xí)之間作出抉擇,用戶需要明確是否具有高性能的GPU和大量的標(biāo)記數(shù)據(jù)。如果用戶沒有高性能GPU和標(biāo)記數(shù)據(jù),那么機(jī)器學(xué)習(xí)比深度學(xué)習(xí)更具優(yōu)勢(shì)。這是因?yàn)樯疃葘W(xué)習(xí)通常比較復(fù)雜,就圖像而言可能需要幾千張圖才能獲得可靠的結(jié)果。高性能的GPU能夠幫助用戶,在建模上花更少的時(shí)間來分析所有的圖像。
如果用戶選擇機(jī)器學(xué)習(xí),可以選擇在多種不同的分類器上訓(xùn)練模型,也能知道哪些功能可以提取出最好的結(jié)果。此外,通過機(jī)器學(xué)習(xí),我們可以靈活地選擇多種方式的組合,使用不同的分類器和功能來查看哪種排列最適合數(shù)據(jù)。
所以,一般來說,深度學(xué)習(xí)的計(jì)算量更大,而機(jī)器學(xué)習(xí)技術(shù)通常更易于使用。
深度學(xué)習(xí)的實(shí)際應(yīng)用
深度學(xué)習(xí)應(yīng)用程序的應(yīng)用涵蓋了自動(dòng)駕駛、醫(yī)療設(shè)備等行業(yè)。
- 自動(dòng)駕駛:汽車研究人員正在使用深度學(xué)習(xí)來自動(dòng)檢測(cè)停車標(biāo)志和交通信號(hào)燈等物體,此外,深度學(xué)習(xí)也被用來檢測(cè)行人,有助于減少事故。
- 工業(yè)自動(dòng)化:深度學(xué)習(xí)通過自動(dòng)檢測(cè)人員或物體何時(shí)處于機(jī)器不安全的距離,幫助改善重型機(jī)械周圍的工人安全
- Electronics:深度學(xué)習(xí)被用于自動(dòng)化聽覺和語音翻譯
對(duì)于非專業(yè)人士來說,深度學(xué)習(xí)似乎無法實(shí)現(xiàn),但是通過探索通用的深度學(xué)習(xí)工作流程,工程師和科學(xué)家現(xiàn)在可以快速、輕松地將深度學(xué)習(xí)應(yīng)用到他們的應(yīng)用程序中。
隨著深度學(xué)習(xí)逐漸向業(yè)界滲透,我們將會(huì)看到在計(jì)算機(jī)視覺、自然語言處理和機(jī)器人等領(lǐng)域被認(rèn)為是不可能的應(yīng)用將會(huì)出現(xiàn)創(chuàng)新和進(jìn)化。