想真正理解深度學(xué)習(xí)?需要知道這三件事
對于喜歡數(shù)據(jù)的專業(yè)人士來說,潛水堪稱完美運動,因為收集數(shù)據(jù)是潛水的重要組成部分。慢慢地下降到深海中,你可以想象自己首次浸入未被開發(fā)的數(shù)據(jù)湖中。在成千上萬的水下生物中,你可以尋找最大的魚、最艷麗的珊瑚,這就像在龐大的數(shù)據(jù)集中尋找隱藏的洞見。
但是深度并非只與深海潛水有關(guān)。作為重要的概念,它在分析和機器智能領(lǐng)域也變得越來越重要。人工神經(jīng)網(wǎng)絡(luò),即模仿人類大腦建立的、處理單元(人工神經(jīng)元)相互關(guān)聯(lián)的計算機模型,已經(jīng)出現(xiàn)數(shù)十年了。早期,這些神經(jīng)網(wǎng)絡(luò)通常有1個或2個隱藏神經(jīng)元層組成,現(xiàn)在已經(jīng)從淺層結(jié)構(gòu)進化到深層結(jié)構(gòu),后者又被稱為深度學(xué)習(xí)。這種轉(zhuǎn)變依賴于大規(guī)模建造大型和并行模型的成本不斷下降,以及訓(xùn)練深度模型所需大型多維數(shù)據(jù)集的日益增多。
但要想真正理解深度學(xué)習(xí),你需要首先了解這三件事:
1.深度學(xué)習(xí)是機器學(xué)習(xí)分支
從本質(zhì)上看,深度學(xué)習(xí)隸屬于機器學(xué)習(xí)范疇。但是標(biāo)準(zhǔn)的機器學(xué)習(xí)通常需要手工從數(shù)據(jù)中提煉模式,耗時費力。而深度學(xué)習(xí)模型擅長于自動捕獲隱藏于大數(shù)據(jù)中的復(fù)雜結(jié)構(gòu)模式,在對圖像、視頻、音頻以及文本數(shù)據(jù)進行分析時,這種能力擁有巨大優(yōu)勢,而依靠手工從數(shù)據(jù)中提取模式很快將達到極限。
2.深度學(xué)習(xí)不只是技術(shù)動力室
到目前為止,大量學(xué)術(shù)機構(gòu)和科技公司都在研究深度學(xué)習(xí),媒體對深度學(xué)習(xí)相關(guān)成果的報道也日益增多,這都大大促進了深度學(xué)習(xí)的普及?,F(xiàn)在,越來越多的公司正進入這個領(lǐng)域參加探索。有許多報道稱,數(shù)據(jù)科學(xué)家正將深度學(xué)習(xí)方法應(yīng)用到更廣泛的行業(yè)分析領(lǐng)域,比如客戶流失預(yù)測、金融欺詐調(diào)查、產(chǎn)品推薦等,傳統(tǒng)企業(yè)對深度學(xué)習(xí)的興趣日益增加。
3.深度學(xué)習(xí)的利弊權(quán)衡
企業(yè)需要了解,進入深度分析領(lǐng)域需要權(quán)衡利弊。盡管深度網(wǎng)絡(luò)構(gòu)架的精度可媲美甚至超越現(xiàn)有分析方式,但由此產(chǎn)生的模型通常是不透明的“黑盒子”,需要對其進行精調(diào)。深度學(xué)習(xí)往往需要預(yù)先架構(gòu)投資,以便能處理模型的復(fù)雜性。大型神經(jīng)網(wǎng)絡(luò)往往需要數(shù)小時乃至數(shù)天的訓(xùn)練,如果沒有事先考慮或準(zhǔn)備,這可能對數(shù)據(jù)科學(xué)團隊造成巨大影響。
為分析挑戰(zhàn)選擇正確的模型不僅僅是最大化模型精度的問題,它還受限于輸入數(shù)據(jù)集。當(dāng)涉及到傳統(tǒng)分析時,模型的可解釋性和簡單性往往比精度要求更高。而要處理大數(shù)據(jù)集,建模方法的性能和可擴展性都需要被考慮到。依賴非操作性模型協(xié)助發(fā)現(xiàn)洞見的要求,與全面可操作性的建模構(gòu)架完全不同。