機器學習和深度學習的 5 個關(guān)鍵區(qū)別
繼系列上一篇 所以,機器學習和深度學習的區(qū)別是什么?淺談后,今天繼續(xù)深入探討兩者的更多區(qū)別。
前言
大多數(shù)人沒有意識到機器學習是人工智能(AI)的一種,它誕生于20世紀50年代。1959年,亞瑟·塞繆爾(Arthur Samuel)編寫了第一個計算機學習程序,在這個程序中,IBM計算機玩跳棋的時間越長,它就越擅長。快進到今天,當人工智能不僅僅是尖端技術(shù),相關(guān)工作薪資高,工作令人興奮。機器學習工程師的需求量很大,無論是數(shù)據(jù)科學家還是軟件工程師都不具備機器學習領(lǐng)域所需的技能。公司需要精通這兩個領(lǐng)域的專業(yè)人士,但他們既不能勝任數(shù)據(jù)科學家的工作,也不能勝任軟件工程師的工作。這類人群就是機器學習工程師。
“人工智能”、“機器學習”和“深度學習”這三個詞經(jīng)常交替出現(xiàn),但如果你正在考慮從事人工智能的職業(yè),了解它們之間的區(qū)別是很重要的。
根據(jù)牛津生活詞典,人工智能是“計算機系統(tǒng)的理論和發(fā)展,能夠執(zhí)行通常需要人類智能的任務,如視覺感知、語音識別、決策和語言間的翻譯。”盡管它們可能被稱為“智能,“有些人工智能計算機系統(tǒng)不能自己學習;這就是機器學習和深度學習的用武之地。
讓我們深入討論機器學習和深度學習到底是什么,以及機器學習和深度學習的區(qū)別。
什么是機器學習?
通過機器學習,計算機系統(tǒng)通過編程來學習輸入的數(shù)據(jù),而不需要重復編程。換言之,他們不斷地提高自己在任務上的表現(xiàn),例如,在沒有人幫助下玩游戲。機器學習被廣泛應用于藝術(shù)、科學、金融、醫(yī)療等領(lǐng)域。有不同的方法讓機器學習。有些是簡單的,如一個基本的決策樹;有些則要復雜得多,涉及多層人工神經(jīng)網(wǎng)絡。后者發(fā)生在深度學習中,我們一會兒再談。
機器學習之所以成為可能,不僅僅是因為亞瑟·塞繆爾(Arthur Samuel)在1959年的突破性計劃,使用了一個相對簡單(按今天的標準)的搜索樹作為其主要驅(qū)動程序,他的IBM計算機在跳棋方面不斷得到改進。
多虧了互聯(lián)網(wǎng),大量的數(shù)據(jù)被創(chuàng)建和存儲,這些數(shù)據(jù)可以提供給計算機系統(tǒng),幫助他們“學習”。使用Python進行機器學習是當今最流行的方法。
什么是深度學習?
有人認為深度學習是機器學習的下一個前沿,是最前沿的前沿。如果你看過Netflix,一些流媒體音樂服務會根據(jù)你過去聽過的歌曲,或你點贊過的歌曲,為你推薦觀看的內(nèi)容。這些能力都建立在深入學習的基礎(chǔ)上。谷歌的語音識別和圖像識別算法也使用深度學習。
正如機器學習被認為是人工智能的一種類型,深度學習通常被認為是機器學習的一種類型,有人稱之為子集。雖然機器學習使用簡單的概念,如預測模型,深度學習使用人工神經(jīng)網(wǎng)絡,旨在模仿人類的思維和學習方式。你可能還記得高中生物學中,人腦的主要細胞成分和主要計算元素是神經(jīng)元,每個神經(jīng)連接就像一臺小型計算機。大腦中的神經(jīng)元網(wǎng)絡負責處理各種輸入:視覺、感覺等。
與機器學習一樣,在深度學習的計算機系統(tǒng)中,還是一樣被喂數(shù)據(jù),但是信息往往是以巨大的數(shù)據(jù)集的形式存在的,因為深度學習系統(tǒng)需要大量的數(shù)據(jù)來理解,才能返回準確的結(jié)果。然后,人工神經(jīng)網(wǎng)絡根據(jù)數(shù)據(jù)提出一系列二元真/假問題,涉及高度復雜的數(shù)學計算,并根據(jù)得到的答案對數(shù)據(jù)進行分類。
因此,盡管機器學習和深度學習都屬于人工智能的一般分類,而且都是從數(shù)據(jù)輸入中“學習”,但兩者之間有一些關(guān)鍵的區(qū)別。
機器學習和深度學習的5個關(guān)鍵區(qū)別
1 人為干預
不像在機器學習系統(tǒng)中,人類需要根據(jù)數(shù)據(jù)類型(例如,像素值、形狀、方向)識別和手工編碼應用的特征,深度學習系統(tǒng)會試圖在不需要額外人工干預的情況下學習這些特征。以人臉識別程序為例,程序首先學習檢測和識別人臉的邊緣和線條,然后學習人臉的更重要部分,最后學習人臉的整體表示。這樣做所涉及的數(shù)據(jù)量是巨大的,隨著時間的推移和程序本身的訓練,得到正確答案的概率(即準確識別人臉)便會增加。這種訓練是通過使用神經(jīng)網(wǎng)絡進行的,類似于人腦的工作方式,不需要人重新編碼程序。
2 硬件
由于要處理的數(shù)據(jù)量和所用算法中涉及的數(shù)學計算的復雜性,深度學習系統(tǒng)比簡單的機器學習系統(tǒng)需要更強大的硬件。一種用于深度學習的硬件是圖形處理單元(gpu)。機器學習程序可以在低端機器上運行,不需要那么多算力。
3 時間
如您所料,由于深度學習系統(tǒng)需要大量的數(shù)據(jù)集,而且涉及到太多的參數(shù)和復雜的數(shù)學公式,因此深度學習系統(tǒng)可能需要花費大量的時間來訓練。機器學習可能只需要幾秒鐘到幾個小時,而深度學習可能需要幾個小時到幾個星期!
4 方法
機器學習中使用的算法傾向于對數(shù)據(jù)進行部分解析,然后將這些部分結(jié)合起來得到結(jié)果或解決方案。深度學習系統(tǒng)可以一下子解決整個問題或場景。例如,如果您想要一個程序來識別圖像中的特定對象(例如,它們是什么以及它們在停車場汽車牌照上的位置),您就必須通過機器學習完成兩個步驟:首先是對象檢測,然后是對象識別。但是,使用深度學習程序,您將輸入圖像,通過訓練,程序?qū)⒁淮涡缘玫揭炎R別對象和其在圖像中的位置。
5 應用
考慮到上面提到的所有其他差異,您可能已經(jīng)了解到機器學習和深度學習系統(tǒng)用于不同的應用程序。它們的用途:基本的機器學習應用程序包括預測程序(例如預測股票市場的價格或下一次颶風將在何時何地襲來)、垃圾電子郵件識別器,以及為醫(yī)療患者設計循證治療計劃的程序。
對于深度學習,除了上面提到的Netflix、音樂流服務和面部識別等例子之外,深度學習的一個廣為宣傳的應用是自動駕駛。這些程序使用多層神經(jīng)網(wǎng)絡來確定要避開的對象、識別紅綠燈以及知道何時加速或減速。
機器學習與深度學習的未來趨勢
機器學習和深度學習的未來蘊含著無窮的可能!越來越多的機器人不僅用在制造業(yè),而且在一些其他方面可以改善我們的日常生活方式。醫(yī)療行業(yè)也可能會發(fā)生變化,因為深度學習有助于醫(yī)生更早地預測或發(fā)現(xiàn)癌癥,從而挽救生命。在金融領(lǐng)域,機器學習和深度學習可以幫助公司甚至個人節(jié)省資金,更聰明地投資,更有效地分配資源。
而這三個領(lǐng)域僅僅是機器學習和深度學習未來趨勢的開始。許多需要改進的領(lǐng)域,現(xiàn)在仍然只是我們想象中的一個火花。