四種不同類別的機器學習概述
我們可以根據(jù)算法執(zhí)行學習的方式將它們分為以下不同類別:
- 有監(jiān)督學習
- 無監(jiān)督學習
- 半監(jiān)督學習
- 強化學習
01 有監(jiān)督學習
有監(jiān)督學習是目前商業(yè)過程中最常見的機器學習形式。這些算法試圖找到映射輸入和輸出的函數(shù)的一個很好的近似。
為此,顧名思義,我們需要自己為算法提供輸入值和輸出值,并且嘗試找到一個能夠使預測值和實際輸出值之間誤差最小的函數(shù)。
學習階段稱為訓練(training)。模型經過訓練后,可以針對未見過的數(shù)據(jù)預測輸出。此階段通常被視為評分或預測,如圖1-1所示。
▲圖 1-1
02 無監(jiān)督學習
無監(jiān)督學習適用于未標記的數(shù)據(jù),因此我們不需要實際的輸出值,僅需要輸入。它嘗試在數(shù)據(jù)中查找模式并根據(jù)這些共同屬性做出反應,將輸入劃分為多個不同聚類(如圖1-2所示)。
▲圖 1-2
通常,無監(jiān)督學習通常與有監(jiān)督學習結合使用,以減少輸入空間并將數(shù)據(jù)中的信號集中在較少數(shù)量的變量上,但無監(jiān)督學習還有其他目標。從這個角度來看,當標記數(shù)據(jù)很昂貴或不太可靠時,無監(jiān)督學習比有監(jiān)督學習更適用。
常見的無監(jiān)督學習技術有聚類(clustering)和主成分分析(Principal Component Analysis,PCA)、獨立成分分析(Independent Component Analysis,ICA),以及一些神經網絡,例如生成對抗網絡(Generative Adversarial Network,GAN)和自編碼器(Autoencoder,AE)。
03 半監(jiān)督學習
半監(jiān)督學習是介于有監(jiān)督學習和無監(jiān)督學習之間的一種技術。它可以說不屬于機器學習中一個單獨的類別,而只是有監(jiān)督學習的一種泛化,但在這將其單獨列出是有用的。
其目的是通過將一些有標記的數(shù)據(jù)擴展到類似的未標記數(shù)據(jù),從而降低收集標記數(shù)據(jù)的成本。我們把一些生成模型分類為半監(jiān)督學習。
半監(jiān)督學習可以分為直推學習和歸納學習。直推學習適用于推斷未標記數(shù)據(jù)的標簽,歸納學習適用于推斷從輸入到輸出的正確映射。
我們可以看到此過程與我們在學校學習的大多數(shù)過程相似。老師向學生展示一些例子,并讓學生回家完成作業(yè)。為了完成這些作業(yè),他們需要進行泛化。
04 強化學習
強化學習(RL)是我們目前所見的最獨特的類別。這個概念非常有趣:該算法試圖找出一個策略來最大化獎勵總和。
該策略由使用它在環(huán)境中執(zhí)行動作的智能體來學習。然后,環(huán)境返回反饋,智能體使用該反饋來改進其策略。反饋是對所執(zhí)行動作的獎勵,可以是正數(shù)、空值或負數(shù),如圖1-3所示。
▲圖 1-3