人工智能基礎:機器學習常見的算法介紹
今天給大家聊聊機器學習算法相關(guān)的知識,一起來看看吧!
機器學習的算法主要包括監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習、遷移學習、強化學習。
1、監(jiān)督學習
監(jiān)督學習是機器學習當中非常常見的一種機器學習類型,就是在已知輸入輸出的情況下訓練出一個模型,并且將輸入映射輸出。
特點:給出了學習目標(比如實際值、標注等等)。
監(jiān)督學習根據(jù)目標結(jié)果是離散還是連續(xù),又可以把監(jiān)督學習劃分為分類和回歸。
1.1 分類
該類型的預測目標值是離散的,比如預測是否會下雨,最終的結(jié)果只有兩種,下雨或者不下雨兩種類別情況。
目的:根據(jù)歷史的結(jié)果來預測新樣本的分類結(jié)果,針對兩個分類結(jié)果的任務稱為二分任務;兩種以上稱為多分類任務。
常見算法:決策樹、隨機森林、K-最近鄰算法、邏輯回歸、支持向量機、人工神經(jīng)網(wǎng)絡。
1.2 回歸
該類型的預測目標值是連續(xù)的,典型的例子預測某個樓盤的價格趨勢。
算法:線性回歸、AdaBoosting等。
2、無監(jiān)督學習
無監(jiān)督學習的特點是不需要認為進行數(shù)據(jù)標注,而是根據(jù)模型不斷的進行自我學習、鞏固,最后通過自我總結(jié)歸納來學習。學習模型主要包含聚類、降維。
2.1 聚類
主要是指將物理或抽象對象的集合由相似對象組成多個類別過程,可以理解為按照相近的原則進行分組。
算法:常見的有K-means 算法、BIRCH算法、DBSCAN算法。
2.2 降維
針對高維度數(shù)據(jù)對系統(tǒng)資源和算法性能依賴非常大,降維就是把高維度數(shù)據(jù)中不重要的信息處理掉同時又保留大部分的重要信息。簡單來說就是由繁到簡的過程,把復雜的問題盡可能簡單話,這樣處理起來難度會小很多。
優(yōu)點:節(jié)省空間、節(jié)省算法消耗的時間、減少系統(tǒng)資源的消耗。
算法:主成分分析算法(PCA)
3、半監(jiān)督學習
監(jiān)督學習與無監(jiān)督學習相結(jié)合的一種學習方法。半監(jiān)督學習使用大量的未標記數(shù)據(jù),以及同時使用標記數(shù)據(jù),來進行模式識別工作。
半監(jiān)督學習適合由少量標簽的樣本和大量無標簽的樣本,可以實現(xiàn)較高的準確性預測。
4、遷移學習
遷移學習指的是一個預訓練的模型被重新用在另一個學習任務中的學習方法。
源域:已有的知識;目標域:待學習的新知識。
5、強化學習(ReinforcementLearning, RL)
RL也稱為再勵學習、評價學習、增強學習屬于機器學習的范式和方法論之一。
強化學習的任務就是讓智能設備可以像人類一樣,不斷學習、嘗試,然后可以在不同的環(huán)境下做出最理想的處理方案,強化屬于連續(xù)決策的過程,通過不斷嘗試來發(fā)現(xiàn)哪一種是最佳的方式。
案例:AlphaGo利用強化學習算法擊敗了世界冠軍李世石、谷歌YouTube視頻推薦算法等等。