自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

無監(jiān)督學(xué)習(xí)的12個(gè)最重要的算法介紹及其用例總結(jié)

人工智能 機(jī)器學(xué)習(xí)
無監(jiān)督學(xué)習(xí)(Unsupervised Learning)是和監(jiān)督學(xué)習(xí)相對(duì)的另一種主流機(jī)器學(xué)習(xí)的方法,無監(jiān)督學(xué)習(xí)是沒有任何的數(shù)據(jù)標(biāo)注只有數(shù)據(jù)本身。


無監(jiān)督學(xué)習(xí)(Unsupervised Learning)是和監(jiān)督學(xué)習(xí)相對(duì)的另一種主流機(jī)器學(xué)習(xí)的方法,無監(jiān)督學(xué)習(xí)是沒有任何的數(shù)據(jù)標(biāo)注只有數(shù)據(jù)本身。

無監(jiān)督學(xué)習(xí)算法有幾種類型,以下是其中最重要的12種:

1、聚類算法根據(jù)相似性將數(shù)據(jù)點(diǎn)分組成簇

k-means聚類是一種流行的聚類算法,它將數(shù)據(jù)劃分為k組。

2、降維算法降低了數(shù)據(jù)的維數(shù),使其更容易可視化和處理

主成分分析(PCA)是一種降維算法,將數(shù)據(jù)投影到低維空間,PCA可以用來將數(shù)據(jù)降維到其最重要的特征。

3.異常檢測(cè)算法識(shí)別異常值或異常數(shù)據(jù)點(diǎn)

支持向量機(jī)是可以用于異常檢測(cè)(示例)。異常檢測(cè)算法用于檢測(cè)數(shù)據(jù)集中的異常點(diǎn),異常檢測(cè)的方法有很多,但大多數(shù)可以分為有監(jiān)督和無監(jiān)督兩種。監(jiān)督方法需要標(biāo)記數(shù)據(jù)集,而無監(jiān)督方法不需要。

無監(jiān)督異常檢測(cè)算法通?;诿芏裙烙?jì),試圖找到數(shù)據(jù)空間中密集的區(qū)域外的點(diǎn)。

一個(gè)簡(jiǎn)單的方法是計(jì)算每個(gè)點(diǎn)到k個(gè)最近鄰居的平均距離。距離相鄰點(diǎn)非常遠(yuǎn)的點(diǎn)很可能是異常點(diǎn)。

還有很多基于密度的異常檢測(cè)算法,包括局部離群因子(Local Outlier Factor,LOF)和支持向量數(shù)據(jù)描述(Support Vector Domain Description,SVDD)。這些算法比簡(jiǎn)單的k近鄰方法更復(fù)雜,通??梢詸z測(cè)到更細(xì)微的異常。大多數(shù)異常檢測(cè)算法都需要進(jìn)行調(diào)整,例如指定一個(gè)參數(shù)來控制算法對(duì)異常的敏感程度。如果參數(shù)過低,算法可能會(huì)漏掉一些異常。如果設(shè)置過高,算法可能會(huì)產(chǎn)生誤報(bào)(將正常點(diǎn)識(shí)別為異常點(diǎn))。

4、分割算法將數(shù)據(jù)分成段或組

分割算法可以將圖像分割為前景和背景。

這些算法可以在不需要人工監(jiān)督的情況下自動(dòng)將數(shù)據(jù)集分割成有意義的組。這個(gè)領(lǐng)域中比較知名的一個(gè)算法是k-means算法。該算法通過最小化組內(nèi)距離平方和將數(shù)據(jù)點(diǎn)分成k組。

另一種流行的分割算法是mean shift算法。該算法通過迭代地將每個(gè)數(shù)據(jù)點(diǎn)移向其局部鄰域的中心來實(shí)現(xiàn)。mean shift對(duì)異常值具有較強(qiáng)的魯棒性,可以處理密度不均勻的數(shù)據(jù)集。但是在大型數(shù)據(jù)集上運(yùn)行它的計(jì)算成本可能很高。

高斯混合模型(GMM)是一種可用于分割的概率模型。以前gmm需要大量的計(jì)算來訓(xùn)練,但最近的研究進(jìn)展使其更快。gmm非常靈活,可以用于任何類型的數(shù)據(jù)。但是它們有時(shí)并不能總是產(chǎn)生最好的結(jié)果。對(duì)于簡(jiǎn)單的數(shù)據(jù)集,k-means是一個(gè)很好的選擇,而gmm則更適合于復(fù)雜的數(shù)據(jù)集。mean shift可以用于任何一種情況,但在大型數(shù)據(jù)集上計(jì)算的成本會(huì)很高。

5、去噪算法減少或去除數(shù)據(jù)中的噪聲

小波變換可以用于圖像去噪。但是各種來源可能會(huì)產(chǎn)生噪聲,包括數(shù)據(jù)損壞、缺失值和異常值。去噪算法通過減少數(shù)據(jù)中的噪聲量來提高無監(jiān)督學(xué)習(xí)模型的準(zhǔn)確性。

現(xiàn)有的去噪算法有多種,包括主成分分析(PCA)、獨(dú)立成分分析(ICA)和非負(fù)矩陣分解(NMF)。

6、鏈接預(yù)測(cè)算法預(yù)測(cè)數(shù)據(jù)點(diǎn)之間的未來連接(例如,網(wǎng)絡(luò)中兩個(gè)節(jié)點(diǎn)之間的未來交互)

鏈接預(yù)測(cè)可用于預(yù)測(cè)哪些人將成為社交網(wǎng)絡(luò)中的朋友。 更常用的鏈接預(yù)測(cè)算法之一是優(yōu)先連接算法,它預(yù)測(cè)如果兩個(gè)節(jié)點(diǎn)有許多現(xiàn)有連接,則它們更有可能被連接。

另一種流行的鏈路預(yù)測(cè)算法是局部路徑算法,它預(yù)測(cè)如果兩個(gè)節(jié)點(diǎn)共享一個(gè)共同的鄰居,那么它們更有可能被關(guān)聯(lián)。該算法可以捕獲“結(jié)構(gòu)等價(jià)”的概念,因此在生物網(wǎng)絡(luò)中經(jīng)常使用。

最后,random walk with restart算法也是一種鏈路預(yù)測(cè)算法,它模擬網(wǎng)絡(luò)上的一個(gè)隨機(jī)走動(dòng)的人,在隨機(jī)節(jié)點(diǎn)[17]處重新啟動(dòng)步行者。然后,步行者到達(dá)特定節(jié)點(diǎn)的概率被用來衡量?jī)蓚€(gè)節(jié)點(diǎn)之間存在連接的可能性。

7、強(qiáng)化學(xué)習(xí)算法通過反復(fù)試驗(yàn)來進(jìn)行學(xué)習(xí)

Q-learning是基于值的學(xué)習(xí)算法的一個(gè)例子;它實(shí)現(xiàn)簡(jiǎn)單并且通用。但是Q-learning有時(shí)會(huì)收斂到次優(yōu)解。另一個(gè)例子是TD learning,它在計(jì)算上Q-learning學(xué)習(xí)要求更高,但通常可以找到更好的解決方案。

8、生成模型:算法使用訓(xùn)練數(shù)據(jù)生成新的數(shù)據(jù)

自編碼器是生成模型,可用于從圖像數(shù)據(jù)集創(chuàng)建獨(dú)特的圖像。在機(jī)器學(xué)習(xí)中,生成模型是一種捕捉一組數(shù)據(jù)的統(tǒng)計(jì)屬性的模型。這些模型可以用來生成新的數(shù)據(jù),就像它們所用的訓(xùn)練的數(shù)據(jù)一樣。

生成模型用于各種任務(wù),如無監(jiān)督學(xué)習(xí),數(shù)據(jù)壓縮和去噪。生成模型有很多種,比如隱馬爾可夫模型和玻爾茲曼機(jī)。每種模型都有其優(yōu)缺點(diǎn),并且適用于不同的任務(wù)。

隱馬爾可夫模型擅長(zhǎng)對(duì)順序數(shù)據(jù)建模,而玻爾茲曼機(jī)器更擅長(zhǎng)對(duì)高維數(shù)據(jù)建模。通過在無標(biāo)記數(shù)據(jù)上訓(xùn)練它們,生成模型可以用于無監(jiān)督學(xué)習(xí)。一旦模型經(jīng)過訓(xùn)練,就可以用來生成新的數(shù)據(jù)。然后這些生成的數(shù)據(jù)可以由人類或其他機(jī)器學(xué)習(xí)算法進(jìn)行標(biāo)記。這個(gè)過程可以重復(fù),直到生成模型學(xué)會(huì)生成數(shù)據(jù),就像想要的輸出。

9、隨機(jī)森林是一種機(jī)器學(xué)習(xí)算法,可用于監(jiān)督和無監(jiān)督學(xué)習(xí)

對(duì)于無監(jiān)督學(xué)習(xí),隨機(jī)森林可以找到一組相似的條目,識(shí)別異常值,并壓縮數(shù)據(jù)。

對(duì)于監(jiān)督和無監(jiān)督任務(wù)隨機(jī)森林已被證明優(yōu)于其他流行的機(jī)器學(xué)習(xí)算法(如支持向量機(jī))。隨機(jī)森林是無監(jiān)督學(xué)習(xí)的一個(gè)強(qiáng)大工具,因?yàn)樗鼈兛梢蕴幚砭哂性S多特征的高維數(shù)據(jù)。它們也抵制過擬合,這意味著它們可以很好地推廣到新數(shù)據(jù)。

10、DBSCAN是一種基于密度的聚類算法,可用于無監(jiān)督學(xué)習(xí)

它基于密度,即每個(gè)區(qū)域的點(diǎn)的數(shù)量。 如果 DBSCAN 的組內(nèi)的點(diǎn)很靠近,則將它們指向一個(gè)組,如果點(diǎn)相距較遠(yuǎn)的點(diǎn)則會(huì)忽略。與其他聚類算法相比,DBSCAN具有一些優(yōu)勢(shì)。它可以找到不同大小和形狀的簇,并且不需要用戶預(yù)先指定簇的數(shù)量。此外,DBSCAN對(duì)異常值不敏感,這意味著它可以用來找到其他數(shù)據(jù)集沒有很好地表示的數(shù)據(jù)。但是DBSCAN也有一些缺點(diǎn)。例如,它可能很難在噪聲很大的數(shù)據(jù)集中找到良好的簇。另外就是DBSCAN需要一個(gè)密度閾值,這可能不適用于所有數(shù)據(jù)集。

11、Apriori算法用于查找關(guān)聯(lián)、頻繁項(xiàng)集和順序模式

Apriori算法是第一個(gè)關(guān)聯(lián)規(guī)則挖掘算法,也是最經(jīng)典的算法。它·的工作原理是首先找到數(shù)據(jù)中的所有頻繁項(xiàng)集,然后使用這些項(xiàng)集生成規(guī)則。

Apriori算法的實(shí)現(xiàn)方式有很多種,可以針對(duì)不同的需求進(jìn)行定制。 例如,可以控制支持度和置信度閾值以找到不同類型的規(guī)則。

12、Eclat算法從事務(wù)數(shù)據(jù)庫(kù)中挖掘頻繁項(xiàng)目集,可用于購(gòu)物車分析、入侵檢測(cè)和文本挖掘

Eclat算法是一種深度優(yōu)先算法,采用垂直數(shù)據(jù)表示形式,在概念格理論的基礎(chǔ)上利用基于前綴的等價(jià)關(guān)系將搜索空間(概念格)劃分為較小的子空間(子概念格)。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2023-11-23 15:54:01

人工智能監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)

2020-04-28 17:26:04

監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)

2023-11-28 12:03:46

人工智能無監(jiān)督學(xué)習(xí)算法

2020-11-11 09:00:00

機(jī)器學(xué)習(xí)技術(shù)人工智能

2017-06-12 14:04:45

深度學(xué)習(xí)人工智能

2015-10-12 10:37:42

學(xué)習(xí)算法檢測(cè)

2017-11-09 14:04:22

無監(jiān)督學(xué)習(xí)數(shù)據(jù)缺失數(shù)據(jù)集

2023-11-15 18:40:27

半監(jiān)督學(xué)習(xí)人工智能

2017-10-09 23:21:08

無監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)人工智能

2022-06-14 07:07:57

網(wǎng)絡(luò)威脅無監(jiān)督數(shù)據(jù)泄露

2021-01-14 13:39:12

漏洞網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊

2022-06-27 14:53:18

監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)人工智能

2019-03-29 14:10:35

無監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)人工智能

2021-01-04 16:00:24

微服務(wù)架構(gòu)數(shù)據(jù)

2018-02-25 11:39:36

Python監(jiān)督學(xué)習(xí)算法

2023-12-01 16:27:05

機(jī)器學(xué)習(xí)無監(jiān)督學(xué)習(xí)

2023-11-13 15:01:28

機(jī)器學(xué)習(xí)

2022-05-13 11:05:00

網(wǎng)絡(luò)威脅無監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)攻擊

2018-10-18 09:00:00

機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)算法數(shù)據(jù)科學(xué)家

2017-11-24 10:43:43

Madlib機(jī)器學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)