自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法之—K-Means算法(超詳細(xì)附代碼)

大數(shù)據(jù) 算法
k-means算法比較簡單。在k-means算法中,用cluster來表示簇;容易證明k-means算法收斂等同于所有質(zhì)心不再發(fā)生變化。本文為您帶來基本的k-means算法流程

k-means算法比較簡單。在k-means算法中,用cluster來表示簇;容易證明k-means算法收斂等同于所有質(zhì)心不再發(fā)生變化。基本的k-means算法流程如下:

簡介

又叫K-均值算法,是非監(jiān)督學(xué)習(xí)中的聚類算法。

數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法之—K-Means算法(超詳細(xì)附代碼)

基本思想

k-means算法比較簡單。在k-means算法中,用cluster來表示簇;容易證明k-means算法收斂等同于所有質(zhì)心不再發(fā)生變化。基本的k-means算法流程如下:

選取k個初始質(zhì)心(作為初始cluster,每個初始cluster只包含一個點(diǎn));

repeat:

  • 對每個樣本點(diǎn),計算得到距其最近的質(zhì)心,將其類別標(biāo)為該質(zhì)心所對應(yīng)的cluster;
  • 重新計算k個cluster對應(yīng)的質(zhì)心(質(zhì)心是cluster中樣本點(diǎn)的均值);
  • until 質(zhì)心不再發(fā)生變化 12345

repeat的次數(shù)決定了算法的迭代次數(shù)。實際上,k-means的本質(zhì)是最小化目標(biāo)函數(shù),目標(biāo)函數(shù)為每個點(diǎn)到其簇質(zhì)心的距離的平方和:

 

  • N是元素個數(shù),x表示元素,c(j)表示第j簇的質(zhì)心
  • 算法復(fù)雜度
  • 時間復(fù)雜度是O(nkt) ,其中n代表元素個數(shù),t代表算法迭代的次數(shù),k代表簇的數(shù)目

優(yōu)缺點(diǎn)

  • 優(yōu)點(diǎn)
  • 簡單、快速;
  • 對大數(shù)據(jù)集有較高的效率并且是可伸縮性的;
  • 時間復(fù)雜度近于線性,適合挖掘大規(guī)模數(shù)據(jù)集。

缺點(diǎn)

  • k-means是局部***,因而對初始質(zhì)心的選取敏感;
  • 選擇能達(dá)到目標(biāo)函數(shù)***的k值是非常困難的。

代碼

代碼已在github上實現(xiàn),這里也貼出來

 

測試數(shù)據(jù)集獲取地址為testSet

責(zé)任編輯:未麗燕 來源: 網(wǎng)絡(luò)大數(shù)據(jù)
相關(guān)推薦

2018-05-03 09:36:53

算法數(shù)據(jù)挖掘C4.5

2018-10-27 15:47:35

CART算法決策樹

2016-01-29 11:00:55

數(shù)據(jù)挖掘算法大數(shù)據(jù)

2018-09-13 12:51:58

數(shù)據(jù)挖掘算法樸素貝葉斯

2013-02-25 09:46:35

數(shù)據(jù)挖掘算法ICDM

2011-01-26 09:14:43

數(shù)據(jù)挖掘

2012-08-09 09:57:54

K-means

2018-11-14 09:40:05

排序算法Java編程語言

2021-10-31 07:38:37

排序算法代碼

2019-08-28 11:08:51

排序算法Java

2017-07-18 10:50:38

前端JavaScript排序算法

2022-03-10 12:03:33

Python算法代碼

2021-11-08 15:12:48

排序算法面試

2024-04-18 15:44:20

2010-08-31 14:01:48

CSS

2017-07-27 14:21:44

2018-02-01 18:45:12

機(jī)器學(xué)習(xí)算法線性回歸

2021-01-26 05:33:07

排序算法快速

2011-03-10 10:45:05

算法

2011-05-17 13:39:01

算法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號