自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

數(shù)據(jù)庫 SQL Server 算法
本文我們還是接著介紹SQL SERVER數(shù)據(jù)挖掘的知識(shí),本次我們主要介紹SQL SERVER數(shù)據(jù)挖掘之聚類算法和順序聚類算法的理解,希望能對(duì)您有所幫助。

繼上次我們介紹了:SQL SERVER數(shù)據(jù)挖掘之理解列的用法,這次我們介紹SQL SERVER數(shù)據(jù)挖掘之理解聚類算法順序聚類算法,下面我們就開始介紹。

聚類算法是使用非常多的一種算法,它的作用是對(duì)數(shù)據(jù)進(jìn)行分組,將特征相近的實(shí)體組織在一起,以便幫助我們對(duì)于目標(biāo)實(shí)體分類決策。典型的情況,例如人口分析,客戶分析。

聚類算法大致的效果如下(下面的分類名都可以修改,定義成我們更加容易理解的,例如“金牌客戶”,“銀牌客戶”等等)。

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

 

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法 

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

有關(guān)聚類算法,有一個(gè)常見的問題就是:同一個(gè)實(shí)體會(huì)不會(huì)出現(xiàn)在不同的類里面呢?也就是說是否有可能會(huì)有重疊的情況?

這個(gè)問題的答案是:是否有重疊的情況,取決于算法的設(shè)置,默認(rèn)情況下,是可能重疊的。

下面這個(gè)算法參數(shù)列表中,有一個(gè)CLUSTERING_METHOD,默認(rèn)為1.就是所謂的EM(Expectation Maximization)這種算法,這是允許重疊的。

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

如果設(shè)置為3或者4,則不允許重疊。至于是否可以伸縮(Scalable)表示的是該算法讀取數(shù)據(jù)的規(guī)則,如果可伸縮,則表示會(huì)先讀取50000條記錄作為種子進(jìn)行建模,如果足夠,則停止讀取。否則繼續(xù)讀取下50000個(gè)。而不可伸縮則每次都讀取所有的實(shí)體。

那么,什么是“順序聚類”呢?其實(shí)它的完整名稱應(yīng)該是”Microsoft 順序分析和聚類分析”,也就是結(jié)合了順序分析和聚類分析的一種特殊的算法。

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

這個(gè)算法建立模型之后,大致看到的效果是下面這樣的:

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

【備注】這里一定要注意,除了標(biāo)準(zhǔn)的屬性之外,順序聚類會(huì)多出來所謂的“Transitions”,這里也就是體現(xiàn)了順序的概念。并且順序聚類算法與標(biāo)準(zhǔn)的聚類算法相比,更多出來另外一個(gè)專門的圖形,請(qǐng)看下圖。

SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法

關(guān)鍵就在于,這個(gè)圖你該如何理解呢?我總結(jié)這么幾點(diǎn):

1. 順序聚類算法,首先它是一個(gè)聚類算法,他會(huì)對(duì)輸入的實(shí)體進(jìn)行分組。

2. 之所以稱為順序聚類,是說它可以在分完組之后,針對(duì)這些組的實(shí)體的一些行為(主要是與時(shí)間有關(guān)的行為)進(jìn)行分析,展示。

典型的情況有:分析不同客戶群體將物品放入購物籃的順序,分析不同用戶群體訪問公司網(wǎng)頁的點(diǎn)擊順序流。

關(guān)于SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法的內(nèi)容就介紹到這里,下次我們介紹:SQL SERVER數(shù)據(jù)挖掘之如何實(shí)現(xiàn)Web路徑流挖掘。

【編輯推薦】

  1. SQL Server角色成員身份和權(quán)限簡(jiǎn)介
  2. 誤刪SQL Server日志文件后怎樣附加數(shù)據(jù)庫
  3. SQL Server 2005數(shù)據(jù)庫用戶權(quán)限管理的設(shè)置
  4. 一個(gè)C# ADO.NET連接SQL Server數(shù)據(jù)庫的實(shí)例
  5. T-SQL行列相互轉(zhuǎn)換命令:PIVOT和UNPIVOT使用詳解
責(zé)任編輯:趙鵬 來源: 博客園
相關(guān)推薦

2011-07-26 10:16:14

SQL Server數(shù)據(jù)挖掘

2011-07-25 15:17:50

SQL SERVER數(shù)

2011-07-25 14:56:00

SQL SERVER數(shù)

2017-04-05 09:20:14

聚類算法機(jī)器學(xué)習(xí)大數(shù)據(jù)

2017-04-07 13:00:49

機(jī)器學(xué)習(xí)大數(shù)據(jù)聚類算法

2011-08-11 16:16:26

SQL Server數(shù)據(jù)挖掘

2011-07-25 16:13:34

SQL Server數(shù)據(jù)挖掘

2011-07-25 14:18:36

SQL Server數(shù)據(jù)挖掘

2023-10-31 09:00:00

2017-05-15 11:10:10

大數(shù)據(jù)聚類算法

2020-07-09 15:26:18

Python聚類算法語言

2024-10-18 17:14:13

2009-04-13 10:15:24

SQLServer 2005數(shù)據(jù)挖掘

2017-08-01 16:44:33

機(jī)器學(xué)習(xí)算法文本挖掘

2019-10-12 10:11:02

數(shù)據(jù)集聚類算法

2014-07-02 10:34:08

聚類算法算法

2009-07-03 19:58:51

SQL Server2

2020-05-13 15:57:59

聚類分析算法監(jiān)督學(xué)習(xí)

2009-08-05 10:00:04

數(shù)據(jù)挖掘算法SQL Server

2018-08-31 12:32:48

人工智能機(jī)器學(xué)習(xí)算法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)