自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="imufx"></style>

<sub id="imufx"><rt id="imufx"><li id="imufx"></li></rt></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

Python基礎(chǔ)原理：FP-growth算法的構(gòu)建

作者：佚名 2017-12-12 09:00:53

開發(fā) 后端算法

和Apriori算法相比，F(xiàn)P-growth算法只需要對數(shù)據(jù)庫進(jìn)行兩次遍歷，從而高效發(fā)現(xiàn)頻繁項(xiàng)集。對于搜索引擎公司而言，他們需要通過查看互聯(lián)網(wǎng)上的用詞，來找出經(jīng)常在一塊出現(xiàn)的詞。因此就需要能夠高效的發(fā)現(xiàn)頻繁項(xiàng)集的方法，F(xiàn)P-growth算法就可以完成此重任。

和Apriori算法相比，F(xiàn)P-growth算法只需要對數(shù)據(jù)庫進(jìn)行兩次遍歷，從而高效發(fā)現(xiàn)頻繁項(xiàng)集。對于搜索引擎公司而言，他們需要通過查看互聯(lián)網(wǎng)上的用詞，來找出經(jīng)常在一塊出現(xiàn)的詞。因此就需要能夠高效的發(fā)現(xiàn)頻繁項(xiàng)集的方法，F(xiàn)P-growth算法就可以完成此重任。

FP-growth算法是基于Apriori原理的，通過將數(shù)據(jù)集存儲(chǔ)在FP（Frequent Pattern)樹上發(fā)現(xiàn)頻繁項(xiàng)集。

FP-growth算法只需要對數(shù)據(jù)庫進(jìn)行兩次掃描，而Apriori算法在求每個(gè)潛在的頻繁項(xiàng)集時(shí)都需要掃描一次數(shù)據(jù)集，所以說FP-growth算法是高效的。

FP算法發(fā)現(xiàn)頻繁項(xiàng)集的過程是：

(1)構(gòu)建FP樹；

(2)從FP樹中挖掘頻繁項(xiàng)集

FP表示的是頻繁模式，其通過鏈接來連接相似元素，被連起來的元素可看成是一個(gè)鏈表

將事務(wù)數(shù)據(jù)表中的各個(gè)事務(wù)對應(yīng)的數(shù)據(jù)項(xiàng)，按照支持度排序后，把每個(gè)事務(wù)中的數(shù)據(jù)項(xiàng)按降序依次插入到一棵以 NULL為根節(jié)點(diǎn)的樹中，同時(shí)在每個(gè)結(jié)點(diǎn)處記錄該結(jié)點(diǎn)出現(xiàn)的支持度。

假設(shè)存在的一個(gè)事務(wù)數(shù)據(jù)樣例為,構(gòu)建FP樹的步驟如下：

結(jié)合Apriori算法中最小支持度的閾值，在此將最小支持度定義為3，結(jié)合上表中的數(shù)據(jù)，那些不滿足最小支持度要求的將不會(huì)出現(xiàn)在***的FP樹中。

據(jù)此構(gòu)建FP樹，并采用一個(gè)頭指針表來指向給定類型的***個(gè)實(shí)例，快速訪問FP樹中的所有元素，構(gòu)建的帶頭指針的FP樹如圖：

結(jié)合繪制的帶頭指針表的FP樹，對表中數(shù)據(jù)進(jìn)行過濾，排序如下：

在對數(shù)據(jù)項(xiàng)過濾排序了之后，就可以構(gòu)建FP樹了，從NULL開始，向其中不斷添加過濾排序后的頻繁項(xiàng)集。過程可表示為：

這樣，F(xiàn)P樹對應(yīng)的數(shù)據(jù)結(jié)構(gòu)就建好了，現(xiàn)在就可以構(gòu)建FP樹了，F(xiàn)P樹的構(gòu)建函數(shù)參見Python源代碼。

在運(yùn)行上例之前還需要一個(gè)真正的數(shù)據(jù)集，結(jié)合之前的數(shù)據(jù)自定義數(shù)據(jù)集。這樣就構(gòu)建了FP樹，接下來就是使用它來進(jìn)行頻繁項(xiàng)集的挖掘。

責(zé)任編輯：武曉燕來源：中科院計(jì)算所培訓(xùn)中心

Python 基礎(chǔ)原理

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="ke1c0"><rp id="ke1c0"><form id="ke1c0"></form></rp></cite>

<sub id="ke1c0"></sub>