【導(dǎo)讀】關(guān)聯(lián)規(guī)則在數(shù)據(jù)挖掘是一個重要的研究內(nèi)容。而產(chǎn)生頻繁集則是產(chǎn)生關(guān)聯(lián)規(guī)則的第一。在大多數(shù)以前的實現(xiàn)中,人們普遍采用了類似于Apriori[2]的算法。很大的缺點,就是使用了不斷產(chǎn)生候選集并加以測試的方式來得到頻繁集。集的代價是很大的。本文分析并且實現(xiàn)了在論文[1]中提出的FP-growth算法。FP-growth算法的優(yōu)點是節(jié)。省時間和空間,對大規(guī)模數(shù)據(jù)采用分治的辦法以避免規(guī)模巨大難以接受。FP-tree是一個數(shù)據(jù)庫里跟產(chǎn)生頻繁集有關(guān)的信息的壓縮表示。通過了一系列的從低到高的數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)它,并進(jìn)而實現(xiàn)整個算法。平臺,編程工具是VisualC++,許多地方還用到了C++的標(biāo)準(zhǔn)模板庫。聯(lián)規(guī)則找尋的第一步就是要找到相應(yīng)的頻繁集.現(xiàn)了FP-growth算法,并將它作為一個使用數(shù)據(jù)挖掘工具,ARMiner的一部分.第3部分討論關(guān)聯(lián)規(guī)則的一些問題.模式、規(guī)律和約束等看作知識?;?,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。語言表達(dá)所發(fā)現(xiàn)的結(jié)果。笑片”大話西游”,該網(wǎng)站會提醒你,