【正文】
27。但是在操作的過程中,我們發(fā)現(xiàn)IBM SPSS Modeler建模運行的時候很慢,需要等待很長時間才能完成,而且需要修改的數(shù)值是分為不同的選項卡,一旦選定生成無法更改,過程不可逆,所以在修改數(shù)值查看不同結(jié)果時十分不方便。而且在顯示的結(jié)果中看到置信度等數(shù)值結(jié)果。WEKA的關(guān)聯(lián)規(guī)則Apriori分析僅能用來作示范,不適合用來挖掘大型數(shù)據(jù)集。最小置信度為50%結(jié)果分析:I48與I39 有關(guān)聯(lián)規(guī)則 I41與I39 有關(guān)聯(lián)規(guī)則 I39與I38有關(guān)聯(lián)規(guī)則 I48與I41 有關(guān)聯(lián)規(guī)則 I42與I39 有關(guān)聯(lián)規(guī)則 I48與I32 有關(guān)聯(lián)規(guī)則I48與I38 有關(guān)聯(lián)規(guī)則 最小置信度為60%I48與I39 有關(guān)聯(lián)規(guī)則 I41與I39 有關(guān)聯(lián)規(guī)則 I39與I38有關(guān)聯(lián)規(guī)則 I48與I41 有關(guān)聯(lián)規(guī)則 7. 總結(jié) 數(shù)據(jù)挖掘可以通過不同的工具來進行分析。修改lowerBoundMinSupport修改lowerBoundMinSupport4)結(jié)果解釋僅發(fā)現(xiàn)兩條規(guī)則。3) 修改數(shù)值upperBoundMinSupportremoveAllMissingColsoutputItemSetsnumRules從它和lift的關(guān)系(對B取反,代入Lift公式后求倒數(shù))可以看出,這個值越大, A、B越關(guān)聯(lián)。(!B表示B沒有發(fā)生)P(A,B)/(P(A)P(B)) Lift=1時表示A和B獨立。LiftWeka中設(shè)置了幾個類似置信度(confidence)的度量來衡量規(guī)則的關(guān)聯(lián)程度,它們分別是:a)可以是:置信度(類關(guān)聯(lián)規(guī)則只能用置信度挖掘),提升度(lift),杠桿率(leverage),確信度(conviction)。度量類型。lowerBoundMinSupport不斷減小支持度直至達到最小支持度或產(chǎn)生了滿足數(shù)量要求的規(guī)則。//頻繁1項集:4個——大數(shù)據(jù)1)默認(rèn)數(shù)值//頻繁1項集:11個Size of set of large itemsets L(2): 39//進行了3輪搜索Generated sets of large itemsets://,即最少需要470個實例Minimum metric confidence: 類索引為1輸出項集設(shè)為真(由于car, removeAllMissingCols, verbose都保持為默認(rèn)值False,因此在結(jié)果的參數(shù)設(shè)置為缺省,若設(shè)為True,則會在結(jié)果的參數(shù)設(shè)置信息中分別表示為A, R,V)Minimum support: (470 instances)S U C –T 0 –N 10 各參數(shù)依次表示:I Apriori算法算法的參數(shù)設(shè)置:I N 10 T 0 C D U M S c 1 。不斷減小支持度直至達到最小支持度或產(chǎn)生了滿足數(shù)量要求的規(guī)則。//生成的頻繁項集Size of set of large itemsets L(1): 11//,即最少需要470個實例Minimum metric confidence: 類索引為1輸出項集設(shè)為真(由于car, removeAllMissingCols, verbose都保持為默認(rèn)值False,因此在結(jié)果的參數(shù)設(shè)置為缺省,若設(shè)為True,則會在結(jié)果的參數(shù)設(shè)置信息中分別表示為A, R,V)Minimum support: (470 instances)S U C –T 0 –N 10 各參數(shù)依次表示:I Apriori算法算法的參數(shù)設(shè)置:I N 10 T 0 C D U M S c 1 。如果設(shè)置為真,則算法會以冗余模式運行。upperBoundMinSupportsignificanceLevelremoveAllMissingColsoutputItemSetsnumRules從它和lift的關(guān)系(對B取反,代入Lift公式后求倒數(shù))可以看出,這個值越大, A、B越關(guān)聯(lián)。(!B表示B沒有發(fā)生)P(A,B)/(P(A)P(B)) Lift=1時表示A和B獨立。LiftWeka中設(shè)置了幾個類似置信度(confidence)的度量來衡量規(guī)則的關(guān)聯(lián)程度,它們分別是:a)可以是:置信度(類關(guān)聯(lián)規(guī)則只能用置信度挖掘),提升度(lift),杠桿率(leverage),確信度(conviction)。度量類型。lowerBoundMinSupport不斷減小支持度直至達到最小支持度或產(chǎn)生了滿足數(shù)量要求的規(guī)則。類屬性索引。6. 數(shù)據(jù)挖掘(1) WEKA