【正文】
attribute RecoverFlag numericattribute OtherOperation numericattribute classatt {True,False}data39。39。\t39。139。{39。}39。{1}39。,39。 Clementine為您提供最出色、最廣泛的數據挖掘技術,確保您可用最恰當的分析技術來處理相應的問題,從而得到最優(yōu)的結果以應對隨時出現的商業(yè)問題。其中看到其實Modeler也是SPSS公司收購回的,前身即是Clementine,09年整個SPSS被IBM收購后,就改名為IBM SPSS Modeler了,今年Modeler已經發(fā)布18版本,更新要比以前多了不少,多了非常多的擴展功能(例如天氣數據獲取等等)Modeler是一款數據挖掘軟件,建模的原理主要偏向于數學算法,比如各種聚類算法,各種決策樹算法,神經網絡算法,貝葉斯算法等等。主要應用于數據量大的分析,或者連接至數據庫分析。IBM SPSS Modeler是客戶端/服務器端架構的產品。IBM SPSS Modeler是一個數據挖掘軟件,其功能涵蓋了整個數據挖掘流程,它主要提供三類重要功能來支持整個數據挖掘過程:數據整理、探索性數據分析、建立模型模型檢驗模型應用。在剛剛介紹的WEKA軟件中可以將txt格式的數據另存為csv格式的數據。如果設為真,則會挖掘類關聯規(guī)則而不是全局關聯規(guī)則。classindex如果設置為1,最后的屬性被當做類屬性。deltametricType設置對規(guī)則進行排序的度量依據。在:這個數越大(1),越表明A和B存在于一個購物籃中不是偶然現象,有較強的關聯度.b)Leverage :P(A,B)P(A)P(B)Leverage=0時A和B獨立,Leverage越大A和B的關系越密切c)Conviction:P(A)P(!B)/P(A,!B)Conviction也是用來衡量A和B的獨立性。minMtric要發(fā)現的規(guī)則數為10。如果設置為真,會在結果中輸出項集。移除全部為缺省值的列。重要性測試(僅用于置信度)。最小支持度上界。verbose2)結果解釋scheme 所選的關聯規(guī)則挖掘方案:輸出項集,若設為false則該值缺省。規(guī)則數為10。度量單位選為置信度,(T1提升度,T2杠桿率,T3確信度)。D M c 1 //最小度量置信度: Number of cycles performed: 10//進行了10輪搜索Generated sets of large itemsets://頻繁1項集:11個剩余結果3)修改數值delta結果如下:4)結果解釋scheme 所選的關聯規(guī)則挖掘方案:輸出項集,若設為false則該值缺省。規(guī)則數為10。度量單位選為置信度,(T1提升度,T2杠桿率,T3確信度)。D M c 1 //最小度量置信度: Number of cycles performed: 3//生成的頻繁項集Size of set of large itemsets L(1): 11//頻繁1項集:39個Size of set of large itemsets L(3):4deltametricType設置對規(guī)則進行排序的度量依據。在:這個數越大(1),越表明A和B存在于一個購物籃中不是偶然現象,有較強的關聯度.b)Leverage :P(A,B)P(A)P(B)Leverage=0時A和B獨立,Leverage越大A和B的關系越密切c)Conviction:P(A)P(!B)/P(A,!B)Conviction也是用來衡量A和B的獨立性。minMtric要發(fā)現的規(guī)則數為10。如果設置為真,會在結果中輸出項集。移除全部為缺省值的列。最小支持度上界。2)結果解釋使用默認設置數值沒有發(fā)現規(guī)則。修改lowerBoundMinSupportI48與I39 有關聯規(guī)則 conf:() life:() lev:() cosv:()5) 修改數值6) 結果解釋發(fā)現8條規(guī)則7)修改數值8)結果解釋發(fā)現如下(二)IBM SPSS Modeler——大數據Apriori算法讀取值然后將測量全部修改為標記,角色全部改為任意。通過使用WEKA和IBM SPSS Modeler發(fā)現兩個軟件適用的情況有所不同。但是FP—Growth算法可以有效地處理大數據,修改不同的數值得出不同的結果。IBM SPSS Modeler需要修改數據的TYPE,如讀取值和輸入輸出,選擇各種不同的模型,使輸出的結果更加有效的解決實際問題。而WEKA可以反復查看不同的結果