【正文】
規(guī)則集。 ? 2020, 2020年 Arunasalam提出了適用與類不平衡數(shù)據(jù)上的關(guān)聯(lián)分類。 ? 優(yōu)點(diǎn):兩次掃描數(shù)據(jù)庫 , 不用重復(fù)建立條件 FPtree。過分強(qiáng)調(diào)了置信度,這樣在最后構(gòu)造的分類器中,使得有些規(guī)則置信度很高而支持度不高,造成過度擬合。 Hebei University 15個(gè) UCI數(shù)據(jù)庫測試結(jié)果 Hebei University 醫(yī)療圖像數(shù)據(jù)庫測試結(jié)果 Hebei University 以后要完成的工作 ? 完善規(guī)則評(píng)價(jià)函數(shù) ? 引入規(guī)則的項(xiàng)數(shù) ? 考慮類別不平衡情況 ? 分類器中規(guī)則交疊對(duì)分類精度的影響 Hebei University 分類器的可理解性 ? 關(guān)聯(lián)分類構(gòu)造分類器的方法 ? 挖掘滿足置信度和支持度閾值要求的類關(guān)聯(lián)規(guī)則 ? 將規(guī)則按定義的序關(guān)系排序,基于數(shù)據(jù)覆蓋來選擇規(guī)則 ? 分類器的特點(diǎn) ? 數(shù)據(jù)集中每條記錄都被一條評(píng)價(jià)值最高的規(guī)則覆蓋 ? 分類器中的規(guī)則在訓(xùn)練集中存在相互交疊的現(xiàn)象 ? 規(guī)則的數(shù)目較多 Hebei University 交疊現(xiàn)象怎樣產(chǎn)生的 1 .. 10 .. 20 .. 30 .. 40 R1:20, 100% R4:20, 85% R2:20, 95% R3:20, 90% Hebei University 交疊問題解決方法 ? 每選擇一條規(guī)則后,更新剩余規(guī)則的置信度,支持度。06), , Hong Kong, Oct 2020. [6] MariaLuiza Antonie, Osmar R. Zaiane, and Robert C. Holte. Learning to Use a Learned Model: A TwoStage Approach to Classification. In Proc. of 2020 IEEE Int. Conf. on Data Mining (ICDM39。05), , 2020. [10]Adriano Veloso, Wagner Meira Jr.: Rule Generation and Rule Selection Techniques for CostSensitive Associative Classification. In SBBD 2020. , 2020. [11]J. Wang and G. Karypis. HARMONY: Efficiently Mining the Best Rules for Classification. In Proc. of 2020 SIAM Int. Conf. on Data Mining (SDM39。2020, pp339348. 2020. [18] Frans Coenen and Paul Leng. An Evaluation of Approaches to Classification Rule Selection. In Proc. of 2020 IEEE Int. Conf. on Data Mining (ICDM39。ve Bayes Classifiers Using Long Itemsets. In Proc. 1999 Int. Conf. on Knowledge Discovery and Data Mining (KDD3