freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘fptree樹(shù)-文庫(kù)吧資料

2025-06-25 22:52本頁(yè)面
  

【正文】 I2: 7Null第三步,進(jìn)行強(qiáng)關(guān)聯(lián)規(guī)則的挖掘。而這個(gè)算法和我上面分析時(shí)提出的思想大致相同,下面我們?nèi)匀桓鶕?jù)書(shū)上的例子進(jìn)行FPtree算法的演示:第一步,進(jìn)行事務(wù)數(shù)據(jù)庫(kù)的掃描,得到每個(gè)一項(xiàng)集的支持計(jì)數(shù),然后進(jìn)行排序。而且在2000年針對(duì)Apriori算法的固有缺陷, 算法。接著,參考決策樹(shù)算法中樹(shù)的生成方法和分治策略思想,我們?cè)趻呙枋聞?wù)數(shù)據(jù)庫(kù)的一個(gè)事務(wù)時(shí),根據(jù)第一步的排序順位,進(jìn)行調(diào)整,將該事務(wù)的所有項(xiàng)都有序化,依照順序建立一棵樹(shù),下次的事務(wù)按照這個(gè)方法繼續(xù)對(duì)前面的樹(shù)的節(jié)點(diǎn)值進(jìn)行修改、增加節(jié)點(diǎn)或者生成另一棵樹(shù),這樣我們就可以保證越靠近樹(shù)根的支持計(jì)數(shù)越高,而葉子節(jié)點(diǎn)的支持計(jì)數(shù)越低,十分有利于降低我們?cè)谕诰蛴腥ひ?guī)則時(shí)的開(kāi)銷(xiāo)。根據(jù)我在《算法導(dǎo)論》中所學(xué)習(xí)到的思想——遞歸算法中的分治策略,再加上決策樹(shù)這個(gè)“先例”的借鑒,我對(duì)于提高Apriori算法的效率有了一個(gè)較為清晰的方向。我們來(lái)對(duì)比下,在決策樹(shù)算法中,我們根據(jù)元組的信息增益的大小來(lái)進(jìn)行生成樹(shù)的判斷依據(jù)。我在思考過(guò)程中,想到老師上課講到的一句話(huà)“把條件進(jìn)行簡(jiǎn)單化處理,先找出一個(gè)可行解”,這樣思維就大大開(kāi)闊。在思考這個(gè)問(wèn)題時(shí),我很容易想到,既然是產(chǎn)生大量的候選項(xiàng)集,那么一個(gè)很直接的辦法就是:能不能不產(chǎn)生候選集,而直接發(fā)現(xiàn)頻繁項(xiàng)集,從而找出感興趣的關(guān)聯(lián)規(guī)則呢。二是考慮如何壓縮候選集,在產(chǎn)生的時(shí)候就進(jìn)行剔除,或者對(duì)未來(lái)要產(chǎn)生的候選項(xiàng)集,增加一個(gè)規(guī)則,壓縮未來(lái)迭代掃描的事務(wù)數(shù)。那么我們分析如何提高Apriori算法的效率時(shí),就有著兩大分析方向。因此我們可以得到一個(gè)很清晰的結(jié)論,在一般情況下,我們?cè)谑褂肁priori算法(使用候選產(chǎn)生發(fā)現(xiàn)頻繁項(xiàng)集的方法)進(jìn)行關(guān)聯(lián)分析時(shí),想要找到感興趣的規(guī)則,開(kāi)銷(xiāo)是非常大的,而這正是Apriori算法在實(shí)際運(yùn)用中要改善的問(wèn)題。再如,Apriori算法需要不斷重復(fù)掃描數(shù)據(jù)庫(kù),通過(guò)模式匹配檢查一個(gè)很大的候選集合。例如,如果有10^4個(gè)頻繁1項(xiàng)集,則Apriori算法需要產(chǎn)生多達(dá)10^7個(gè)候選二項(xiàng)集。AllElectronics某分店的業(yè)務(wù)數(shù)據(jù)TID 商品ID的列表T100
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1