freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘-文庫(kù)吧資料

2025-04-13 20:33本頁(yè)面
  

【正文】 ——小數(shù)據(jù)1)默認(rèn)數(shù)值carSPSS Modeler需要數(shù)據(jù)格式為csv??蛻艏瓤梢栽趩螜C(jī)版上運(yùn)行IBM SPSS Modeler,也可以連接到IBM SPSS Modeler Server運(yùn)行數(shù)據(jù)流,從而充分利用服務(wù)器的高性能。Modeler界面除了任何軟件都有的菜單欄、工具欄、狀態(tài)欄之外,主要由①數(shù)據(jù)流構(gòu)建區(qū)②數(shù)據(jù)流、結(jié)果和模型管理區(qū)③數(shù)據(jù)挖掘項(xiàng)目管理區(qū)④節(jié)點(diǎn)區(qū)四個(gè)部分構(gòu)成。目的是通過(guò)對(duì)數(shù)據(jù)的整理,建模,挖掘出相關(guān)的結(jié)果,知道管理實(shí)際。即便改進(jìn)業(yè)務(wù)的機(jī)會(huì)被龐雜的數(shù)據(jù)表格所掩蓋, Clementine也能最大限度地執(zhí)行標(biāo)準(zhǔn)的數(shù)據(jù)挖掘流程,為您找到解決商業(yè)問(wèn)題的最佳答案。.join(lines) (%s\n % array)處理結(jié)果:小型數(shù)據(jù)大型數(shù)據(jù)(二)IBM SPSS Modeler 為了解決各種商務(wù)問(wèn)題,企業(yè)需要以不同的方式來(lái)處理各種類(lèi)型迥異的數(shù)據(jù), 相異的任務(wù)類(lèi)型和數(shù)據(jù)類(lèi)型就要求有不同的分析技術(shù)。) array = 39。) else: lines[9] = False (39。 + str(value) + 39。: lines[9] = True (39。) lines = [() for line in lines] if lines[9] == 39。) with open(filename) as f: contents = () for content in contents: lines = (39。39。39。) as fp: (39。, 39。 TXT轉(zhuǎn)為ARFF格式def txt2arff(filename, value): with open(39。 由于我們的源數(shù)據(jù)為T(mén)XT格式,無(wú)法應(yīng)用于WEKA軟件,所以我們需要將它轉(zhuǎn)換為ARFF格式??招校ɑ蛉强崭竦男校⒈缓雎浴6S表格存儲(chǔ)在如下的ARFF文件中。WEKA作為一個(gè)公開(kāi)的數(shù)據(jù)挖掘工作平臺(tái),集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分類(lèi),回歸、聚類(lèi)、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。5. 應(yīng)用軟件(1) WEKA 1. WEKA簡(jiǎn)介 WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一款免費(fèi)的,非商業(yè)化的,基于JAVA環(huán)境下開(kāi)源的機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘軟件。每個(gè)數(shù)字代表一個(gè)商品。數(shù)據(jù)為txt格式。文件格式為txt格式,每一行代表一個(gè)顧客購(gòu)物籃中的商品。4  得到頻繁模式(頻繁項(xiàng)集)。2  構(gòu)造FPtree。實(shí)驗(yàn)表明,F(xiàn)Pgrowth對(duì)不同長(zhǎng)度的規(guī)則都有很好的適應(yīng)性,同時(shí)在效率上較之Apriori算法有巨大的提高。采用分而治之的策略,在經(jīng)過(guò)第一遍掃描之后,把數(shù)據(jù)庫(kù)中的頻集壓縮進(jìn)一棵頻繁模式樹(shù)(FPtree),同時(shí)依然保留其中的關(guān)聯(lián)信息,隨后再將FPtree分化成一些條件庫(kù),每個(gè)庫(kù)和一個(gè)長(zhǎng)度為1的頻集相關(guān),然后再對(duì)這些條件庫(kù)分別進(jìn)行挖掘。5  重復(fù)掃描數(shù)據(jù)庫(kù),與最小支持度比較;產(chǎn)生更高層次的頻繁項(xiàng)集再?gòu)脑摷侠锂a(chǎn)生下一級(jí)候選項(xiàng)集直到不再產(chǎn)生新的候選項(xiàng)集為止。再找出頻繁2項(xiàng)集。4  再掃描數(shù)據(jù)庫(kù)。3  在Apriori算法的過(guò)程中,首先從數(shù)據(jù)庫(kù)讀入所有的事務(wù),每個(gè)項(xiàng)都被看作候選1項(xiàng)集得出各項(xiàng)的支持度再使用頻繁1項(xiàng)集集合來(lái)產(chǎn)生候選2項(xiàng)集集合。2  Apriori算法使用候選項(xiàng)集。因此,根據(jù)這個(gè)性質(zhì)可以在生成k項(xiàng)集之前先將(k1)項(xiàng)集中的非頻繁項(xiàng)集刪除通過(guò)刪除候(k1)項(xiàng)集中的非頻繁項(xiàng)集得到(k1)頻繁項(xiàng)集。那么含有該(k1)項(xiàng)集與另外一項(xiàng)構(gòu)成的k項(xiàng)集的事務(wù)占事務(wù)總數(shù)的百分比就更不可能大于或等于最小支持度閾值了。 3)Apriori算法具有以下性質(zhì):任何非頻繁的(k1)項(xiàng)集都不可能是頻繁k項(xiàng)集的子集。(4) 算法 1)Apriori算法是一種使用頻繁項(xiàng)集的先驗(yàn)知識(shí)從而生成關(guān)聯(lián)規(guī)則的一種算法也是最有影響的關(guān)聯(lián)規(guī)則挖掘算法。,關(guān)聯(lián)規(guī)則可以分為單維的和多維的。,可以分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則。 (三)關(guān)聯(lián)規(guī)則分類(lèi),關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1