freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘(編輯修改稿)

2025-05-04 20:33 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 公司的超市購(gòu)物籃數(shù)據(jù),共有88162條數(shù)據(jù)。數(shù)據(jù)為txt格式。第一行是對(duì)每列數(shù)據(jù)的一個(gè)編號(hào),從第二列開始是每個(gè)顧客超市購(gòu)物籃中的東西。每個(gè)數(shù)字代表一個(gè)商品。因?yàn)閿?shù)據(jù)過(guò)大,所以整個(gè)數(shù)據(jù)是數(shù)據(jù)集的形式。5. 應(yīng)用軟件(1) WEKA 1. WEKA簡(jiǎn)介 WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一款免費(fèi)的,非商業(yè)化的,基于JAVA環(huán)境下開源的機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘軟件。它和它的源代碼可在其官方網(wǎng)站下載。WEKA作為一個(gè)公開的數(shù)據(jù)挖掘工作平臺(tái),集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。 (AttributeRelation File Format)文件,這是一種ASCII文本文件。二維表格存儲(chǔ)在如下的ARFF文件中。識(shí)別ARFF文件的重要依據(jù)是分行,因此不能在這種文件里隨意的斷行??招校ɑ蛉强崭竦男校⒈缓雎?。 WEKA的關(guān)聯(lián)規(guī)則分析功能僅能用來(lái)作示范,不適合用來(lái)挖掘大型數(shù)據(jù)集。 由于我們的源數(shù)據(jù)為TXT格式,無(wú)法應(yīng)用于WEKA軟件,所以我們需要將它轉(zhuǎn)換為ARFF格式。我們查閱有關(guān)資料以及有關(guān)網(wǎng)站,找到了一個(gè)用Python轉(zhuǎn)換格式的方法。 TXT轉(zhuǎn)為ARFF格式def txt2arff(filename, value): with open(39。./39。, 39。w39。) as fp: (39。39。39。@relation ExceptionRelation@attribute ID string@attribute Thrown numeric@attribute SetLogicFlag numeric@attribute Return numeric@attribute LOC numeric@attribute NumMethod numeric@attribute EmptyBlock numeric@attribute RecoverFlag numeric@attribute OtherOperation numeric@attribute classatt {True,False}@data39。39。39。) with open(filename) as f: contents = () for content in contents: lines = (39。\t39。) lines = [() for line in lines] if lines[9] == 39。139。: lines[9] = True (39。{39。 + str(value) + 39。}39。) else: lines[9] = False (39。{1}39。) array = 39。,39。.join(lines) (%s\n % array)處理結(jié)果:小型數(shù)據(jù)大型數(shù)據(jù)(二)IBM SPSS Modeler 為了解決各種商務(wù)問(wèn)題,企業(yè)需要以不同的方式來(lái)處理各種類型迥異的數(shù)據(jù), 相異的任務(wù)類型和數(shù)據(jù)類型就要求有不同的分析技術(shù)。 Clementine為您提供最出色、最廣泛的數(shù)據(jù)挖掘技術(shù),確保您可用最恰當(dāng)?shù)姆治黾夹g(shù)來(lái)處理相應(yīng)的問(wèn)題,從而得到最優(yōu)的結(jié)果以應(yīng)對(duì)隨時(shí)出現(xiàn)的商業(yè)問(wèn)題。即便改進(jìn)業(yè)務(wù)的機(jī)會(huì)被龐雜的數(shù)據(jù)表格所掩蓋, Clementine也能最大限度地執(zhí)行標(biāo)準(zhǔn)的數(shù)據(jù)挖掘流程,為您找到解決商業(yè)問(wèn)題的最佳答案。其中看到其實(shí)Modeler也是SPSS公司收購(gòu)回的,前身即是Clementine,09年整個(gè)SPSS被IBM收購(gòu)后,就改名為IBM SPSS Modeler了,今年Modeler已經(jīng)發(fā)布18版本,更新要比以前多了不少,多了非常多的擴(kuò)展功能(例如天氣數(shù)據(jù)獲取等等)Modeler是一款數(shù)據(jù)挖掘軟件,建模的原理主要偏向于數(shù)學(xué)算法,比如各種聚類算法,各種決策樹算法,神經(jīng)網(wǎng)絡(luò)算法,貝葉斯算法等等。目的是通過(guò)對(duì)數(shù)據(jù)的整理,建模,挖掘出相關(guān)的結(jié)果,知道管理實(shí)際。主要應(yīng)用于數(shù)據(jù)量大的分析,或者連接至數(shù)據(jù)庫(kù)分析。Modeler界面除了任何軟件都有的菜單欄、工具欄、狀態(tài)欄之外,主要由①數(shù)據(jù)流構(gòu)建區(qū)②數(shù)據(jù)流、結(jié)果和模型管理區(qū)③數(shù)據(jù)挖掘項(xiàng)目管理區(qū)④節(jié)點(diǎn)區(qū)四個(gè)部分構(gòu)成。IBM SPSS Modeler是客戶端/服務(wù)器端架構(gòu)的產(chǎn)品??蛻艏瓤梢栽趩螜C(jī)版上運(yùn)行IBM SPSS Modeler,也可以連接到IBM SPSS Modeler Server運(yùn)行數(shù)據(jù)流,從而
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1