freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘(編輯修改稿)

2025-05-04 20:33 本頁面
 

【文章內(nèi)容簡介】 公司的超市購物籃數(shù)據(jù),共有88162條數(shù)據(jù)。數(shù)據(jù)為txt格式。第一行是對每列數(shù)據(jù)的一個編號,從第二列開始是每個顧客超市購物籃中的東西。每個數(shù)字代表一個商品。因?yàn)閿?shù)據(jù)過大,所以整個數(shù)據(jù)是數(shù)據(jù)集的形式。5. 應(yīng)用軟件(1) WEKA 1. WEKA簡介 WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一款免費(fèi)的,非商業(yè)化的,基于JAVA環(huán)境下開源的機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘軟件。它和它的源代碼可在其官方網(wǎng)站下載。WEKA作為一個公開的數(shù)據(jù)挖掘工作平臺,集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。 (AttributeRelation File Format)文件,這是一種ASCII文本文件。二維表格存儲在如下的ARFF文件中。識別ARFF文件的重要依據(jù)是分行,因此不能在這種文件里隨意的斷行??招校ɑ蛉强崭竦男校⒈缓雎?。 WEKA的關(guān)聯(lián)規(guī)則分析功能僅能用來作示范,不適合用來挖掘大型數(shù)據(jù)集。 由于我們的源數(shù)據(jù)為TXT格式,無法應(yīng)用于WEKA軟件,所以我們需要將它轉(zhuǎn)換為ARFF格式。我們查閱有關(guān)資料以及有關(guān)網(wǎng)站,找到了一個用Python轉(zhuǎn)換格式的方法。 TXT轉(zhuǎn)為ARFF格式def txt2arff(filename, value): with open(39。./39。, 39。w39。) as fp: (39。39。39。@relation ExceptionRelation@attribute ID string@attribute Thrown numeric@attribute SetLogicFlag numeric@attribute Return numeric@attribute LOC numeric@attribute NumMethod numeric@attribute EmptyBlock numeric@attribute RecoverFlag numeric@attribute OtherOperation numeric@attribute classatt {True,False}@data39。39。39。) with open(filename) as f: contents = () for content in contents: lines = (39。\t39。) lines = [() for line in lines] if lines[9] == 39。139。: lines[9] = True (39。{39。 + str(value) + 39。}39。) else: lines[9] = False (39。{1}39。) array = 39。,39。.join(lines) (%s\n % array)處理結(jié)果:小型數(shù)據(jù)大型數(shù)據(jù)(二)IBM SPSS Modeler 為了解決各種商務(wù)問題,企業(yè)需要以不同的方式來處理各種類型迥異的數(shù)據(jù), 相異的任務(wù)類型和數(shù)據(jù)類型就要求有不同的分析技術(shù)。 Clementine為您提供最出色、最廣泛的數(shù)據(jù)挖掘技術(shù),確保您可用最恰當(dāng)?shù)姆治黾夹g(shù)來處理相應(yīng)的問題,從而得到最優(yōu)的結(jié)果以應(yīng)對隨時出現(xiàn)的商業(yè)問題。即便改進(jìn)業(yè)務(wù)的機(jī)會被龐雜的數(shù)據(jù)表格所掩蓋, Clementine也能最大限度地執(zhí)行標(biāo)準(zhǔn)的數(shù)據(jù)挖掘流程,為您找到解決商業(yè)問題的最佳答案。其中看到其實(shí)Modeler也是SPSS公司收購回的,前身即是Clementine,09年整個SPSS被IBM收購后,就改名為IBM SPSS Modeler了,今年Modeler已經(jīng)發(fā)布18版本,更新要比以前多了不少,多了非常多的擴(kuò)展功能(例如天氣數(shù)據(jù)獲取等等)Modeler是一款數(shù)據(jù)挖掘軟件,建模的原理主要偏向于數(shù)學(xué)算法,比如各種聚類算法,各種決策樹算法,神經(jīng)網(wǎng)絡(luò)算法,貝葉斯算法等等。目的是通過對數(shù)據(jù)的整理,建模,挖掘出相關(guān)的結(jié)果,知道管理實(shí)際。主要應(yīng)用于數(shù)據(jù)量大的分析,或者連接至數(shù)據(jù)庫分析。Modeler界面除了任何軟件都有的菜單欄、工具欄、狀態(tài)欄之外,主要由①數(shù)據(jù)流構(gòu)建區(qū)②數(shù)據(jù)流、結(jié)果和模型管理區(qū)③數(shù)據(jù)挖掘項(xiàng)目管理區(qū)④節(jié)點(diǎn)區(qū)四個部分構(gòu)成。IBM SPSS Modeler是客戶端/服務(wù)器端架構(gòu)的產(chǎn)品。客戶既可以在單機(jī)版上運(yùn)行IBM SPSS Modeler,也可以連接到IBM SPSS Modeler Server運(yùn)行數(shù)據(jù)流,從而
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1