freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

weka學(xué)習(xí)文檔-全文預(yù)覽

  

【正文】 中稱作實(shí)例)的一組特征(輸入變量),對(duì)目標(biāo)進(jìn)行預(yù)測(cè)。 我們還可以加上“ I”參數(shù),得到不同項(xiàng)數(shù)的頻繁項(xiàng)集。 Best rules found: 1. age=52_max save_act=YES current_act=YES 113 == ine=43759_max 61 conf:() lift:() lev:( [45] conv:() 2. ine=43759_max 80 == age=52_max save_act=YES current_act=YES 61 conf:() lift:() lev:( [45] conv:() 3. ine=43759_max current_act=YES 63 == age=52_max save_act=YES 61 conf:() lift:() lev:( [45] conv:() 4. age=52_max save_act=YES 151 == ine=43759_max current_act=YES 61 conf:() lift:() lev:( [45] conv:() 5. age=52_max save_act=YES 151 == ine=43759_max 76 conf:() lift:() lev:() [55] conv:()對(duì)于挖掘出的每條規(guī)則,WEKA列出了它們關(guān)聯(lián)程度的四項(xiàng)指標(biāo)。我們把“l(fā)owerBoundMinSupport”和“upperBoundMinSupport”,“metricType”設(shè)為lift,“minMetric”,“numRules”設(shè)為100。 Conviction(更不知道譯了):P(L)P(!R)/P(L,!R) (!R表示R沒有發(fā)生)Conviction也是用來衡量L和R的獨(dú)立性。有幾個(gè)類似的度量代替置信度來衡量規(guī)則的關(guān)聯(lián)程度,它們分別是 Lift(提升度?): P(L,R)/(P(L)P(R)) Lift=1時(shí)表示L和R獨(dú)立。背景知識(shí) 首先我們來溫習(xí)一下Apriori的有關(guān)知識(shí)。4. 關(guān)聯(lián)規(guī)則(購(gòu)物籃分析)注意:目前,WEKA的關(guān)聯(lián)規(guī)則分析功能僅能用來作示范,不適合用來挖掘大型數(shù)據(jù)集。39。若想放棄離散化可以點(diǎn)區(qū)域2的“Undo”。我們不打算對(duì)所有的屬性離散化,只是針對(duì)對(duì)第1個(gè)和第4個(gè)屬性(見區(qū)域5屬性名左邊的數(shù)字),故把a(bǔ)ttributeIndices右邊改成“1,4”。在區(qū)域2中點(diǎn)“Choose”,出現(xiàn)一棵“Filter樹”,逐級(jí)找到“”,點(diǎn)擊。在這個(gè)數(shù)據(jù)集中有3個(gè)變量是數(shù)值型的,分別是“age”,“ine”和“children”。將新的數(shù)據(jù)集保存一次,并用UltraEdit打開這個(gè)ARFF文件。右邊的weka鳥在動(dòng)的話說明WEKA正在執(zhí)行挖掘任務(wù)。若數(shù)據(jù)集的最后一個(gè)屬性(我們說過這是分類或回歸任務(wù)的默認(rèn)目標(biāo)變量)是分類變量(這里的“pep”正好是),直方圖中的每個(gè)長(zhǎng)方形就會(huì)按照該變量的比例分成不同顏色的段。在區(qū)域5中選中某個(gè)屬性,則區(qū)域6中有關(guān)于這個(gè)屬性的摘要。 區(qū)域4展示了數(shù)據(jù)集的一些基本情況。包括打開數(shù)據(jù),保存及編輯功能。我們根據(jù)不同的功能把這個(gè)界面分成8個(gè)區(qū)域。進(jìn)入“Exploer”模塊,從上方的按鈕中打開CSV文件然后另存為ARFF文件亦可。 運(yùn)行WEKA的主程序,出現(xiàn)GUI后可以點(diǎn)擊下方按鈕進(jìn)入相應(yīng)的模塊。而WEKA必須從CSV文件的第一行讀取屬性名,否則就會(huì)把第一行的各屬性值讀成變量名。在Matlab中的二維表格是一個(gè)矩陣,我們通過這條命令把一個(gè)矩陣存成CSV格式。 .* .csv 我們給出一個(gè)CSV文件的例子()。此外,WEKA還提供了通過JDBC訪問數(shù)據(jù)庫(kù)的功能。Relational型屬性 在WEKA ,有了這種類型我們可以像關(guān)系型數(shù)據(jù)庫(kù)那樣處理多個(gè)維度了。屬性值之間仍用逗號(hào)隔開。 稀疏格式是針對(duì)數(shù)據(jù)信息中某個(gè)實(shí)例的表示而言,不需要修改ARFF文件的其它部分。 AS262, 39。若值中含有空格,必須被引號(hào)括起來。 每個(gè)實(shí)例占一行。這種類型的屬性在文本挖掘中非常有用。例如如下的屬性聲明說明“outlook”屬性有三種類別:“sunny”,“ overcast”和“rainy”。注意“integer”,“real”,“numeric”,“date”,“string”這些關(guān)鍵字是區(qū)分大小寫的,而“relation”“attribute ”和“date”則不區(qū)分。屬性聲明的格式為 attribute attributename datatype其中attributename是必須以字母開頭的字符串。 這些聲明語(yǔ)句的順序很重要。關(guān)系聲明 關(guān)系名稱在ARFF文件的第一個(gè)有效行來定義,格式為 relation relationname relationname是一個(gè)字符串。 除去注釋后,整個(gè)ARFF文件可以分為兩個(gè)部分。 識(shí)別ARFF文件的重要依據(jù)是分行,因此不能在這種文件里隨意的斷行。這也就是WEKA自帶的“”文件,在WEKA安裝目錄的“data”子目錄下可以找到。這樣一個(gè)表格,或者叫數(shù)據(jù)集,在WEKA看來,呈現(xiàn)了屬性之間的一種關(guān)系(Relation)。 跟很多電子表格或數(shù)據(jù)分析軟件一樣,WEKA所處理的數(shù)據(jù)集是圖1那樣的一個(gè)二維的表格。在weka中集成自己的算法甚至借鑒它的方法自己實(shí)現(xiàn)可視化工具并不是件很困難的事情。1簡(jiǎn)介WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),它的源代碼可通過。如果想自己實(shí)現(xiàn)數(shù)據(jù)挖掘算法的話,可以看一看weka的接口文檔。2數(shù)據(jù)格式 首先我們來看看WEKA所用的數(shù)據(jù)應(yīng)是什么樣的格式。豎行稱作一個(gè)屬性(Attrbute),相當(dāng)于統(tǒng)計(jì)學(xué)中的一個(gè)變量,或者數(shù)據(jù)庫(kù)中的一個(gè)字段。圖1所示的二維表格存儲(chǔ)在如下的ARFF文件中。 下面我們來對(duì)這個(gè)文件的內(nèi)容進(jìn)行說明。如果你看到的“”文件多了或少了些“%”開始的行,是沒有影響的。從“data”標(biāo)記開始,后面的就是數(shù)據(jù)信息了。數(shù)據(jù)集中的每一個(gè)屬性都有它對(duì)應(yīng)的“attribute”語(yǔ)句,來定義它的屬性名稱和數(shù)據(jù)類型。其次,最后一個(gè)聲明的屬性被稱作class屬性,在分類或回歸任務(wù)中,它是默認(rèn)的目標(biāo)變量。還可以使用兩個(gè)類型“integer”和“real
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1