freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘weka實(shí)驗(yàn)報(bào)告(編輯修改稿)

2024-08-31 00:02 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 l balance (numeric),資金交易金額;l fares (numeric),交易手續(xù)費(fèi);l fares_type(enum),手續(xù)費(fèi)類(lèi)型,取值范圍“全額結(jié)算”/“凈額結(jié)算”;l internet_shares (numeric),網(wǎng)上交易基金份額;l internet_balance (numeric) ,網(wǎng)上交易資金金額;l remark(character),備注;三、數(shù)據(jù)分析我們給出一個(gè)CSV文件的例子()。用UltraEdit打開(kāi)它可以看到,這種格式也是一種逗號(hào)分割數(shù)據(jù)的文本文件,儲(chǔ)存了一個(gè)二維表格。Excel的XLS文件可以讓多個(gè)二維表格放到不同的工作表(Sheet)中,我們只能把每個(gè)工作表存成不同的CSV文件。打開(kāi)一個(gè)XLS文件并切換到需要轉(zhuǎn)換的工作表,另存為CSV類(lèi)型,點(diǎn)“確定”、“是”忽略提示即可完成操作。需要注意的是,Matllab給出的CSV文件往往沒(méi)有屬性名(Excel給出的也有可能沒(méi)有)。而WEKA必須從CSV文件的第一行讀取屬性名,否則就會(huì)把第一行的各屬性值讀成變量名。因此我們對(duì)于Matllab給出的CSV文件需要用UltraEdit打開(kāi),手工添加一行屬性名。注意屬性名的個(gè)數(shù)要跟數(shù)據(jù)屬性的個(gè)數(shù)一致,仍用逗號(hào)隔開(kāi)。.csv .arff將CSV轉(zhuǎn)換為ARFF最迅捷的辦法是使用WEKA所帶的命令行工具。運(yùn)行WEKA的主程序,出現(xiàn)GUI后可以點(diǎn)擊下方按鈕進(jìn)入相應(yīng)的模塊。我們點(diǎn)擊進(jìn)入“Simple CLI”模塊提供的命令行功能。由于weka暫不支持中文輸入,所以挑選了在D盤(pán)下進(jìn)行轉(zhuǎn)換,在新窗口的最下方(上方是不能寫(xiě)字的)輸入框?qū)懮蟡ava D:/ D:/ 即可完成轉(zhuǎn)換,生成文件“D:/”。見(jiàn)下圖5: 圖5進(jìn)入“Exploer”模塊,從上方的按鈕中打開(kāi)CSV文件然后另存為ARFF文件亦可。我們應(yīng)該注意到,“Exploer”還提供了很多功能,實(shí)際上可以說(shuō)這是WEKA使用最多的模塊?,F(xiàn)在我們先來(lái)熟悉它的界面,然后利用它對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。界面展現(xiàn)見(jiàn)下圖6:圖中顯示的是使用“Exploer”打開(kāi)“”的情況。 圖6預(yù)處理通常對(duì)于WEKA來(lái)說(shuō)并不支持中文,所以我們將一些涉及中文的字段刪除。勾選屬性“fund_name”、“pany”、“business_name”、“remark”,并點(diǎn)擊“Remove”。將新的數(shù)據(jù)集保存一次。其中“fares_type”只有2個(gè)取值:全額結(jié)算和凈額結(jié)算。這時(shí)我們?cè)赨ltraEdit中直接修改ARFF文件,把@attribute fares_type {全額結(jié)算,凈額結(jié)算}改為@attribute fares_type {Full,Net}@attribute date {numeric}改為@attribut date {2009/8/24,2009/8/25,2009/8/26,2009/8/27,2009/8/28 }就可以了。在“Explorer”中重新打開(kāi)“”,選中“date”和“fund_type”,看到屬性已經(jīng)變成“Nominal”了。WEKA支持的datatype有四種,分別是:numeric數(shù)值型,nominalspecification分類(lèi)(nominal)型,string字符串型,date [dateformat]日期和時(shí)間型 而本表只有nemeric和nominal兩種類(lèi)型,數(shù)值屬性(nemeric) 數(shù)值型屬性可以是整數(shù)或者實(shí)數(shù),但WEKA把它們都當(dāng)作實(shí)數(shù)看待。分類(lèi)屬性(nominal) 分類(lèi)屬性由nominalspecification列出一系列可能的類(lèi)別名稱(chēng)并放在花括號(hào)中:{nominal name1, nominalname2, ...} 。數(shù)據(jù)集中該屬性的值只能是其中一種類(lèi)別。如果類(lèi)別名稱(chēng)帶有空格,仍需要將之放入引號(hào)中?!皊hares”,“banlance”,“fares”,“internet_shares”和“internet_banlance”的離散化我們需要借助WEKA中名為“Discretize”的Filter來(lái)完成。在區(qū)域2中點(diǎn)“Choose”,出現(xiàn)一棵“Filter樹(shù)”,逐級(jí)找到“”,點(diǎn)擊。若無(wú)法關(guān)閉這個(gè)樹(shù),在樹(shù)之外的地方點(diǎn)擊“Explorer”面板即可?,F(xiàn)在“Choose”旁邊的文本框應(yīng)該顯示“Discretize B 10 M R firstlast”。 點(diǎn)擊這個(gè)文本框會(huì)彈出新窗口以修改離散化的參數(shù)。我們不打算對(duì)所有的屬性離散化,只是針對(duì)對(duì)第4,5,6,8,9個(gè),故把a(bǔ)ttributeIndices右邊改成“4,5,6,8,9”。我們把這兩個(gè)屬性都分成10段,于是把“bins”改成“10”。其它不變。點(diǎn)“OK”回到“Explorer”,可以看到“shares”,“banlance”,“fares”,“internet_shares”和“internet_banlance”已經(jīng)被離散化成分類(lèi)型的屬性。同時(shí)我們可以用UltraEdit打開(kāi)保存后的ARFF文件,把所有的類(lèi)似“39。\39。(]\39。39?!碧鎿Q成“”。其它標(biāo)識(shí)做類(lèi)似地手動(dòng)替換。經(jīng)刪減后,保留date、shares、bal
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1