freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘weka實(shí)驗(yàn)報(bào)告-文庫吧

2025-07-20 00:02 本頁面


【正文】 效果最好的那一組屬性。Explorer是普通用戶最常用的一個(gè)界面。用戶可以從ARFF文件(Weka使用的一種文本文件格式)、網(wǎng)頁或數(shù)據(jù)庫中讀取數(shù)據(jù)集。打開數(shù)據(jù)文件后,可以選擇算法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。這時(shí)窗體上給出了這個(gè)數(shù)據(jù)集的一些基本特征,如含有多少屬性,各屬性的一些簡(jiǎn)單統(tǒng)計(jì)量,右下方還給出一些可視化效果圖。這些都是比較直觀的分析,如果想發(fā)現(xiàn)隱藏在數(shù)據(jù)集背后的關(guān)系,還需要選擇Weka提供的各種分類、聚類或關(guān)聯(lián)規(guī)則的算法。所有設(shè)置完成后,點(diǎn)擊Start按鈕,就可以安心地等待weka帶來最終的結(jié)果。哪些結(jié)果是真正有用的還要靠經(jīng)驗(yàn)來判斷。(2)Experimenter 運(yùn)行算法試驗(yàn)、管理算法方案之間的統(tǒng)計(jì)檢驗(yàn)的環(huán)境。Experiment環(huán)境可以讓用戶創(chuàng)建,運(yùn)行,修改和分析算法試驗(yàn),這也許比單獨(dú)的分析各個(gè)算法更加方便。例如,用戶可創(chuàng)建一次試驗(yàn),在一系列數(shù)據(jù)集上運(yùn)行多個(gè)算法(schemes),然后分析結(jié)果以判斷是否某個(gè)算法比其他算法(在統(tǒng)計(jì)意義下)更好。Explorermenter主要包括簡(jiǎn)單模式,復(fù)雜模式和遠(yuǎn)程模式。復(fù)雜模式是對(duì)簡(jiǎn)單模式的基本功能的擴(kuò)充,而遠(yuǎn)程模式允許我們通過分布式的方法進(jìn)行實(shí)驗(yàn)。就功能模塊而言,分為設(shè)置模塊,運(yùn)行模塊和分析模塊。在設(shè)置模塊中我們可以自定義實(shí)驗(yàn),加入多個(gè)算法和多方的源數(shù)據(jù)(支持ARFF文件,CSV文件和數(shù)據(jù)庫),在運(yùn)行模塊中我們可以運(yùn)行我們的實(shí)驗(yàn),而在分析模塊中,我們可以分析各種算法的的準(zhǔn)確性,并提供了各種統(tǒng)計(jì)方法對(duì)結(jié)果進(jìn)行檢驗(yàn)比較。值得一提的是,我們可以把實(shí)驗(yàn)的各種參數(shù),包括算法,數(shù)據(jù)集等,保存以方便下一次相同實(shí)驗(yàn)的進(jìn)行;也可以把各種算法保存,方便應(yīng)用在不同的數(shù)據(jù)集上;如果數(shù)據(jù)集來源于數(shù)據(jù)庫的話,實(shí)驗(yàn)在過程中可以中止并繼續(xù)(原因可以是被中止或者是擴(kuò)展了實(shí)驗(yàn)),這樣就不用重新運(yùn)行那些已實(shí)驗(yàn)過的算法/數(shù)據(jù)集祝賀,而僅計(jì)算還沒有被實(shí)驗(yàn)的那些。(2)KnowledgeFlow Explorer的一個(gè)不足在于,當(dāng)用戶打開一個(gè)數(shù)據(jù)集時(shí),所有數(shù)據(jù)將全部被讀入到主存當(dāng)中,隨著任務(wù)規(guī)模的增大,普通配置的計(jì)算機(jī)很難滿足要求。Knowledge Flow提供了一個(gè)用于處理大型數(shù)據(jù)集的遞增算法,專門處理這一問題。這個(gè)環(huán)境本質(zhì)上和 Explorer所支持的功能是一樣的,但是它有一個(gè)可以拖放的界面。它有一個(gè)優(yōu)勢(shì),就是支持增量學(xué)習(xí)(incremental learning)。KnowledgeFlow 為WEKA 提供了一個(gè)"數(shù)據(jù)流"形式的界面。用戶可以從一個(gè)工具欄中選擇組件,把它們放置在面板上并按一定的順序連接起來,這樣組成一個(gè)"知識(shí)流"(knowledge flow)來處理和分析數(shù)據(jù)。目前,所有的WEKA 分類器(classifier)、篩選器(filter)、聚類器(clusterer)、載入器(loader)、保存器(saver),以及一些其他的功能可以在KnowledgeFlow 中使用。KnowledgeFlow 可以使用增量模式(incrementally)或者批量模式(inbatches)來處理數(shù)據(jù)(Explorer 只能使用批量模式)。當(dāng)然對(duì)數(shù)據(jù)進(jìn)行增量學(xué)習(xí)要求分類器能夠根據(jù)各實(shí)例逐個(gè)逐個(gè)的更新.現(xiàn)在WEKA 中有五個(gè)分類器能夠增量地處理數(shù)據(jù):NaiveBayesUpdateable,IB1,IBk,LWR(局部加權(quán)回歸)。還有一個(gè)meta 分類器RacedIncrementalLogitBoost 可以使用任意基于回歸的學(xué)習(xí)器來增量地學(xué)習(xí)離散的分類任務(wù)。(4)SimpleCLI提供了一個(gè)簡(jiǎn)單的命令行界面,能通過鍵入文本命令的方式來實(shí)現(xiàn)其他三個(gè)用戶界面所提供的所有功能,從而可以在沒有自帶命令行的操作系統(tǒng)中直接執(zhí)行 WEKA 命令。使用命令行有兩個(gè)好處:一個(gè)是可以把模型保存下來,這樣有新的待預(yù)測(cè)數(shù)據(jù)出現(xiàn)時(shí),不用每次重新建模,直接應(yīng)用保存好的模型即可。另一個(gè)是對(duì)預(yù)測(cè)結(jié)果給出了置信度,我們可以有選擇的采納預(yù)測(cè)結(jié)果,例如,只考慮那些置信度在85%以上的結(jié)果。二、實(shí)驗(yàn)案例介紹 本文用WEKA 軟件作為工具,結(jié)合券商的基金某一個(gè)時(shí)段交易業(yè)務(wù)數(shù)據(jù)進(jìn)行分析。實(shí)驗(yàn)的數(shù)據(jù)是一個(gè)交易周的基金交易業(yè)務(wù)數(shù)據(jù)。該表含有date(日期)、fund_code(基金代碼)、fund_name(基金名稱)、pany_code(基金公司代碼)、pany(基金公司名稱)、business_code(業(yè)務(wù)代碼)、business_name(業(yè)務(wù)名稱)、shares(基金份額)、balance(資金金額)、fares(手續(xù)費(fèi))、fares_type(手續(xù)費(fèi)類型)、internet_shares(網(wǎng)上交易基金份額)、internet_balance(網(wǎng)上交易資金金額)、remark(備注)等字段,通過實(shí)驗(yàn),希望能找出客戶的基金交易分布情況。該數(shù)據(jù)的數(shù)據(jù)屬性如下:l date (numeric),交易發(fā)生日期;l fund_code (numeric),基金代碼;l fund_name (character),基金名稱;l pany_code (numeric),用于報(bào)送的基金公司代碼;l pany (character),所屬的基金公司;l business_code (numeric) ,交易業(yè)務(wù)代碼; l business_name (character),交易業(yè)務(wù)名稱;l shares (numeric),基金交易份額;
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1