freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

用weka進(jìn)行數(shù)據(jù)挖掘畢業(yè)設(shè)計(jì)論文)word格式-資料下載頁

2025-08-07 12:02本頁面
  

【正文】 se,false,insecttoad,false,false,true,false,false,true,false,true,true,true,false,false,4,false,false,false,amphibiantortoise,false,false,true,false,false,false,false,false,true,true,false,false,4,true,false,true,reptiletuatara,false,false,true,false,false,false,true,true,true,true,false,false,4,true,false,false,reptiletuna,false,false,true,false,false,true,true,true,true,false,false,true,0,true,false,true,fishvampire,true,false,false,true,true,false,false,true,true,true,false,false,2,true,false,false,mammalvole,true,false,false,true,false,false,false,true,true,true,false,false,4,true,false,false,mammalvulture,false,true,true,false,true,false,true,false,true,true,false,false,2,true,false,true,birdwallaby,true,false,false,true,false,false,false,true,true,true,false,false,2,true,false,true,mammalwasp,true,false,true,false,true,false,false,false,false,true,true,false,6,false,false,false,insectwolf,true,false,false,true,false,false,true,true,true,true,false,false,4,true,false,true,mammalworm,false,false,true,false,false,false,false,false,false,true,false,false,0,false,false,false,invertebratewren,false,true,true,false,true,false,false,false,true,true,false,false,2,true,false,false,bird%%%數(shù)據(jù)預(yù)處理:一開始從網(wǎng)上下到的數(shù)據(jù)只有單純的六百條記錄,沒有屬性的劃分WEKA不能讀出。因此在數(shù)據(jù)中添加了如下語句:@relation Synthetic_control3@attribute 39。a139。 nominal@data從而使軟件能夠正確地識別數(shù)據(jù)記錄及其屬性。 Kmeans算法原理K均值算法以k為輸入?yún)?shù),把n個(gè)對象的集合分成k個(gè)簇,使得結(jié)果內(nèi)的相似程度最高,而簇間的相似程度低。簇的相似度是關(guān)于簇中對象的舉止度量??梢钥醋鞔氐馁|(zhì)心。K均值算法的處理流程如下。首先,隨機(jī)地選擇k個(gè)對象,每一個(gè)對象代表一個(gè)簇的初始均值或者中心。對剩余的每一個(gè)對象,根據(jù)其與各個(gè)簇均值的距離,把它指派到最相似的簇。然后計(jì)算每一個(gè)簇新的均值。這個(gè)過程不斷重復(fù),知道準(zhǔn)則函數(shù)收斂。其中準(zhǔn)則函數(shù)定義如下:其中,E是數(shù)據(jù)集所有對象的平方誤差和,P是空間中的點(diǎn),表示給定對象,是簇的均值。算法描述:輸入:聚類個(gè)數(shù)k,以及包含 n個(gè)數(shù)據(jù)對象的數(shù)據(jù)庫。輸出:滿足方差最小標(biāo)準(zhǔn)的k個(gè)聚類。處理流程: (1) 從 n個(gè)數(shù)據(jù)對象任意選擇 k 個(gè)對象作為初始聚類中心;(2) 循環(huán)(3)到(4)直到每個(gè)聚類不再發(fā)生變化為止(3) 根據(jù)每個(gè)聚類對象的均值(中心對象),計(jì)算每個(gè)對象與這些中心對象的距離;并根據(jù)最小距離重新對相應(yīng)對象進(jìn)行劃分;(4) 重新計(jì)算每個(gè)(有變化)聚類的均值(中心對象)kmeans 算法接受輸入量 k ;然后將n個(gè)數(shù)據(jù)對象劃分為 k個(gè)聚類以便使得所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。聚類相似度是利用各聚類中對象的均值所獲得一個(gè)“中心對象”(引力中心)來進(jìn)行計(jì)算的。 SimpleKMeans算法KMeans 算法是應(yīng)用最為廣泛的聚類算法。SimpleKMeans算法是KMeans算法中最為簡單的一種,也是在Weka軟件中集成的一個(gè)算法,本次大作業(yè)中,我在Weka中,利用SimpleKMeans算法對數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘,主要是由于SimpleKMeans算法有KMeans算法應(yīng)用廣泛,具有代表性的特性,同時(shí)它有事一種最為簡單的kmeans算法,更加容易我們掌握,因此,此次我選擇該算法作為我對zoo這一數(shù)據(jù)集進(jìn)行聚類分析的原因。利用WEKA對Synthetic Control Chart數(shù)據(jù)集進(jìn)行聚類,如下圖: 。在Proprocess選項(xiàng)卡,點(diǎn)擊open files,即可導(dǎo)入數(shù)據(jù)集,,應(yīng)該要做一下轉(zhuǎn)換。導(dǎo)入數(shù)據(jù)集:,所以不需要再進(jìn)行處理,可以直接進(jìn)行聚類分析。選擇Cluster,進(jìn)入聚類操作的界面,點(diǎn)擊chooose,在彈出的樹形列表中可以選擇要使用的聚類算法,再此我們使用Simlkmeans,點(diǎn)擊choose右邊的方框,在彈出的對話框中設(shè)著聚類的相關(guān)參數(shù)。截圖如下:設(shè)置參數(shù)如下:點(diǎn)擊start就可以開始進(jìn)行聚類了4. 聚類結(jié)果分析Number of interations :2表明總共的迭代次數(shù)是2Cluster centroids:之后列出了各個(gè)簇中心的位置。對于數(shù)值型的屬性,簇中心就是它的均值(Mean);分類型的就是它的眾數(shù)(Mode), 也就是說這個(gè)屬性上取值為眾數(shù)值的實(shí)例最多。對于數(shù)值型的屬性,還給出了它在各個(gè)簇里的標(biāo)準(zhǔn)差(Std Devs)。 Clustered Instances:是各個(gè)簇中實(shí)例的數(shù)目及百分比。為了觀察可視化的聚類結(jié)果,在左下方“Result list”列出的結(jié)果上右擊,點(diǎn)“Visualize cluster assignments”。彈出的窗口給出了各實(shí)例的散點(diǎn)圖。可以看到如下圖的可視化結(jié)果:同樣是SimpeKMeans算法,選擇種子的數(shù)目不一樣的時(shí)候,squared errors的值也會(huì)不一樣,越小說明結(jié)果越精確。Seed為100時(shí): seed為50時(shí):Seed為15時(shí):3結(jié)論通過本次作業(yè),一方面,深入地了解了SimpleKMeans算法的基本原理、使用范圍、不足等。另一方面,學(xué)習(xí)了Weka的用法。包括各種挖掘工具以及結(jié)果的含義。在完成本次作業(yè)的過程中,我對Weka的用法有了一個(gè)比較基本的了解,在這次用SimpleKMeans算法進(jìn)行數(shù)據(jù)挖掘聚類分析的時(shí)候,通過聚類的結(jié)果更加明確了該算法的用途。后來,我又對另外一個(gè)Nominal的數(shù)據(jù)集進(jìn)行了關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)了屬性之間的關(guān)聯(lián)。在完成本次大作業(yè)的過程中,我也遇到了許多的困難,碰到了許多的不明白的問題,但通過和同學(xué)之間的討論以及搜索資料,最終,問題迎刃而解。通過完成這次大作業(yè),培養(yǎng)了我獨(dú)立學(xué)習(xí)和完成任務(wù)的能力,也激發(fā)了我對數(shù)據(jù)挖掘這一課程的學(xué)習(xí)興趣。以后在課余時(shí)間,我仍會(huì)努力學(xué)習(xí)這一領(lǐng)域的知識。[1].Jiawei Han Micheline Kamber .數(shù)據(jù)挖掘概念與技術(shù).().[2]. 王娜譯. WEKA 355 Explorer 用戶指南[3]. WEKA入門教程[4].
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1