freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于k-means算法的平面點(diǎn)集聚類系統(tǒng)畢業(yè)設(shè)計(jì)-文庫(kù)吧資料

2025-07-03 17:47本頁(yè)面
  

【正文】 網(wǎng)絡(luò)應(yīng)用程序,也可以用來(lái)創(chuàng)建網(wǎng)絡(luò)服務(wù)、智能設(shè)備應(yīng)用程序和 Office 插件。MFC是Win API與C++的結(jié)合,API,即微軟提供的Windows下應(yīng)用程序的編程語(yǔ)言接口,是一種軟件編程的規(guī)范,但不是一種程序開發(fā)語(yǔ)言本身,可以允許用戶使用各種各樣的第三方的編程語(yǔ)言來(lái)進(jìn)行對(duì)Windows下應(yīng)用程序的開發(fā),使這些被開發(fā)出來(lái)的應(yīng)用程序能在Windows下運(yùn)行, MFC是微軟對(duì)API函數(shù)的專用C++封裝,這種結(jié)合一方面讓用戶使用微軟的專業(yè)C++ SDK來(lái)進(jìn)行Windows下應(yīng)用程序的開發(fā)變得容易,因?yàn)镸FC是對(duì)API的封裝,微軟做了大量的工作,隱藏了很多程序開發(fā)人員在Windows下用C++ amp。該類庫(kù)提供一組通用的可重用的類庫(kù)供開發(fā)人員使用。MFC,微軟基礎(chǔ)類(Microsoft Foundation Classes),同VCL類似,是一種Application Framework,隨微軟Visual C++ 開發(fā)工具發(fā)布。這一階段C++語(yǔ)言基本上是傳統(tǒng)類型上的面向?qū)ο笳Z(yǔ)言,并且憑借著接近C語(yǔ)言的效率,在工業(yè)界使用的開發(fā)語(yǔ)言中占據(jù)了相當(dāng)大份額;第二階段從1995年到2000年,這一階段由于標(biāo)準(zhǔn)模板庫(kù)(STL)和后來(lái)的Boost等程序庫(kù)的出現(xiàn),泛型程序設(shè)計(jì)在C++中占據(jù)了越來(lái)越多的比重性。 ()其中的mk代表第k個(gè)簇的簇中心,N代表第k個(gè)簇中數(shù)據(jù)對(duì)象的個(gè)數(shù)。這個(gè)過程反復(fù)進(jìn)行直至平方誤差準(zhǔn)則最小。 算法的輸出:使得平方誤差準(zhǔn)則最小的k個(gè)簇。為了達(dá)到全局最優(yōu),基于劃分的聚類會(huì)要求窮舉所有可能的劃分。 關(guān)鍵技術(shù)本系統(tǒng)是由C++和MFC技術(shù)在Microsoft Visual Studio環(huán)境下開發(fā)完成的,下面將分別予以介紹。 Kmeans算法流程圖Kmeans算法優(yōu)點(diǎn)是可以處理大數(shù)據(jù)集,Kmeans算法是相對(duì)可伸縮的和高效率的,因?yàn)樗挠?jì)算復(fù)雜度為O(nkt),其中n為對(duì)象個(gè)數(shù),k為聚類個(gè)數(shù),t為迭代次數(shù),通常有r≦n,k≦n,因此它的復(fù)雜度通常也用O(n)表示。一般都采用均方差作為標(biāo)準(zhǔn)測(cè)度函數(shù),具體定義如下: ()其中E為數(shù)據(jù)庫(kù)中所有對(duì)象的均方差之和;p為代表對(duì)象的空間中的一個(gè)點(diǎn);m1為聚類c1的均值(p和m1均是多維的)。然后再計(jì)算每個(gè)新聚類的聚類中心(該聚類中所有對(duì)象的均值)。(5)輸出聚類結(jié)果。(3)所有對(duì)象分配完成后,重新計(jì)算k個(gè)聚類的中心。(1)從n個(gè)數(shù)據(jù)對(duì)象中任意選取k個(gè)對(duì)象作為初始的聚類中心。Kmeans算法的核心思想是把n個(gè)數(shù)據(jù)對(duì)象劃分為k個(gè)聚類,使每個(gè)聚類中的數(shù)據(jù)點(diǎn)到該聚類中心的平方和最小,算法處理過程:輸入:聚類個(gè)數(shù)k,包含n個(gè)數(shù)據(jù)對(duì)象的數(shù)據(jù)集。下面重點(diǎn)介紹Kmeans算法的運(yùn)算過程。3 關(guān)鍵問題及分析 研究設(shè)計(jì)中要解決的問題本系統(tǒng)主要是根據(jù)Kmeans算法的基本思想,設(shè)計(jì)實(shí)現(xiàn)一個(gè)基于Kmeans算法下的平面點(diǎn)集聚類系統(tǒng),并通過系統(tǒng)界面輸入和輸出結(jié)果。以上是理論方面的目標(biāo),在實(shí)踐方面要做到編碼較優(yōu),運(yùn)行程序耗時(shí)較短,占內(nèi)存較少。基于Kmeans算法的平面點(diǎn)集聚類系統(tǒng)是對(duì)已知的多個(gè)平面點(diǎn)根據(jù)用戶對(duì)聚類中心的數(shù)量設(shè)置后通過Kmeans聚類算法的分析后得出相應(yīng)結(jié)果。樣品之間的距離有不同的定義方法,類與類之間也同樣有不同的距離的定義方法,這樣就產(chǎn)生了不同的層次聚類方法。2. 層次聚類法層次聚類法也稱系統(tǒng)聚類法,是目前實(shí)際工作中用得最多的一類算法。CLARANS方法的復(fù)雜度是O(N2)。CLARANS方法的思想是:任意從k個(gè)中心點(diǎn)中取出一個(gè)點(diǎn),從N-k中任意取一個(gè)點(diǎn)去替換它,如果替換成功則重新開始。CLARA方法結(jié)果的優(yōu)劣依賴于采樣方法。比較5組的平方誤差,選取最小的作為輸出結(jié)果。CLARA(Clustering LARge Application)方法:是PAM方法的增強(qiáng)版,專門用于處理大量數(shù)據(jù)。PAM方法對(duì)于小數(shù)據(jù)庫(kù)處理能得到很好的結(jié)果,但是它的計(jì)算代價(jià)非常高。PAM方法首先隨機(jī)選擇k個(gè)對(duì)象作為簇的中心,對(duì)于每一個(gè)中心點(diǎn)O[j],PAM方法試圖用所有N-k個(gè)非中心點(diǎn)替換它。Kmeans算法后面我們會(huì)重點(diǎn)介紹。它根據(jù)標(biāo)準(zhǔn)統(tǒng)計(jì)方法并考慮到噪聲或異常數(shù)據(jù), 可以自動(dòng)確定聚類個(gè)數(shù); 因而它可以產(chǎn)生很多的聚類方法。STING 就是一個(gè)典型的基于網(wǎng)格的方法;(5)基于模型的方法?;诰W(wǎng)格方法將對(duì)象空間劃分為有限數(shù)目的單元以形成網(wǎng)格結(jié)構(gòu)。DBSCAN是一個(gè)有代表性的基于密度的方法。將循環(huán)再定位與層次方法結(jié)合起來(lái)使用常常是有效的,如 BIRCH和CURE,就是基于這種組合方法設(shè)計(jì)的;(3)基于密度的方法。該方法就是通過分解所給定的數(shù)據(jù)對(duì)象集來(lái)創(chuàng)建一個(gè)層次。其中每個(gè)子集均代表一個(gè)聚類 ( k=n )。大體上,聚類算法可以劃分為如下幾類:(1)劃分方法。聚類分析被廣泛研究了許多年。 聚類方法分析聚類分析是直接比較各事物之間的性質(zhì), 將性質(zhì)相近的歸為一類, 將性質(zhì)差別較大的歸入不同的類。馬氏距離是明氏距離的改進(jìn),它對(duì)于一切線性變換是不變的,克服了明氏距離受量綱影響的缺點(diǎn);馬氏距離也部分克服了多重相關(guān)性。本系統(tǒng)所應(yīng)用的距離算法是歐氏距離。1. 明氏(Minkowski)距離 ()當(dāng)q取1,2,∞。通常kn且tn;(3) 當(dāng)結(jié)果簇是密集的,而簇與簇之間的區(qū)別明顯時(shí),它的效果較好。 Kmeans的優(yōu)點(diǎn)K means 算法有三個(gè)優(yōu)點(diǎn):(1) 是解決聚類問題的一種經(jīng)典算法,簡(jiǎn)單、快捷;(2) 對(duì)處理大數(shù)據(jù)集,該算法是相對(duì)可伸縮和高效率的。算法采用迭代更新的方法,通過判定給定的聚類目標(biāo)函數(shù),每一次迭代過程都向目標(biāo)函數(shù)值減少的方向進(jìn)行。但是這些算法都存在著不足,所以就存在如何選擇參數(shù)的問題,不適當(dāng)?shù)倪x擇將會(huì)大大影響算法的結(jié)果。因此,對(duì)聚類的要求也越來(lái)越高,提出準(zhǔn)確且又高效的聚類算法刻不容緩。其結(jié)果就是一個(gè)個(gè)由數(shù)據(jù)對(duì)象組成的簇,每個(gè)簇內(nèi)的對(duì)象之間具有很高的相似性, 而簇間的對(duì)象則很不相似。因此,應(yīng)用目標(biāo)如何影響聚類方法的選擇也是一項(xiàng)重要的研究課題。有些聚類算法對(duì)于這樣的數(shù)據(jù)敏感,將會(huì)導(dǎo)致質(zhì)量較低的聚類結(jié)果;(8)基于約束的聚類:在實(shí)際應(yīng)用中有可能需要在各種約束條件下進(jìn)行聚類。通常最多在三維的情況下能夠很好地判斷聚類的質(zhì)量。研究和開發(fā)對(duì)數(shù)據(jù)輸入順序不敏感的算法具有重要的意義;(6)高維性:一個(gè)數(shù)據(jù)庫(kù)可能含有若干維或者屬性。要求入工輸入?yún)?shù)不但加重了用戶的負(fù)擔(dān),而且也使聚類質(zhì)量難以控制;(5)對(duì)于輸入記錄順序不敏感:一些聚類算法對(duì)于輸入數(shù)據(jù)的順序是敏感的。但一個(gè)簇可能是任意形狀的,提出能發(fā)現(xiàn)任意形狀簇的算法非常重要;(4)用于決定輸入?yún)?shù)的領(lǐng)域知識(shí)最小化:在聚類分析中,許多聚類算法要求用戶輸入一定的參數(shù),如希望簇的數(shù)目。在概念聚類中,一組對(duì)象只有當(dāng)它們可以被一個(gè)概念描述時(shí)才形成一個(gè)簇,這不同于基于幾何距離度量相似度的傳統(tǒng)聚類。與分類不同,聚類和無(wú)指導(dǎo)學(xué)習(xí)不依賴預(yù)先定義的類和帶類標(biāo)號(hào)的訓(xùn)練實(shí)例?;贙均值、kmedoids(k中心點(diǎn))和其他一些方法的聚類分析工具已經(jīng)被加入到許多統(tǒng)計(jì)分析軟件包或系統(tǒng)中。 本文目的本文所研究的
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1