freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

聚類分析方法與應用-文庫吧資料

2025-05-22 01:10本頁面
  

【正文】 擬生物界中蟻群、魚群和鳥群在覓食或逃避敵人時的行為。由于較長的處理時間和數(shù)據(jù)的復雜性,需要進行進一步的研究來使它適用于大型數(shù)據(jù)庫。這樣產(chǎn)生的結果簇可以被看作一個底層特征向高層特征的映射。 ?結果簇的數(shù)目和每個簇中單元的數(shù)目是輸入?yún)?shù)。 ?獲勝的單元修正它與簇中其他單元連接上的權重,以便未來它能夠?qū)εc當前對象相似或一樣的對象做出較強的反應。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 基于模型的聚類方法 ?2. 神經(jīng)網(wǎng)絡方法 ?在某個給定層次中,一個簇中的單元彼此競爭,對低一層的輸出模式做出反應。 ?各層之間的連接是激發(fā)式的,即在某個給定層次中的單元可以接收來自低一層次所有單元的輸入。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 基于模型的聚類方法 ?2. 神經(jīng)網(wǎng)絡方法 ?競爭學習( Competitive Learning)采用了若干個單元的層次結構,它們以一種“勝者全取”的方式對系統(tǒng)當前處理的對象進行競爭。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 基于模型的聚類方法 ?2. 神經(jīng)網(wǎng)絡方法 ?神經(jīng)網(wǎng)絡以其分布式存儲、并行協(xié)同處理以及自學習等特性被用于聚類分析領域。 ?分類樹對于偏斜的輸入數(shù)據(jù)不是高度平衡的,它可能導致時間和空間復雜性的劇烈變化。 ?缺點是 COBWEB基于這樣一個假設:在每個屬性上的概率分布是彼此獨立的。產(chǎn)生最高分類效用的位置應當是對象節(jié)點的一個好的選擇。 ?在給定一個新的對象后, COBWEB沿一條適當?shù)穆窂较蛳拢薷挠嫈?shù),以尋找可以分類該對象的最好節(jié)點。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 基于模型的聚類方法 ?1. 統(tǒng)計學方法 ?COBWEB是一種典型的簡單增量概念聚類算法,以一個分類樹的形式創(chuàng)建層次聚類。它將數(shù)據(jù)分成多組,對一組未標記的數(shù)據(jù)對象產(chǎn)生一個分類模式,并對每個分類模式給出其特征描述,即每組對象代表了一個概念或類。概念聚類就是其中的一種。 ?基于模型的聚類方法主要有三類:統(tǒng)計學方法 、 神經(jīng)網(wǎng)絡方法以及基于群的聚類方法 。 ?它的一個潛在的假定就是:目標數(shù)據(jù)集是由一系列潛在的概率分布所決定的 。 給每一個聚類假定一個模型 , 然后去尋找能夠很好的滿足這個模型的數(shù)據(jù)集 。盡管該算法處理速度較快,但是可能會降低簇的質(zhì)量和精確性。 ?但由于 STING采用了一個多分辨率的方法來進行聚類分析,聚類的質(zhì)量取決于網(wǎng)格結構的最低層粒度。 ?這些參數(shù)包括:屬性無關的參數(shù) count,屬性相關的參數(shù)m(平均值), s(標準偏差), min(最小值), max(最大值),以及該單元中屬性值遵循的分布( Distribution)類型。 ?針對不同級別的分辨率,通常存在多個級別的矩形單元,這些單元形成了一個層次結構,高層的每個單元被劃分為多個低一層的單元。 STING利用存儲在網(wǎng)格單元中的統(tǒng)計信息來聚類; WAVECLUSTER用一種小波變換的方法來聚類; CLIQUE是在高維數(shù)據(jù)空間中基于網(wǎng)格和密度的聚類方法。此外,在處理高維數(shù)據(jù)時,網(wǎng)格單元的數(shù)目會隨著屬性維數(shù)的增長而成指數(shù)增長。聚類的精度取決于單元格的大小,也就是說通常與目標數(shù)據(jù)庫中記錄的個數(shù)無關,只與把數(shù)據(jù)空間分為多少個單元有關。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 ?首先將數(shù)據(jù)空間劃分成有限個單元( Cell)的網(wǎng)格結構,所有的處理都是以單個單元為對象,在這個網(wǎng)格結構上進行的。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 ?DBSCAN算法的優(yōu)點是能夠發(fā)現(xiàn)空間數(shù)據(jù)庫中任意形狀的密度連通集;在給定合適的參數(shù)條件下,能很好地處理噪聲點;對用戶領域知識要求較少;對數(shù)據(jù)的輸入順序不太敏感;適用于大型數(shù)據(jù)庫。不被包含在任何簇中的對象被認為是“噪聲”。 ?如果一個點 p的鄰域中包含數(shù)據(jù)項的個數(shù)多于最小閾值,則創(chuàng)建一個以 p作為核心對象的新簇。該算法定義簇為密度相連的點的最大集合。 ?基于密度的聚類方中最具代表性的是 DBSCAN算法 、OPTICS算法和 DENCLUE算法 。 ?基于密度的聚類方法從對象分布區(qū)域的密度著手 , 對于給定類中的數(shù)據(jù)點 , 如果在給定范圍的區(qū)域中 , 對象或數(shù)據(jù)點的密度超過某一閾值就繼續(xù)聚類 。 CURE的復雜度是 O(n), 其中 n是對象的數(shù)目。 ?另外 , 收縮因子降底了噪音對聚類的影響 , 從而使CURE對孤立點的處理更加健壯 , 而且能識別非球形和大小變化比較大的簇 , 對于大型數(shù)據(jù)庫具有良好的伸縮性 。 它們之間的距離被定義為兩個簇中代表性點之間距離的最小值 。 ?再使用層次聚類算法中的凝聚算法 。 ?當 a為 1的時候 , 所有點都收縮成一點 , 即質(zhì)心 。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 ?CURE( Clustering Using REprisentatives) 算法中既有層次部分 , 也有劃分部分 , 所以 CURE是一個綜合性的聚類算法 。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 ?該算法的優(yōu)點是具有對象數(shù)目的線性易伸縮性及良好的聚類質(zhì)量 , 一次掃描就可以進行較好的聚類 , 其計算復雜度為 O(n), n是對象的數(shù)目 。 它通過構造滿足分支因子和簇直徑限制的聚類特征樹來求聚類 。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 ?BIRCH( Balanced Iterative Reducing and Clustering using Hierarchies) 算法是一個綜合性的層次聚類方法 ,它利用層次方法的平衡迭代進行歸約和聚類 。 比較常見的方法有四種: BIRCH、 CURE、 ROCK和 CHAMELEON。層次分裂的代表是 DIANA( DIvisive ANAlysis)算法。層次凝聚的代表是AGNES( AGglomerative NESting)算法。 層次的方法可以分為凝聚的方法和分裂的方法 。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 ?基于層次的聚類方法對給定的數(shù)據(jù)進行層次的分解 , 直到某種條件滿足為止 。此外,這兩種方法都要求用戶指定聚類數(shù)目 K。 ?因此,與 kmeans算法相比,當存在噪聲和孤立點數(shù)據(jù)時, kmedoids算法要較 kmeans算法健壯,而且沒有kmeans算法那樣容易受到極端數(shù)據(jù)的影響。 ?在劃分方法中,最經(jīng)典的就是 k平均( kmeans)算法和 k中心( kmedoids)算法,很多算法都是由這兩個算法改進而來的。將對象在不同的劃分間移動,直至滿足一定的準則。這 K個分組滿足下列條件: ?每一個分組至少包含一個數(shù)據(jù)記錄; ?每一個數(shù)據(jù)記錄屬于且僅屬于一個分組 ?(注意:這個要求在某些模糊聚類算法中可以放寬)。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 ? 基于劃分的聚類方法 ? 基于層次的聚類方法 ? 基于密度的聚類方法 ? 基于網(wǎng)格的聚類方法 ? 基于模型的聚類方法 遼寧省物流航運管理系統(tǒng)工程重點實驗室 基于劃分的聚類方法 ?給定一個含有 N個對象的數(shù)據(jù)集,以及要生成的簇的數(shù)目 K。這就要求聚類算法必須與一定的語義環(huán)境及語義解釋相關聯(lián)。 遼寧省物流航運管理系統(tǒng)工程重點實驗室 對聚類算法性能的要求 ?8. 增加限制條件后的聚類分析能力 現(xiàn)實的應用中經(jīng)常會出現(xiàn)各種各樣的限制條件,我們希望聚類算法可以在考慮這些限制的情況下,
點擊復制文檔內(nèi)容
高考資料相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1