freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

awvaaa聚類分析new-閱讀頁

2024-08-23 09:35本頁面
  

【正文】 .通 常選擇凝聚點(diǎn)的方法有: (1) 人為選擇,當(dāng)人們對所欲分類的問題有一定了解時(shí),根據(jù)經(jīng)驗(yàn),預(yù)先確定分類個(gè)數(shù)和初始分類,并從每一類中選擇一個(gè)有代表性的樣品作為凝聚點(diǎn)。 78 (3) 用密度法選擇凝聚點(diǎn):以某個(gè)正數(shù) d為半徑,以每個(gè)樣品為球心,落在這個(gè)球內(nèi)的樣品數(shù) (不包括作為球心的樣品 )就叫做這個(gè)樣品的密度。然后選出次大密度的樣品點(diǎn),若它與第一個(gè)凝 聚點(diǎn)的距離大于 D,則將其作為第二個(gè)凝聚點(diǎn);否則舍去這點(diǎn),再 選密度次于它的樣品。 79 (5) 隨機(jī)地選擇,如果對樣品的性質(zhì)毫無所知,可采用隨機(jī)數(shù)表來選擇,打算分幾類就選幾個(gè)凝聚點(diǎn)。這方法一般不提倡使用。然后依次考察每個(gè)樣品,若某樣品與已選定的凝聚點(diǎn)的距 離均大于 d,該樣品作為新的凝聚點(diǎn),否則考察下一個(gè)樣品。 (3) 選擇一批凝聚點(diǎn)后,每個(gè)凝聚點(diǎn)自成一類,將樣品依次歸入其距離最近的凝聚點(diǎn)所在的類,并重新計(jì)算該類的重心,以代替原來的凝聚點(diǎn),再考慮下一個(gè)樣品的歸類,直至所有樣品都?xì)w類為止. (4) 用某種聚類方法得到一個(gè)分類,這個(gè)分類就可作為初始分類.當(dāng)樣本量大時(shí),有時(shí)只用部分樣品按某種聚類方法進(jìn)行分類.用每類重心作為凝聚點(diǎn),再用 (2)或 (3)的方法對全部樣品歸類后得到初始分類. 81 三、衡量聚類結(jié)果的合理性指標(biāo) 和算法終止的標(biāo)準(zhǔn) 定義 設(shè) 表示在第 n次聚類后得到的第 i類集合, , 為第 n次聚類所得到的聚核。 niPki ,3,2,1 ?? )(niA? ?? ?? ki Px nin niAxdu 1 )(2 ),(? ?? ?? ki Px nin niAxdu 1 )(2 ),(步的新聚核。 為所有 K個(gè)類中所有元素與其重心的距離的平方和。 每一次對一個(gè)觀測值點(diǎn)進(jìn)行歸類 , “ 凝聚點(diǎn) ” 更新為這一類目前的均值; 第三 , 可選擇地 , 通過分配每個(gè) “ 凝聚點(diǎn) ” 最近的類里來形成臨時(shí)分類 。 該步驟可以一直進(jìn)行直到“ 凝聚點(diǎn) ” 的改變很小或?yàn)榱銜r(shí)止; 第四 , 最終的分類有分配每一個(gè)觀測到最近的 “ 凝聚點(diǎn)” 而形成 。 對各地區(qū)實(shí)現(xiàn)小康生活質(zhì)量的狀況進(jìn)行綜合評價(jià) , 對各級政府部門具有重要意義 。 希望利用該數(shù)據(jù)對 15個(gè)地區(qū)進(jìn)行分類研究 。 該方法是由費(fèi)歇在 1958年提出的 。 或者將多變量綜合成為一個(gè)變量來分析 。 若 , 則將視為一類 。 要將 分為 類;即 , 分類時(shí)不能打亂樣本點(diǎn)的順序 , 即每一類必須呈的 形式 , 即有序樣本聚類 。而有序聚類則相反,開始所有的樣品為一類,然后分為二類、三類等,直到分成 n類。 88 例 ? ?421 , ??? ??? )(11 ?? ?? V)()( 322 ??? ??? VV)( 43 ?? ?? V這里 n=4, m=3。 ? ?321 ),( vvvP ?? ?4221 ),( w89 有序樣本聚類法常常被用于系統(tǒng)的評估問題 , 被用來對樣本點(diǎn)進(jìn)行分類劃級 。 一種方法是按照行政命令 。 這種行政上的規(guī)定往往是不客觀 、 不合理的 。 這就是有序樣本聚類的工作思路 。 定義類的直徑 設(shè)某類 G中包含的樣品有 ? ? )( ij ?? ( j )1)(i( i ) x,x,x ? 該類的均值向量為 ????? jitij ( t )GxX 1191 ? 用 D(i,j)表示這一類的直徑,常用的直徑有: ?? ???? j itjiD )X(x)Xx G( t )G( t )(),(? 當(dāng)是單變量的時(shí),也可以定義直徑為: 是中位數(shù)Gj it G( t ) XXxjiD ~|~|),( ?? ??92 定義分類的損失函數(shù) 用 b(n,k)表示將 n個(gè)有序的樣品分為 k類的某種分法: ? ?1,1, 2111 ??? iiiG ?? ?1,1, 3221 ??? iiiG ???? ?niiG kkk ,1, ??? 定義這種分類法的損失函數(shù)為 ? ??? ? ?? kt tt iiDknbL 1 1 )1,(),(93 L[b(n,k)]的遞推公式 ? ? ? ?? ? ? ?????????????????),()1,1(m i n),(),()1,1(m i n)2,(2njDkjDknpLnjDjDnpLnjknj 當(dāng) n和 k固定時(shí) , L[b(n,k)]越小表示各類的離差平方和越小 , 分類是合理的 。 記該分法為 p[n,k]。 94 最優(yōu)解的求法 若分類數(shù) k是已知的,求分類法 b(n,k),使它在損失函數(shù)意義下達(dá)到最小,其求法如下: 首先, 找出分點(diǎn) jk,使 ),()]1,1([)],([ njDkjPLknPL kk ???? 于是得第 k類 ? ?njjG kkk ,1, ??? 然后, 找出 jk- 1,使它滿足 )1,()]2,1([)]1,([ 111 ?????? ??? kkkk jjDkjPLkjPL 于是得第 k1類 ? ?1,1, 111 ??? ??? kkkk jjjG ?95 類推。 分析兒童的生長期。 年齡 1 2 3 4 5 6 7 8 9 10 11 增加重量(公斤) 96 1 2 3 4 5 6 7 8 9 101 0 . 4 4 42 0 . 5 9 8 0 . 0 0 53 0 . 7 0 9 0 . 0 2 0 . 0 0 54 0 . 8 1 9 0 . 0 5 1 0 . 0 2 1 0 . 0 0 55 0 . 9 4 3 0 . 1 0 4 0 . 0 5 3 0 . 0 2 1 0 . 0 0 56 1 . 0 7 8 0 . 1 7 9 0 . 1 0 4 0 . 0 5 1 0 . 0 2 0 . 0 0 57 1 . 2 2 5 0 . 2 8 7 0 . 1 8 1 0 . 1 0 5 0 . 0 5 5 0 . 0 2 4 0 . 0 0 88 1 . 4 1 2 0 . 4 2 7 0 . 2 8 7 0 . 1 8 1 0 . 1 0 6 0 . 0 5 6 0 . 0 2 3 0 . 0 0 59 1 . 6 3 8 0 . 6 1 3 0 . 4 3 3 0 . 2 9 2 0 . 1 8 7 0 . 1 1 1 0 . 0 5 7 0 . 0 2 1 0 . 0 0 610 1 . 9 1 5 0 . 8 3 9 0 . 6 1 4 0 . 4 3 4 0 . 2 9 4 0 . 1 8 7 0 . 1 0 7 0 . 0 5 1 0 . 0 2 1 0 . 0 0 5直徑 D (i , j )97 樣品數(shù) 2 類 3 類 4 類 5 類 6 類 7 類 8 類 9 類 10 類3 0 . 0 0 5 ( 2 )4 0 . 0 2 0 ( 2 ) 0 . 0 0 5 ( 4 )5 0 . 0 5 1 ( 2 ) 0 . 0 1 0 ( 4 ) 0 . 0 0 5 ( 5 )6 0 . 1 0 4 ( 2 ) 0 . 0 2 6 ( 5 ) 0 . 0 1 0 ( 5 ) 0 . 0 0 5 ( 6 )7 0 . 1 7 9 ( 2 ) 0 . 0 4 1 ( 5 ) 0 . 0 1 5 ( 6 ) 0 . 0 1 0 ( 6 ) 0 . 0 0 5 ( 7 )8 0 . 2 8 7 ( 2 ) 0 . 0 7 5 ( 5 ) 0 . 0 3 3 ( 7 ) 0 . 0 1 5 ( 8 ) 0 . 0 1 0 ( 8 ) 0 . 0 0 5 ( 8 )9 0 . 4 2 7 ( 2 ) 0 . 1 0 7 ( 6 ) 0 . 0 4 6 ( 8 ) 0 . 0 2 1 ( 8 ) 0 . 0 1 5 ( 8 ) 0 . 0 1 0 ( 8 ) 0 . 0 0 5 ( 9 )10 0 . 6 1 3 ( 2 ) 0 . 1 6 0 ( 7 ) 0 . 0 6 2 ( 8 ) 0 . 0 3 7 ( 8 ) 0 . 0 2 1 ( 1 0 ) 0 . 0 1 5 ( 1 0 ) 0 . 0 1 0 ( 1 0 ) 0 . 0 0 5 ( 1 0 )11 0 . 8 3 9 ( 2 ) 0 . 2 1 1 ( 7 ) 0 . 0 9 2 ( 8 ) 0 . 0 5 1 ( 1 0 ) 0 . 0 2 6 ( 1 0 ) 0 . 0 2 1 ( 1 1 ) 0 . 0 1 5 ( 1 1 ) 0 . 0 1 0 ( 1 1 ) 0 . 0 0 5 ( 1 1 )最小誤差函數(shù)表98 損失函數(shù)L [ p ( n , k ) ] 隨k 變化趨勢圖011 2 3 4 5 6 7 8 9類數(shù)損失函數(shù)99 分類數(shù) 誤差函數(shù) 最優(yōu)分割結(jié)果2 1,2113 1,26,7114 1,24,57,8115 1,24,57,89,10116 1,23,45,67,89,10117 1,23,45,67,89,10,118 1,23,4,5,67,89,10,119 1,23,4,5,6,7,89,10,1110 1,23,4,5,6,7,8,9,10,11100 其他聚類方法 兩維圖論聚類 由于生態(tài)區(qū)劃的劃分既要求各分區(qū)內(nèi)部的自然 、 經(jīng)濟(jì)條件具有相對一致性 , 保持空間上的連通性和行政區(qū)界的完整性 , 如果采用普通的聚類方法 , 就很難使分類結(jié)果滿足分區(qū)的原則 , 因此 , 需引人圖論的空間表示法及相關(guān)算法 。 101 模糊聚類 在自然科學(xué)或社會科學(xué)研究中 , 存在著許多定義不很嚴(yán)格或者說具有模糊性的概念 。 這些通常是本來就屬于模糊的概念 , 為處理分析這些 “ 模糊 ” 概念的數(shù)據(jù) , 便產(chǎn)生了模糊集合論 。 102 二階段聚類 :(資料來自 ) :在樣本容量太大時(shí)替代系統(tǒng)聚類。 103 ,類與樣品間,類與類間的相互聯(lián)系程度的量度: 1)對數(shù)似然距離 —— 實(shí)質(zhì)是概率,注意:這里有關(guān)變量的原始假定 : ( 1)連續(xù)型變量服從正態(tài)分布 ( 2)類別型變量服從多項(xiàng)分布 ( 3)變量相互獨(dú)立 2)歐氏距離 —— 這里程序默認(rèn):類與類,類與樣品間的距離采用重心距離。方法:有條件的經(jīng)修改的層次聚類 —— (1) 程序?qū)颖具M(jìn)行異端值(或異端類)的識別,以避免異端值對聚類樹的影響(可使聚類樹“體積”過大 —— 類內(nèi)的差異不合理的擴(kuò)大,對聚類效果造成影響) (2) 進(jìn)行經(jīng)修改(詳情請閱讀“ BIRCH”)的層次聚類 105 (3) 由給定閾值(或初始類數(shù))的條件下,完成初始聚類。 (這里程序建議使用赤池或 schwarts準(zhǔn)則) 2)在給定閾值( pass)(也可根據(jù)其他標(biāo)準(zhǔn)確定類數(shù))的條件下,對初始類(如果在( 1)中采用了對異端值、類的處理,這里的初始類將不包括它們)進(jìn)行層次聚類 —— 類間距離將采用重心距離(程
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1