freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

awvaaa聚類分析new-資料下載頁

2025-08-04 09:35本頁面
  

【正文】 。 要將 分為 類;即 , 分類時(shí)不能打亂樣本點(diǎn)的順序 , 即每一類必須呈的 形式 , 即有序樣本聚類 。 ? ?n??? , 21 ??? i?)(?V i? )()( ji VV ?? ?mv ?? ??? ?21 mv ?? , 21 ? K),( 21 kPPPP ??? ?j??? , 21 ?87 系統(tǒng)聚類開始 n個(gè)樣品各自自成一類,然后逐步并類,直至所有的樣品被聚為一類為止。而有序聚類則相反,開始所有的樣品為一類,然后分為二類、三類等,直到分成 n類。每次分類都要求產(chǎn)生的離差平方和的增量最小。 88 例 ? ?421 , ??? ??? )(11 ?? ?? V)()( 322 ??? ??? VV)( 43 ?? ?? V這里 n=4, m=3。 若將其分為兩類 , 其結(jié)果應(yīng)該是 對(duì)應(yīng)中的點(diǎn)是 。 ? ?321 ),( vvvP ?? ?4221 ),( w89 有序樣本聚類法常常被用于系統(tǒng)的評(píng)估問題 , 被用來對(duì)樣本點(diǎn)進(jìn)行分類劃級(jí) 。 例如 , 十二個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展指數(shù) ,排列出來以后 , 需要?jiǎng)澐炙麄兊牡燃?jí) 。 一種方法是按照行政命令 。 規(guī)定三個(gè)經(jīng)濟(jì)發(fā)達(dá)地區(qū) , 四個(gè)中等發(fā)達(dá)的地區(qū) ,三個(gè)一般地區(qū) , 兩個(gè)發(fā)展較差地區(qū) 。 這種行政上的規(guī)定往往是不客觀 、 不合理的 。 合理的分類應(yīng)該把發(fā)展情況最近似的地區(qū)劃入同一類 。 這就是有序樣本聚類的工作思路 。 90 (二)有序聚類的步驟 設(shè)有序樣品 x(1),x(2),…, x(n)。 定義類的直徑 設(shè)某類 G中包含的樣品有 ? ? )( ij ?? ( j )1)(i( i ) x,x,x ? 該類的均值向量為 ????? jitij ( t )GxX 1191 ? 用 D(i,j)表示這一類的直徑,常用的直徑有: ?? ???? j itjiD )X(x)Xx G( t )G( t )(),(? 當(dāng)是單變量的時(shí),也可以定義直徑為: 是中位數(shù)Gj it G( t ) XXxjiD ~|~|),( ?? ??92 定義分類的損失函數(shù) 用 b(n,k)表示將 n個(gè)有序的樣品分為 k類的某種分法: ? ?1,1, 2111 ??? iiiG ?? ?1,1, 3221 ??? iiiG ???? ?niiG kkk ,1, ??? 定義這種分類法的損失函數(shù)為 ? ??? ? ?? kt tt iiDknbL 1 1 )1,(),(93 L[b(n,k)]的遞推公式 ? ? ? ?? ? ? ?????????????????),()1,1(m i n),(),()1,1(m i n)2,(2njDkjDknpLnjDjDnpLnjknj 當(dāng) n和 k固定時(shí) , L[b(n,k)]越小表示各類的離差平方和越小 , 分類是合理的 。 因此要尋找一種分法 b(n,k), 使分類損失函數(shù) L[b(n,k)]達(dá)到最小 。 記該分法為 p[n,k]。 以上的兩個(gè)公式的含義是 , 如果要找到 n個(gè)樣品分為 k個(gè)類的最優(yōu)分割 , 應(yīng)建立在將 j1( j= 2,3,… ,n)個(gè)樣品分為k1類的最優(yōu)分割的基礎(chǔ)上 。 94 最優(yōu)解的求法 若分類數(shù) k是已知的,求分類法 b(n,k),使它在損失函數(shù)意義下達(dá)到最小,其求法如下: 首先, 找出分點(diǎn) jk,使 ),()]1,1([)],([ njDkjPLknPL kk ???? 于是得第 k類 ? ?njjG kkk ,1, ??? 然后, 找出 jk- 1,使它滿足 )1,()]2,1([)]1,([ 111 ?????? ??? kkkk jjDkjPLkjPL 于是得第 k1類 ? ?1,1, 111 ??? ??? kkkk jjjG ?95 類推。一次可以得到所有類 G1, G2, …G k, 這就是所求得最優(yōu)解。 分析兒童的生長期。有如下的資料是 111歲的男孩平均每年的增重: 問男孩的發(fā)育可分為幾個(gè)階段。 年齡 1 2 3 4 5 6 7 8 9 10 11 增加重量(公斤) 96 1 2 3 4 5 6 7 8 9 101 0 . 4 4 42 0 . 5 9 8 0 . 0 0 53 0 . 7 0 9 0 . 0 2 0 . 0 0 54 0 . 8 1 9 0 . 0 5 1 0 . 0 2 1 0 . 0 0 55 0 . 9 4 3 0 . 1 0 4 0 . 0 5 3 0 . 0 2 1 0 . 0 0 56 1 . 0 7 8 0 . 1 7 9 0 . 1 0 4 0 . 0 5 1 0 . 0 2 0 . 0 0 57 1 . 2 2 5 0 . 2 8 7 0 . 1 8 1 0 . 1 0 5 0 . 0 5 5 0 . 0 2 4 0 . 0 0 88 1 . 4 1 2 0 . 4 2 7 0 . 2 8 7 0 . 1 8 1 0 . 1 0 6 0 . 0 5 6 0 . 0 2 3 0 . 0 0 59 1 . 6 3 8 0 . 6 1 3 0 . 4 3 3 0 . 2 9 2 0 . 1 8 7 0 . 1 1 1 0 . 0 5 7 0 . 0 2 1 0 . 0 0 610 1 . 9 1 5 0 . 8 3 9 0 . 6 1 4 0 . 4 3 4 0 . 2 9 4 0 . 1 8 7 0 . 1 0 7 0 . 0 5 1 0 . 0 2 1 0 . 0 0 5直徑 D (i , j )97 樣品數(shù) 2 類 3 類 4 類 5 類 6 類 7 類 8 類 9 類 10 類3 0 . 0 0 5 ( 2 )4 0 . 0 2 0 ( 2 ) 0 . 0 0 5 ( 4 )5 0 . 0 5 1 ( 2 ) 0 . 0 1 0 ( 4 ) 0 . 0 0 5 ( 5 )6 0 . 1 0 4 ( 2 ) 0 . 0 2 6 ( 5 ) 0 . 0 1 0 ( 5 ) 0 . 0 0 5 ( 6 )7 0 . 1 7 9 ( 2 ) 0 . 0 4 1 ( 5 ) 0 . 0 1 5 ( 6 ) 0 . 0 1 0 ( 6 ) 0 . 0 0 5 ( 7 )8 0 . 2 8 7 ( 2 ) 0 . 0 7 5 ( 5 ) 0 . 0 3 3 ( 7 ) 0 . 0 1 5 ( 8 ) 0 . 0 1 0 ( 8 ) 0 . 0 0 5 ( 8 )9 0 . 4 2 7 ( 2 ) 0 . 1 0 7 ( 6 ) 0 . 0 4 6 ( 8 ) 0 . 0 2 1 ( 8 ) 0 . 0 1 5 ( 8 ) 0 . 0 1 0 ( 8 ) 0 . 0 0 5 ( 9 )10 0 . 6 1 3 ( 2 ) 0 . 1 6 0 ( 7 ) 0 . 0 6 2 ( 8 ) 0 . 0 3 7 ( 8 ) 0 . 0 2 1 ( 1 0 ) 0 . 0 1 5 ( 1 0 ) 0 . 0 1 0 ( 1 0 ) 0 . 0 0 5 ( 1 0 )11 0 . 8 3 9 ( 2 ) 0 . 2 1 1 ( 7 ) 0 . 0 9 2 ( 8 ) 0 . 0 5 1 ( 1 0 ) 0 . 0 2 6 ( 1 0 ) 0 . 0 2 1 ( 1 1 ) 0 . 0 1 5 ( 1 1 ) 0 . 0 1 0 ( 1 1 ) 0 . 0 0 5 ( 1 1 )最小誤差函數(shù)表98 損失函數(shù)L [ p ( n , k ) ] 隨k 變化趨勢(shì)圖011 2 3 4 5 6 7 8 9類數(shù)損失函數(shù)99 分類數(shù) 誤差函數(shù) 最優(yōu)分割結(jié)果2 1,2113 1,26,7114 1,24,57,8115 1,24,57,89,10116 1,23,45,67,89,10117 1,23,45,67,89,10,118 1,23,4,5,67,89,10,119 1,23,4,5,6,7,89,10,1110 1,23,4,5,6,7,8,9,10,11100 其他聚類方法 兩維圖論聚類 由于生態(tài)區(qū)劃的劃分既要求各分區(qū)內(nèi)部的自然 、 經(jīng)濟(jì)條件具有相對(duì)一致性 , 保持空間上的連通性和行政區(qū)界的完整性 , 如果采用普通的聚類方法 , 就很難使分類結(jié)果滿足分區(qū)的原則 , 因此 , 需引人圖論的空間表示法及相關(guān)算法 。 01變量聚類 以 01變量為原始變量進(jìn)行聚類分析。 101 模糊聚類 在自然科學(xué)或社會(huì)科學(xué)研究中 , 存在著許多定義不很嚴(yán)格或者說具有模糊性的概念 。 這里所謂的模糊性 , 主要是指客觀事物的差異在中間過渡中的不分明性 , 如某一生態(tài)條件對(duì)某種害蟲 、 某種作物的存活或適應(yīng)性可以評(píng)價(jià)為 “ 有利 、 比較有利 、 不那么有利 、不利 ” ;災(zāi)害性霜凍氣候?qū)r(nóng)業(yè)產(chǎn)量的影響程度為“ 較重 、 嚴(yán)重 、 很嚴(yán)重 ” , 等等 。 這些通常是本來就屬于模糊的概念 , 為處理分析這些 “ 模糊 ” 概念的數(shù)據(jù) , 便產(chǎn)生了模糊集合論 。 在側(cè)重于應(yīng)用的模糊數(shù)學(xué)分析中 , 經(jīng)常應(yīng)用到聚類分析 、 模式識(shí)別和綜合評(píng)判等方法 。 102 二階段聚類 :(資料來自 ) :在樣本容量太大時(shí)替代系統(tǒng)聚類。(具有系統(tǒng)聚類和 K-均值聚類的優(yōu)點(diǎn)) : 1)變量類型:連續(xù)型,離散型(或數(shù)量型,質(zhì)量型) 2)通過對(duì)觀測(cè)的 “ 兩層 ” 聚類,有效的降低了樣本容量太大對(duì)層次聚類的限制;同時(shí),進(jìn)一步提高了聚類的效果,使組間的差異較組內(nèi)差異更加顯著。 103 ,類與樣品間,類與類間的相互聯(lián)系程度的量度: 1)對(duì)數(shù)似然距離 —— 實(shí)質(zhì)是概率,注意:這里有關(guān)變量的原始假定 : ( 1)連續(xù)型變量服從正態(tài)分布 ( 2)類別型變量服從多項(xiàng)分布 ( 3)變量相互獨(dú)立 2)歐氏距離 —— 這里程序默認(rèn):類與類,類與樣品間的距離采用重心距離。 104 : 1)將樣本觀測(cè)歸入數(shù)量較多的子類。方法:有條件的經(jīng)修改的層次聚類 —— (1) 程序?qū)颖具M(jìn)行異端值(或異端類)的識(shí)別,以避免異端值對(duì)聚類樹的影響(可使聚類樹“體積”過大 —— 類內(nèi)的差異不合理的擴(kuò)大,對(duì)聚類效果造成影響) (2) 進(jìn)行經(jīng)修改(詳情請(qǐng)閱讀“ BIRCH”)的層次聚類 105 (3) 由給定閾值(或初始類數(shù))的條件下,完成初始聚類。注意:一般來說,子類越多,二階段聚類越準(zhǔn)確,但同時(shí)對(duì)計(jì)算機(jī)硬件的要求越高,故應(yīng)合理確定初始類的數(shù)量。 (這里程序建議使用赤池或 schwarts準(zhǔn)則) 2)在給定閾值( pass)(也可根據(jù)其他標(biāo)準(zhǔn)確定類數(shù))的條件下,對(duì)初始類(如果在( 1)中采用了對(duì)異端值、類的處理,這里的初始類將不包括它們)進(jìn)行層次聚類 —— 類間距離將采用重心距離(程序默認(rèn))。 3)確定合理的類數(shù) .
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1