freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

chapter6群集分析clusteranalysis-文庫吧資料

2024-11-01 17:58本頁面
  

【正文】 為 N個點的平方和 ?群集特徵能充分完整地表示一個群集,因為不論是在決定資料點所歸屬的群集上或是在決定群集合併的順序 ? ?, SSLSNCF ?LS ??iSxx? ??iSxx2?69 平衡式反覆化簡和分群法 * (4) ? 群集特徵 ?會員 1=20, 20 與會員 2=21, 26 的距離在使用者設(shè)定之群集涵蓋範(fàn)圍內(nèi), BIRCH先將其形成一個子群集,則此子群集之群集特徵值將計算如下 ? = = 20+21, 20+26 = 41, 46 ? SS = = (202+202)+(212+262) = 800+1117 = 1917 ? CF = (2, 41, 46, 1917) LS ??iSxx?2ixSx??70 平衡式反覆化簡和分群法 * (5) ? 群集特徵樹 ?記錄子群集間的親疏遠(yuǎn)近的關(guān)係 ?每一非終端節(jié)點 (nonleaf node),記錄所有隸屬之子節(jié)點 (children) 的概括性資訊 ?每一終端節(jié)點 (leaf node),則記錄所隸屬之子群集之概括性資訊 ?一群集特徵樹包含三個參數(shù) ?非終端節(jié)點之分支係數(shù) (B):用以指定每個非終端節(jié)點所允許包含之最大子節(jié)點個數(shù) ?終端節(jié)點之分支係數(shù) (L):用以指定每個終端節(jié)點所允許包含之最大子群集個數(shù) ?子群集之門檻值 (T):指定子群集所允許之涵蓋範(fàn)圍,例如:群集半徑 71 平衡式反覆化簡和分群法 * (6) ? 群集特徵樹之建立 ?資料點加入時,透過類似拜訪 B+樹的方式,比對部分的非終端節(jié)點,決定資料點所歸屬之終端節(jié)點與子群集 ?當(dāng)資料點加入到位於終端節(jié)點的一子群集時,若造成該子群集的涵蓋範(fàn)圍超過 T,則產(chǎn)生一新的子群集,並將資料點加入此群集且計算此子群集特徵;否則,直接加入此資料點到子群集中,並更新該子群集之群集特徵 ?若因產(chǎn)生新的子群集,造成終端節(jié)點之子群集的數(shù)量超過所設(shè)定之 L,則該終端節(jié)點將分裂成兩個,並以相差最遠(yuǎn)之子群集當(dāng)作種子 (seed),然後將其他子群集分別歸屬其中;同理,非終端節(jié)點進(jìn)行分裂時,亦相同運作方式 ?底層子群集之群集特徵的改變,將影響上層終端節(jié)點與非終端節(jié)點中的群集特徵,資訊將從從底端傳達(dá)到樹根 72 平衡式反覆化簡和分群法 * (7) ? BIRCH的運作過程 ?輸入:一資料集合、非終端節(jié)點之分支係數(shù) B、終端節(jié)點之分支係數(shù) L 、門檻值 T ?輸出:以樹狀結(jié)構(gòu)所表示的群集關(guān)係 ?步驟 1:掃瞄資料集合中的資料點,建立一可以放在記憶體中執(zhí)行之群集特徵樹。重複執(zhí)行步驟 2,直到所有的資料點都?xì)w屬到同一群集或滿足使用者所設(shè)定之終止條件為止 45 階層式分群法 (5) 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( b) ( c )( a )46 階層式分群法 (6) 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( d) ( e )( f ) ( g )47 階層式分群法 (7) 會員 1 會員 2 會員 3 會員 4 會員 5 會員 6 會員 7會員 1 0 7 7 31 35 52 53會員 2 0 2 24 28 45 46會員 3 0 24 28 45 46會員 4 0 4 21 22會員 5 0 17 18會員 6 0 5會員 7 0會員 1 會員 2 會員 3 會員 4 會員 5 會員 6 會員 7回合三: t2=4回合二: t1=2回合四: t3=5回合五: t4=7回合六: t5=17回合七: t6=24回合一: t0=048 階層式分群法 (8) ? 傳統(tǒng)階層式分群法的不足 ?dmean、 dmax和 davg此三種群集相似度計算公式,可能產(chǎn)生以下分群結(jié)果 49 階層式分群法 (9) ? 傳統(tǒng)階層式分群法的不足 ?dmin此群集相似度計算公式,可能產(chǎn)生以下分群結(jié)果 50 階層式分群法 (10) ? 多代表點分群法 (CURE) ?相對於傳統(tǒng)階層式分群法透過單點考量 (例如: dmean) 或所有點考量 (例如: dmin)來決定是否合併群集,多代表點分群法選擇 用一定數(shù)量且分散得當(dāng)?shù)亩鄠€代表性的資料點來表示一個群集 ,並配合 dmin來衡量是否合併兩個群集 ?所選擇的代表性資料點可藉著事先定義好、介於 0和 1之間的收縮係數(shù) (shrinking factor),以群集中心為基點做適當(dāng)?shù)厥湛s (shrinking),以防止因為偏移值造成群集中心的偏移,達(dá)到充分表示整個群集的效果 ?兼容了單點考量與所有點考量的優(yōu)點 ,對偏移值的處理上也較不敏感 51 階層式分群法 (10) ? 多代表點分群法的運作過程 ?輸入:一資料集合、代表性資料點數(shù)量 c、收縮係數(shù) ?。 ?步驟 3:利用 各群 集中所包含的 資料點 , 重新計算各群集之群集中心點 ?步驟 4:假如由步驟 3所得到 各群之群集中心 與 之前所計算之群集中心相同 ,則表示分群結(jié)果已穩(wěn)定並結(jié)束此處理程序並 輸出各群結(jié)果 ,否則回到步驟 2繼續(xù)執(zhí)行 23 k平均法 (3) ? k = 3 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( a ) ( b)( c ) ( d)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)24 k平均法 (4) 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( e ) ( f )25 k平均法 (5) ? k平均法在 概念與實作上相當(dāng)?shù)暮唵?,且在處理大量資料時相當(dāng)有擴充性 (scalable) 且有效率 ,但是卻也存在一些 缺點 ?無法處理類別性資料
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1