freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

chapter6群集分析(clusteranalysis)-全文預(yù)覽

2024-11-21 17:58 上一頁面

下一頁面
  

【正文】 端節(jié)點(diǎn)與非終端節(jié)點(diǎn)中的群集特徵,資訊將從從底端傳達(dá)到樹根 72 平衡式反覆化簡和分群法 * (7) ? BIRCH的運(yùn)作過程 ?輸入:一資料集合、非終端節(jié)點(diǎn)之分支係數(shù) B、終端節(jié)點(diǎn)之分支係數(shù) L 、門檻值 T ?輸出:以樹狀結(jié)構(gòu)所表示的群集關(guān)係 ?步驟 1:掃瞄資料集合中的資料點(diǎn),建立一可以放在記憶體中執(zhí)行之群集特徵樹。 ?步驟 3:利用 各群 集中所包含的 資料點(diǎn) , 重新計(jì)算各群集之群集中心點(diǎn) ?步驟 4:假如由步驟 3所得到 各群之群集中心 與 之前所計(jì)算之群集中心相同 ,則表示分群結(jié)果已穩(wěn)定並結(jié)束此處理程序並 輸出各群結(jié)果 ,否則回到步驟 2繼續(xù)執(zhí)行 23 k平均法 (3) ? k = 3 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( a ) ( b)( c ) ( d)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)24 k平均法 (4) 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( e ) ( f )25 k平均法 (5) ? k平均法在 概念與實(shí)作上相當(dāng)?shù)暮唵?,且在處理大量資料時(shí)相當(dāng)有擴(kuò)充性 (scalable) 且有效率 ,但是卻也存在一些 缺點(diǎn) ?無法處理類別性資料維度 ?容易受雜訊與偏移值影響其群集中心 ?起始群集中心選擇上的影響 ?群集數(shù)量決定上的困難 26 k平均法 (6) ? 無法處理類別性資料維度 ?由於 k平均值法以群集中的 質(zhì)量中心 當(dāng)作群集中心,對(duì)於類別性資料維度所描述之資料集合而言,並 無法求得群集的質(zhì)量中心 27 k平均法 (7) ? 容易受 雜訊 與 偏移值 影響其群集中心 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)偏移值( a ) ( b)( c ) ( d)28 k平均法 (8) ? 起始群集中心選擇上的影響 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( a ) ( b)29 k平均法 (9) ? 群集數(shù)量決定上的困難 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( a ) ( b)CiCj30 ? k平均法 (kmeans method) ? k物件法 (kmedoids method) ? 反覆自我組織分析技術(shù) (Iterative SelfOrganizing Data Analysis Technique, ISODATA) 31 k物件法 (1) ? k物件法的概念 ?改善 k平均法 因 質(zhì)量中心 所造成無法處理 類別性資料 和 容易受偏移值影響的問題 ?k物件法則使用位於 每一群中 最中心的資料點(diǎn) 當(dāng)作該群集中心 ?k物件法在運(yùn)作上與 k平均法相似, 最大的不同是 每回合最多只改變一個(gè)群集中心 ,且此變動(dòng)必頇是能使準(zhǔn)則函數(shù)值 E下降 ? 分割環(huán)繞物件法 (Partitioning Around Medoids, PAM) 32 k物件法 (2) ? 分割環(huán)繞物件法 (PAM)的運(yùn)作過程 ?輸入 :一資料集合以及使用者定義之群集數(shù)量 k ?輸出 : k個(gè)互不交集的群集 ?步驟 1:隨機(jī)從資料集合選擇 任 k個(gè)資料點(diǎn) 當(dāng)作 起始 k群的中心點(diǎn) ?步驟 2:利用 相似度計(jì)算公式 ,將資料點(diǎn)分別 歸屬到距其最近之群集中心 ,形成 k個(gè)群集 ?步驟 3:由資料集合中 任選一非群集中心之資料點(diǎn) ,並取代 任一選取之群集中心 ,並 計(jì)算距離總偏移值 E ?步驟 4:假如取代後所求得之 距離總偏移值 E下降 , 取代就成立 ,同時(shí)回到 步驟 2展開下一個(gè)群集中心取代的動(dòng)作 ?步驟 5:如果所有非群集中心之資料點(diǎn) 都無法取代已存在之群集中心 ,則結(jié)束此處理程序並 輸出各群結(jié)果 33 k物件法 (3) ? k = 3 年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)年齡與平均月收入散佈圖010203040500 10 20 30 40 50 60年齡平均月收入(千)( a ) ( b)( c )ijhijhijhijh( d)34 ? k平均法 (kmeans method) ? k物件法 (kmedoids method) ? 反覆自我組織分析技術(shù) (Iterative SelfOrganizing Data Analysis Technique, ISODATA) 35 (Iterative SelfOrganizing Data Analysis Technique (ISODATA)(1) ? ISODATA的概念 ?改善 k平均法 對(duì)於 起始群集中心 和 群集數(shù)量 這兩個(gè)問題 ?針對(duì) 初步分群後的結(jié)果 ,透過使用者所設(shè)定的 門檻值 ,再進(jìn)行 合併群集 或 分裂群集 的補(bǔ)救動(dòng)作 ?假如某一群集中的 資料點(diǎn)分佈過於分散 ,使得 群集變異值 (variance) 大於 使用者所設(shè)定的門檻值 ,則將對(duì)此群集進(jìn)行 分裂成兩個(gè)群集 的動(dòng)作 ?假如 兩個(gè)群集彼此相當(dāng)接近 ,使得兩群集之 群集中心
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1