【導(dǎo)讀】相似度的計(jì)算與測(cè)量。分群法在大型資料集合之設(shè)計(jì)。群集分析的概念與目的。將資料集合中的資料記錄,又稱為資料點(diǎn),加。主要的目地是分析資料彼此間的相似程度,藉。在群集分析的過程中,並沒有預(yù)先指定好的類。群集分析在資料探勘過程中所扮演的角色。將原本大量的資料加以分群成數(shù)個(gè)群集,並從每一個(gè)群集中挑。推斷出所關(guān)注資料中可能存在的某些特性或現(xiàn)象。對(duì)推斷假設(shè)作有效性的驗(yàn)證。試圖驗(yàn)證“年輕人通常年收入較低,是否也代表其消費(fèi)能力較。此假設(shè)性推斷時(shí),可以對(duì)於“年齡”、“年收入”和。分群結(jié)果應(yīng)用於未知分類之資料記錄,預(yù)測(cè)資料所歸屬的群集。線上購物網(wǎng)站的使用者族群與消費(fèi)能力。幫助使用者自動(dòng)化分析圖像資料庫所產(chǎn)生的影像資料,將文件加以分門別類,幫助文件資料的管理和使用。群集分析五個(gè)主要的循序工作項(xiàng)目。將每一資料點(diǎn)利用有限、一致的資料維度表示。不適切的資料維度將造成分群結(jié)果凌亂、難以從中。有些分群法相當(dāng)容易受雜訊或偏移值的