【導讀】相似度的計算與測量。分群法在大型資料集合之設計。群集分析的概念與目的。將資料集合中的資料記錄,又稱為資料點,加。主要的目地是分析資料彼此間的相似程度,藉。在群集分析的過程中,並沒有預先指定好的類。群集分析在資料探勘過程中所扮演的角色。將原本大量的資料加以分群成數(shù)個群集,並從每一個群集中挑。推斷出所關(guān)注資料中可能存在的某些特性或現(xiàn)象。對推斷假設作有效性的驗證。試圖驗證“年輕人通常年收入較低,是否也代表其消費能力較。此假設性推斷時,可以對於“年齡”、“年收入”和。分群結(jié)果應用於未知分類之資料記錄,預測資料所歸屬的群集。線上購物網(wǎng)站的使用者族群與消費能力。幫助使用者自動化分析圖像資料庫所產(chǎn)生的影像資料,將文件加以分門別類,幫助文件資料的管理和使用。群集分析五個主要的循序工作項目。將每一資料點利用有限、一致的資料維度表示。不適切的資料維度將造成分群結(jié)果凌亂、難以從中。有些分群法相當容易受雜訊或偏移值的