【導(dǎo)讀】往往隱含了大量的不易被人們察覺的寶貴信息,為了得到這些信息,人們想盡了一切辦法。術(shù)就是在這種狀況下應(yīng)運而生了。而聚類知識發(fā)現(xiàn)是數(shù)據(jù)挖掘中的一項重要的內(nèi)容。在日常生活、生產(chǎn)和科研工作中,經(jīng)常要對被研究的對象經(jīng)行分類。聚類就是將數(shù)據(jù)對象分組成多個簇,同一個簇中的對象之間具有較高的。相似性,而不同簇中的對象具有較大的差異性。不敏感;由它發(fā)現(xiàn)的族與測試數(shù)據(jù)的輸入順序無關(guān);能夠處理不同類型的數(shù)據(jù)點。PAM算法最早由Kaufman和Rousseevw提出,Medoid的意思就是位于中心位置的對象。PAM算法的目的是對n個數(shù)據(jù)對象給出k個劃分。來度量聚類效果,其中成員總是被分配到離自身最近的簇中,以此來提高聚類的質(zhì)量。CLARA先抽取數(shù)據(jù)集合的多個樣本,然后用PAM方法在抽取的樣本中尋找最佳的k個中心點,返回最。CLARA的聚類質(zhì)量和可伸縮性進(jìn)行了改進(jìn)。法描述,使用matlab軟件編寫PAM聚類算法代碼,實現(xiàn)PAM聚類算法。后的結(jié)果作為進(jìn)一步進(jìn)行分析的基礎(chǔ)。