【導(dǎo)讀】物以類聚、人以群分;如要想把中國的縣分類,就有多種方法。土地、日照、濕度等,也可考慮收入、教育水準、醫(yī)療條件、基。既可以用某一項來分類,也可以同時考慮。多項指標來分類。于對數(shù)據(jù)中的行分類)。當(dāng)然,不一定事先假定有多少類,完。本章要介紹的分類的方法稱為聚類分。它們在數(shù)學(xué)上是無區(qū)別的。16種飲料的熱量、咖啡因、鈉及價格四種變量。如果想要對100個學(xué)生進行分類,線上形成100個點。接近的點放到一類。如果還知道他們的物理成績,這樣。三維或者更高維的情況也是類似;這就是四維空間點的問題。按照遠近程度來聚類需要明確兩。離,一個是類和類之間的距離。點間距離有很多定義方式。單的是歐氏距離。當(dāng)然還有一些和距離相反但起同。樣作用的概念,比如相似性等,由一個點組成的類是最基本的類;如。軟件的選項實現(xiàn)的。當(dāng)變量的測量值相差懸殊時,要先進行標準化.如R為極差,如此疊代下去,直到達到停止疊代的。這樣就可以得到最后的三類的中心以及每