【導(dǎo)讀】聚類分析是指事先不知樣本的類別,而利用樣本的先驗知識來構(gòu)造分類。生物的進(jìn)化過程主要是通過染色體之間的交叉和變異來完成的,與此相對應(yīng),遺傳。作,從而得到新一代群體,其本質(zhì)是一種求解問題的高效并行全局搜索算法。算法以適應(yīng)度函數(shù)為依據(jù),通過對群體個體施加遺傳操作實現(xiàn)群體內(nèi)個體結(jié)構(gòu)重組。在這一過程中,群體個體一代代地優(yōu)化并逐漸逼近最優(yōu)解。鑒于遺傳算法的全。局優(yōu)化性,本文給出了一種基于遺傳算法的K均值聚類算法來克服K均值算法的局部性。K均值算法是一種使用最廣泛的聚類算法。使簇內(nèi)具有較高的相似度,而簇間相似度較低。距離重新對相應(yīng)的對象進(jìn)行劃分。于其聚類數(shù)目,因此采用基于聚類中心的浮點數(shù)編碼,將各個類別的中心編碼為染色體。為了獲得全局最優(yōu)解,初始群體完全隨機生成。體,賦予其相應(yīng)的交叉和變異概率,而對于適應(yīng)度小的個體,其交叉概率和變異概率較大,data的arff格式的文件數(shù)據(jù),數(shù)據(jù)集分別是iris,glass。