【導(dǎo)讀】聚類分析是指事先不知樣本的類別,而利用樣本的先驗(yàn)知識(shí)來構(gòu)造分類。生物的進(jìn)化過程主要是通過染色體之間的交叉和變異來完成的,與此相對(duì)應(yīng),遺傳。作,從而得到新一代群體,其本質(zhì)是一種求解問題的高效并行全局搜索算法。算法以適應(yīng)度函數(shù)為依據(jù),通過對(duì)群體個(gè)體施加遺傳操作實(shí)現(xiàn)群體內(nèi)個(gè)體結(jié)構(gòu)重組。在這一過程中,群體個(gè)體一代代地優(yōu)化并逐漸逼近最優(yōu)解。鑒于遺傳算法的全。局優(yōu)化性,本文給出了一種基于遺傳算法的K均值聚類算法來克服K均值算法的局部性。K均值算法是一種使用最廣泛的聚類算法。使簇內(nèi)具有較高的相似度,而簇間相似度較低。距離重新對(duì)相應(yīng)的對(duì)象進(jìn)行劃分。于其聚類數(shù)目,因此采用基于聚類中心的浮點(diǎn)數(shù)編碼,將各個(gè)類別的中心編碼為染色體。為了獲得全局最優(yōu)解,初始群體完全隨機(jī)生成。體,賦予其相應(yīng)的交叉和變異概率,而對(duì)于適應(yīng)度小的個(gè)體,其交叉概率和變異概率較大,data的arff格式的文件數(shù)據(jù),數(shù)據(jù)集分別是iris,glass。