【正文】
f 0,and ∈[0,1] with Until 實(shí)驗(yàn)采用著名的iris數(shù)據(jù)集對(duì)算法進(jìn)行測(cè)試實(shí)現(xiàn),其中樣本總數(shù)m=150,樣本屬性數(shù)n=4,設(shè)定的劃分內(nèi)別k=3。因此,我們要么用另外的快速算法確定初始聚類中心,要么每次用不同的初始聚類中心啟動(dòng)該算法,多次運(yùn)行FCM。由于不能確保FCM收斂于一個(gè)最優(yōu)解。返回步驟2。如果它小于某個(gè)確定的閥值,或它相對(duì)上次價(jià)值函數(shù)值的改變量小于某個(gè)閥值,則算法停止。在批處理方式運(yùn)行時(shí),F(xiàn)CM用下列步驟確定聚類中心ci和隸屬矩陣U[1]:步驟1:用值在0,1間的隨機(jī)數(shù)初始化隸屬矩陣U,使其滿足式()中的約束條件步驟2:用式()計(jì)算c個(gè)聚類中心ci,i=1,…,c。 構(gòu)造如下新的目標(biāo)函數(shù),可求得使()式達(dá)到最小值的必要條件: ()這里lj,j=1到n,是()式的n個(gè)約束式的拉格朗日乘子。與引入模糊劃分相適應(yīng),隸屬矩陣U允許有取值在0,1間的元素。FCM把n個(gè)向量xi(i=1,2,…,n)分為c個(gè)模糊組,并求每組的聚類中心,使得非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。3 模糊c均值(FCM)聚類算法 算法描述模糊c均值聚類算法的步驟還是比較簡(jiǎn)單的,模糊c均值聚類(FCM),即眾所周知的模糊ISODATA,是用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度的一種聚類算法。 2)分類數(shù)給定,尋找出對(duì)事物的最佳分析方案,此類方法是基于目標(biāo)函數(shù)聚類的,稱為模c均值聚類。硬聚類可以看成是模糊聚類方法的一個(gè)特例。在模糊聚類算法中,定義了向量與聚類之間的近鄰函數(shù),并且聚類中向量的隸屬度由隸屬函數(shù)集合提供。2 模糊聚類算法 模糊聚類算法概述模糊聚類算法是一種基于函數(shù)最優(yōu)方法的聚類算法,使用微積分計(jì)算技術(shù)求最優(yōu)代價(jià)函數(shù)??缮炜s性,能夠處理不同類型屬性,強(qiáng)抗噪性,高維性,對(duì)輸入順序不敏感性,可解釋性和可用性等。數(shù)據(jù)挖掘中的聚類分析主要集中在針對(duì)海量數(shù)據(jù)的有一效和實(shí)用的聚類方法研究,聚類方法的可伸縮性,高維聚類分析,分類屬性數(shù)據(jù)聚類和具有混合屬性數(shù)據(jù)的聚類,非距離模糊聚類等。在眾多的模糊聚類算法中,模糊c均值聚類算法(FCM)應(yīng)用最為廣泛。它把一個(gè)沒(méi)有類別標(biāo)記的樣本集按某種準(zhǔn)則劃分為若干個(gè)子集(類) ,使相似的樣本盡可能的歸為一類,而將不相似的樣