【導(dǎo)讀】采用基于密度的算法。聚類就是一個(gè)區(qū)域,滿足該區(qū)域中。把數(shù)據(jù)空間分割成網(wǎng)格單元,將落到某個(gè)??梢灾付ㄒ粋€(gè)數(shù)值,當(dāng)某個(gè)單元。聚類也就定義為連。通的所有的稠密單元格的集合。,Ad}是n個(gè)域的集合,那么。×Ad就是一個(gè)d維空間,我們將A1,A2,…看成是S的維(屬性);算法的輸入是一個(gè)n維空間中的點(diǎn)集,設(shè)為V=. ,vm},其中vi={vi1,vi2,…通過(guò)一個(gè)輸入?yún)?shù)ξ,可以將空間S的每一維分成相同的ξ。,ud},其中ui=[li,hi)是一個(gè)前閉后開(kāi)區(qū)間;,vd}落入一個(gè)單元u=. ,ud}中,當(dāng)且僅當(dāng)對(duì)于每一個(gè)ui都有。u是綢密的,當(dāng)且僅當(dāng)selectivity>τ。對(duì)于S的任何子空間,例如子空間。×Atk,(k<d,并且當(dāng)i<j時(shí)有ti<tj成。兩個(gè)k維中的單元格u1,u2稱為連通的當(dāng)且僅。兩個(gè)單元格u1={rt1,rt2,…,rtk},u2={r’t1,r’t2,…,Atk-1),有rtj=r’tj成立(j=1,2,…并且對(duì)于第Atk維有htk=l’tk,或者h(yuǎn)’tk=ltk成立;區(qū)域是指一個(gè)每一邊都與坐標(biāo)軸平行的類矩。也就是說(shuō)這類區(qū)域是由單元格組成的且具有規(guī)則。的超集Rˊ也包含于C;一個(gè)聚類C的最小描述是上述最大區(qū)域(maximal