【正文】
能,不僅能獨(dú)立地來(lái)獲得數(shù)據(jù)分布情況,觀察每個(gè)族的特點(diǎn),集中對(duì)待定的某些族作出進(jìn)一步的分析,而且還是進(jìn)行其它數(shù)據(jù)分析 (如回歸、分類、網(wǎng)絡(luò)分析等 )的預(yù)處理過(guò)程 (Owen, A. B. (1999)).可以說(shuō),聚類分析不論在理論上,還是在應(yīng)用上正在蓬勃發(fā)展,有貢獻(xiàn)的研究領(lǐng)域包括數(shù)據(jù)挖掘 (Trespv, V. (2020))、統(tǒng)計(jì)學(xué) (Van Der Ark, L. A., Van Der Heijden, P. G. M. and Sikkel, D. (1999))、機(jī)器學(xué)習(xí) (Krieger, A. M. and Green, P. E. (1999))、空間數(shù)據(jù)庫(kù)技術(shù) (Nelson, D. E. (2020))、生物學(xué) (Segal, E. and Koller, D.)以及市場(chǎng)營(yíng)銷 ( Yun, C. H., Chuang, K. T. and Chen, M. S.)等 .由于數(shù)據(jù)庫(kù)中收集了大量的數(shù)據(jù),聚類分析的研究工作已經(jīng)涉及到大型數(shù)據(jù)庫(kù)的有效和實(shí)際的聚類分析尋找適當(dāng)?shù)姆椒ㄉ?.那么,聚類分析所針對(duì)的數(shù)據(jù)類型如何呢?這一問(wèn)題的明確,將會(huì)為聚類分析的方法研究澄清思路 . 2020/9/15 2020/9/15 167。 以信息源為標(biāo)準(zhǔn)的排序 167。2020/9/15 第五章 數(shù)據(jù)的排序及有向聚類分析 167。 引 言 數(shù)據(jù)排序在數(shù)據(jù)挖掘中顯得尤為重要,但往往被人們所忽視 .因?yàn)樵跀?shù)據(jù)量較少時(shí),對(duì)于排序看起來(lái)不是什么問(wèn)題,也無(wú)需專門去研究和討論 .然而,對(duì)于海量數(shù)據(jù)的分析,排序問(wèn)題就不是那么簡(jiǎn)單了 .可以想象利用 Web的有關(guān)資料,我們?nèi)绾螌⒕W(wǎng)絡(luò)廣告、街頭廣告、報(bào)刊廣告等對(duì)電視廣告的影響程度排序呢?又如,在大學(xué)生成長(zhǎng)和發(fā)展過(guò)程,因素 q1,q2,...,q25所起的作用大小又是如何呢? 這些問(wèn)題的解決不僅為進(jìn)一步的數(shù)據(jù)挖掘提供適合的數(shù)據(jù)形式,而且為數(shù)據(jù)分析過(guò)程中的算法改進(jìn)、提高精度、增強(qiáng)有效性奠定了理論基礎(chǔ) . 2020/9/15 數(shù)據(jù)排序必須要有 研究對(duì)象 ,即我們是對(duì)屬性項(xiàng)(變量 )進(jìn)行排序,還是對(duì)事務(wù)項(xiàng) (樣本 )進(jìn)行排序,這一點(diǎn)必須要明確 .研究對(duì)象要根據(jù)