【導讀】聚類作為一種知識發(fā)現(xiàn)的重要方法,它廣泛地與中文信息處理技術相結合,應用于網絡信息處理中以滿足用戶快捷地從互聯(lián)網獲得自己需要的信息資源。其目的是要使同一類別的文本間的相。似度盡可能大,而不同類別的文本間的相似度盡可能的小。整個聚類過程無需指。導,事先對數據結構未知,是一種典型的無監(jiān)督分類。型,相似度計算及常見聚類算法。本文主要研究的聚類主要方法是k-均值和SOM. 算法,介紹了兩種算法的基本思想和實現(xiàn)步驟,并分析兩種算法的聚類效果。時介紹了兩種算法的改進算法。師的指導下進行的研究工作及取得的成果。而使用過的材料。究所取得的研究成果。不包含任何其他個人或集體已經發(fā)表或撰寫的成果作品。究做出重要貢獻的個人和集體,均已在文中以明確方式標明。全意識到本聲明的法律后果由本人承擔。同意學校保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱。