freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于web的文本分類(lèi)挖掘的研究學(xué)士學(xué)位論文-資料下載頁(yè)

2025-06-27 18:45本頁(yè)面
  

【正文】 圖51 分類(lèi)結(jié)果條形圖由表51和圖51可以看出,此分類(lèi)器對(duì)體育類(lèi)文本分類(lèi)效果最好,分類(lèi)準(zhǔn)確率和查全率分別高達(dá)100%%。對(duì)于軍事類(lèi)文本分類(lèi)效果最差,其準(zhǔn)確率為80。732%,%。經(jīng)濟(jì)和藝術(shù)分類(lèi)準(zhǔn)確率和查全率也比較高,%。這說(shuō)明,體育、經(jīng)濟(jì)和藝術(shù)訓(xùn)練文本選擇比較合理。由于時(shí)間和開(kāi)發(fā)人員限制,本系統(tǒng)目前僅對(duì)于體育、經(jīng)濟(jì)和藝術(shù)方面的文本具有較好的分類(lèi)效果。此系統(tǒng)不足之處是不能處理兼類(lèi),即一個(gè)文本屬于多個(gè)類(lèi)別的情況。一個(gè)解決的方法是借鑒詞頻統(tǒng)計(jì)的方法,不直接采用“屬于”或者“不屬于”這兩個(gè)判斷的尺度,而采用文本屬于某個(gè)類(lèi)別的概率。這樣“屬于” 和“不屬于”分別是概率為100%和0%的特殊情況第六章 總結(jié)與展望 全文總結(jié) 本文講述了采用文本挖掘技術(shù)來(lái)對(duì)有訓(xùn)練樣本的中文文本進(jìn)行分類(lèi)的系統(tǒng),設(shè)計(jì)和實(shí)現(xiàn)了基于支持向量機(jī)的中文文本挖掘系統(tǒng)。中文文本分類(lèi)技術(shù)作為文本數(shù)據(jù)整理和數(shù)據(jù)組織的重要手段,主要研究如何自動(dòng)根據(jù)文本特征,把待分類(lèi)的文本歸于預(yù)定義類(lèi)別,是語(yǔ)料庫(kù)建設(shè)、信息檢索和信息過(guò)濾等技術(shù)研究的基礎(chǔ),在互聯(lián)網(wǎng)、電子出版業(yè)、電子圖書(shū)館、電子郵分檢,網(wǎng)絡(luò)安全等方面都有十分廣泛的應(yīng)用。本文介紹了文本自動(dòng)分類(lèi)的究意義、定義和技術(shù)發(fā)展,討論了中文文本自動(dòng)分類(lèi)的技術(shù)基礎(chǔ)和關(guān)鍵技術(shù),在理論上研究了文本分類(lèi)為什么采用支持向量機(jī)方法,并詳細(xì)地介紹基于支持向量機(jī)的中文文本分類(lèi)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)?;谥С窒蛄繖C(jī)的中文文本分類(lèi)系統(tǒng)是筆者負(fù)責(zé)設(shè)計(jì)和開(kāi)發(fā)的中文文本試驗(yàn)系統(tǒng),該系統(tǒng)設(shè)計(jì)目標(biāo)是為了探索和研究實(shí)現(xiàn)文本自動(dòng)分類(lèi)的新技術(shù),并要求改善系統(tǒng)分類(lèi)的性能:提高查全率和查準(zhǔn)率。本文主要的研究?jī)?nèi)容如下:1) 論文第一章介紹了文本分類(lèi)的背景和研究意義。2) 論文第二章介紹了文本分類(lèi)的幾種主要技術(shù)。3) 論文第三章介紹了文本分類(lèi)技術(shù)中的一個(gè)重要方法:支持向量機(jī)(SVM),包括其背景和原理。4) 論文第四章介紹了文本分類(lèi)系統(tǒng)的具體實(shí)現(xiàn)方案。5) 論文第五章以試驗(yàn)的形式證明了本系統(tǒng)的分類(lèi)查準(zhǔn)率和查全率都較高?!∵M(jìn)一步工作及展望上一章的試驗(yàn)結(jié)果充分表明,基于支持向量機(jī)的中文文本自動(dòng)分類(lèi)系統(tǒng)具有相當(dāng)?shù)陌l(fā)展前景,但算法目前還存在一些不足,離實(shí)用化和商業(yè)化還具有一定的距離,下一步工作可以在嘗試多種文本分類(lèi)算法和分類(lèi)類(lèi)別上進(jìn)行,進(jìn)一步提高中文文本分類(lèi)的準(zhǔn)確度和速度,研究通用化商品化的中文文本分類(lèi)器,為中文信息管理提供策略支持。附錄(附圖)附表置信風(fēng)險(xiǎn)經(jīng)驗(yàn)風(fēng)險(xiǎn)真實(shí)風(fēng)險(xiǎn)的界     S3            ?。樱病               ? S2S1風(fēng)險(xiǎn)h欠學(xué)習(xí)過(guò)學(xué)習(xí)函數(shù)集子集:S1S2S3VC維:h1≤h2≤h3圖31結(jié)構(gòu)風(fēng)險(xiǎn)最小化示意圖margin圖32 特征空間中的最優(yōu)分割平面訓(xùn)練文本集分詞處理器向量及其權(quán)重計(jì)算規(guī)范化文本特征向量分類(lèi)器分詞處理器規(guī)范化文本特征向量向量及其權(quán)重計(jì)算測(cè)試文本集詞典詞典分類(lèi)結(jié)果訓(xùn)練模塊分類(lèi)模塊圖41 基于支持向量機(jī)的文本分類(lèi)系統(tǒng)表51分類(lèi)結(jié)果類(lèi)別C屬于C類(lèi)的總的測(cè)試文檔數(shù)被判為C類(lèi)的文檔數(shù)屬于C類(lèi)的測(cè)試文檔中被正確分類(lèi)的文檔數(shù)查全率準(zhǔn)確率交通716868%100%計(jì)算機(jī)666664%%環(huán)境676160%%教育737169%%經(jīng)濟(jì)108107105%%軍事837767%%體育149153149100%%醫(yī)藥686766%%藝術(shù)828381%%政治167181161%%統(tǒng)計(jì)報(bào)告934934890%% 圖51 分類(lèi)結(jié)果條形圖參考文獻(xiàn)1. 黃解軍,潘和平等 《數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究》 計(jì)算機(jī)工程與應(yīng)用 2003 2. . Hearst. Untangling text data mining. In Proceedings of ACL39。99. the37th Annual Meeting of the Association for Computational Linguistics,1999.3. 關(guān)毅.《基于統(tǒng)計(jì)的漢語(yǔ)語(yǔ)言模型研究》.博士學(xué)位論文,4. Yiming Yang. An evaluation of statistical approaches to text of Information Retrieval, Vol 1, No. 112. 1999:67885. 5. Mitchell T. Machine Learning. McGraw Hill. 19966. S. Cost and S. Saizberg. A Weighted Nearest Neighbor Algorithm for Learning with Symbolic Features. Machine : 57787. Quinlan . Introduction of Decision Tree. Machine :30328. Yang Expert net work. effective and efficient learning from humandecisions in text categorization and retrieval. In Proceedings of he Fourth Annual Symposium on document Analysis and Information Retrival(SIGIR39。94),1994:13229. 邵棟,周志華,陳兆乾.《模糊神經(jīng)網(wǎng)絡(luò)研究》.計(jì)算機(jī)應(yīng)用研究,1999, 16 10. Breiman L. Bias. Variance, and Arcing Classifiers. Department of Statistics, University of California at Berkeley. 199611. 高潔,吉根林.《文本分類(lèi)技術(shù)研究》計(jì)算機(jī)應(yīng)用研究,2004,312. 秦進(jìn),陳笑蓉 等 《文本分類(lèi)中的特征抽取》 計(jì)算機(jī)應(yīng)用 2003 13. Andrew McCallum and Kamal Nigam: 《A parison of event models for naive bayes text categorization》, AAAI98 Workshop on Learning for Text Categorization, 199814. 李靜梅,孫麗華,張巧榮,張春生 《一種文本處理中的樸素貝葉斯分類(lèi)器 哈爾濱工程大學(xué)學(xué)報(bào)》 15. 李楊,曾海泉,劉慶華,胡運(yùn)發(fā) 《基于knn的快速web文檔分類(lèi)》 小型微型計(jì)算機(jī)系統(tǒng) 2004,417. Filip Mulier. 《VapnikChervonenkis(VC) Learning Theory and Its Applications》. IEEE Trans. on Neural Networks. 1999,5.18. 蕭嶸.《基于支持向量機(jī)的模式識(shí)別技術(shù)中若干問(wèn)題的研究》.[學(xué)位論文],南京大學(xué),2002。19. C. J. .《A tutorial on support vector machines for patern recognition》. Data Mining and Knowledge Discovery, 1998,2。. Vapnik著,張學(xué)工譯。統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)。北京:清華大學(xué)出版社,1999致 謝 本文是在我的導(dǎo)師劉麗珍老師的悉心指導(dǎo)下完成的,導(dǎo)師提出了深思熟慮的建議,提高了本文的整體質(zhì)量。導(dǎo)師在學(xué)習(xí)、工作和生活上給予了作者許多關(guān)心和幫助,使本文得以順利完成,至此謹(jǐn)向我的導(dǎo)師表示深深的敬意和由衷的感謝! 在課題研究期間,得到同學(xué)呂燕、徐穎的大力支持和幫助,使我在理論知識(shí)、工作能力等方面得到很大的提高,在此向他們表示由衷的感謝。 最后,非常重要的是,我要感謝我的父母,在我的成長(zhǎng)過(guò)程中,他們給了我無(wú)私的愛(ài)和永遠(yuǎn)的支持與鼓勵(lì),在此向他們表示衷心的感謝!第 28 頁(yè) 共 28
點(diǎn)擊復(fù)制文檔內(nèi)容
化學(xué)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1