freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

異常數(shù)據(jù)挖掘研究畢業(yè)論文正稿(參考版)

2025-06-25 07:13本頁(yè)面
  

【正文】 能干的人,不在情緒上計(jì)較,只在做事上認(rèn)真;無(wú)能的人!不在做事上認(rèn)真,只在情緒上計(jì)較。什么是奮斗?奮斗就是每天很難,可一年一年卻越來(lái)越容易。 2011年 5月. . . . .參考文獻(xiàn)[1] 李道國(guó),苗奪謙,張紅云. 粒度計(jì)算的理論,模型與方法[J]. 復(fù)旦學(xué)報(bào)(自然科學(xué)版),2004,43(5): 1~2.[2] Yao Y Y. Granular puting:Basic issues and possible solutions//the 5th Joint Conference on Information Jersey,USA. 2000, 108(11): 1149~1161.[3] . Liang, . Shi, . Li, Information entropy, rough entropy and knowledge granulation in inplete information systems[J], International Journal of General Systems (2009) 641654.[4] 毛國(guó)君,段立娟,王實(shí),石云.?dāng)?shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005, 108~124. [5] 苗奪謙,李道國(guó).粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008, 128~154. [6] 苗奪謙,王國(guó)胤,柳清,林早陽(yáng),姚一豫.粒計(jì)算:過(guò)去、現(xiàn)在與展望[M].北京:科學(xué)出版社,2007. [7] Miao D Q,Wang J. Informationbase algorithm for reduction of knowledge//IEEE International Conference on Intelligent Processing Systems. Beijing,China, 1998, 1149~1161.[8] 李道國(guó). 信息粒度計(jì)算模型及其在智能信息處理中的應(yīng)用研究[D].上海:同濟(jì)大學(xué),2006.[9] [M]. 西安:西安交通大學(xué)出版社,2001.[10] 王國(guó)胤,于洪,[N]. 計(jì)算機(jī)學(xué)報(bào),2010,21(5):300~376.[11] 史開(kāi)泉,崔玉泉.s一粗集與粗決策[M].北京:科學(xué)出版社,2006.[12] [J].復(fù)旦學(xué)報(bào)(自然科學(xué)版),2009,35(3):134~231.[13] 譚政仁. 基于Rough Set的海量數(shù)據(jù)挖掘算法研究[D].重慶:重慶郵電大學(xué),2004. [14] 梁吉業(yè),曲開(kāi)社,徐宗本.信息系統(tǒng)的屬性約簡(jiǎn)[J].系統(tǒng)工程理論與實(shí)踐,2001,21(12):76~80.[15] [M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2001,35(3):134~231.[16] 鄧蔚,黃海,王國(guó)胤,[J],武漢,中國(guó),2005:690~695.[17] [J].軟件學(xué)報(bào),1999,10(2):113~116.[18] Set理論及其在機(jī)器學(xué)習(xí)中的應(yīng)用研究[D].北京:中國(guó)科學(xué)院自動(dòng)化研究所,1997.[19] 張文修,梁怡,[M].北京:科學(xué)出版社,2003.[20] Wang J,Wang J. Reduction algorithms based on discernibility matrix: The order attributes method. Journal of Computer Science and Technology,2001,16(6):213~228.[21] 張鈸,[J].計(jì)算機(jī)科學(xué),2003,30(5):1~5.[22] Lin T Y. Granular puting. Announcement of the BISC Special Interest Group on Granular puting, 1997.[23] 苗奪謙. 粗糙集理論中知識(shí)粗糙集性與信息熵關(guān)系的討論[M].北京:清華大學(xué)出版社,2006.[24] 安久江,甘全,王國(guó)胤,[J].計(jì)算機(jī)科學(xué),2009,32(8A):137~140.[25] 王珍,余昭平,一種基于粗糙集的最小約簡(jiǎn)算法叨[J].微計(jì)算機(jī)信息,2006,42(2):218~219.[26] 陸汝鈐.知識(shí)科學(xué)與計(jì)算科學(xué)[M].北京:清華大學(xué)出版社,2003.[27] 頓毅杰,張小峰,孫吳,趙麗.一種基于粒度的規(guī)則挖掘方法[J].蘭州理工大學(xué)學(xué)報(bào),2006(2):105~108.[28] 張宏宇,梁吉業(yè).不完備信息系統(tǒng)下的變精度粗糙集模型及其知識(shí)約簡(jiǎn)算法[J].計(jì)算機(jī)科學(xué),2003,30(4):153~155.[29] 傅明,陳曦,劉翌南.基于信息顆粒的粗糙集約簡(jiǎn)研究[J].長(zhǎng)沙理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2004(6):80~85.[30] 彭玉樓,陳曦.基于粗糙信息顆粒的數(shù)據(jù)挖掘方法研究[J].湖南科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2004(12):67~69.[31] 卞東波,白碩,李國(guó)杰.聚類(lèi)/分類(lèi)中的粒度原理[J].計(jì)算機(jī)學(xué)報(bào),2002,25(8):8lO~815.[32] 李鈍,梁吉業(yè).利用聚類(lèi)和粗糙集迸行文本分類(lèi)研究[D].計(jì)算機(jī)工程與應(yīng)用,2003,39(7):186~188.[33] 鄧蔚,王國(guó)胤,吳渝.粒計(jì)算綜述[J].計(jì)算機(jī)科學(xué),2004(31),10A:178~181.寧可累死在路上,也不能閑死在家里!寧可去碰壁,也不能面壁。. . . . .致 謝我要誠(chéng)摯的感謝我的導(dǎo)師陳玉明老師,在這近半年的企業(yè)實(shí)習(xí)與畢業(yè)設(shè)計(jì)期間,都得到了陳玉明老師的悉心指導(dǎo),在程序的設(shè)計(jì)與論文的寫(xiě)作過(guò)程中,多次得到他的教導(dǎo),并且為我的設(shè)計(jì)與論文提供了許多寶貴的修改意見(jiàn)。所以在今后的工作中,為了完善基于KG異常檢測(cè)算法,我們應(yīng)當(dāng)考慮利用粗糙就特征選擇方法,以減少其特征的同時(shí)還保留它的性能。 進(jìn)一步工作的方向雖然目前對(duì)粒計(jì)算在數(shù)據(jù)挖掘中的研究還相對(duì)較少,但隨著粒計(jì)算理論本身的不斷完善和發(fā)展及它與其他粒計(jì)算方法的互相結(jié)合,它將在數(shù)據(jù)挖掘中得到廣泛的應(yīng)用。此外,我們給出了基于KG檢測(cè)異常點(diǎn)的算法。為了處理異常檢測(cè)的不確定性信息,我們對(duì)傳統(tǒng)距離度量根據(jù)知識(shí)粒度進(jìn)行了新的定義。而基于粗糙集理論的數(shù)據(jù)挖掘是把知識(shí)看作是論域的劃分,從而認(rèn)為知識(shí)是有粒度的,它是以代數(shù)的觀點(diǎn)描述知識(shí)粒度的,因而稱其為粗糙集理論的代數(shù)表示。隨著數(shù)據(jù)挖掘理論研究的不斷深入,數(shù)據(jù)挖掘的工程應(yīng)用領(lǐng)域?qū)?huì)更加廣泛。所以該算法的檢測(cè)性能達(dá)到了我們的預(yù)期效果。接下來(lái)我們通過(guò)對(duì)多組信息系統(tǒng)進(jìn)行異常挖掘來(lái)記錄我們算法的錯(cuò)誤率,以方便我們對(duì)該算法的理解。 漏檢和誤檢由于數(shù)據(jù)源、實(shí)驗(yàn)條件等各種因素的限制,檢測(cè)不可能達(dá)到無(wú)限精確,檢測(cè)的結(jié)果可能與現(xiàn)實(shí)情況存在誤差。因?yàn)镵OD算法在比例達(dá)到7%就可以找出所有罕見(jiàn)類(lèi),但其他兩種算法要到9%和12%。KNN甚至要到檢測(cè)前面12個(gè)對(duì)象后才把所有的6個(gè)異常點(diǎn)檢測(cè)出來(lái)。表 淋巴數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對(duì)象數(shù)KODKNNDIS7(%)6(100%)5(83%)5(83%)9(%)6(100%)5(83%)6(100%)12(%)6(100%)6(100%)6(100%)。在我們的實(shí)驗(yàn)中,淋巴數(shù)據(jù)集被輸入一個(gè)信息表IS= (U,A),其中U包含所有483個(gè)淋巴數(shù)據(jù)集實(shí)例,A包含9個(gè)淋巴屬性數(shù)據(jù)集(不包括類(lèi)屬性)。我們對(duì)淋巴數(shù)據(jù)集進(jìn)行信息系統(tǒng)化處理,我們通過(guò)對(duì)該信息系統(tǒng)進(jìn)行分批檢測(cè),先檢測(cè)前面的7個(gè)對(duì)象內(nèi)的異常點(diǎn)個(gè)數(shù),在按順序分別對(duì)前面的9個(gè),12個(gè)對(duì)象進(jìn)行檢測(cè),得出它們的異常點(diǎn)。 淋巴數(shù)據(jù)的檢測(cè)首先,我們可以在UCI機(jī)器學(xué)習(xí)庫(kù)中找到淋巴數(shù)據(jù)集。大部分異常點(diǎn)還是能被準(zhǔn)確檢測(cè)出來(lái)。 誤檢雖然會(huì)出現(xiàn)誤檢,但由于我們的數(shù)據(jù)挖掘?qū)ο笠话闱闆r是一組大數(shù)據(jù)集。只要在閥值框中輸入閥值,我們就可以很方便獲得自己所需要的含有異常的對(duì)象。 我們可以看出排在較前面的對(duì)象它們的決策值都為2,也就是我們所說(shuō)的異常點(diǎn),它沒(méi)有出現(xiàn)漏檢情況。 程序初始界面我們將獲得的數(shù)據(jù)集按照特定的格式輸入文本文檔中,然后再導(dǎo)入程序中。For 每個(gè){根據(jù)給定的a屬性在Va域中的序列對(duì)所有U中的對(duì)象進(jìn)行排序;確定分區(qū)U/IND({a});計(jì)算IND(a)的知識(shí)粒度KG({a});}確定A的屬性序列S={a`1, a`2, …, a`m},其中1=jm, KG({a`j})=KG({a`j+1});構(gòu)建序列S的屬性子集遞減序列AS={A1, A2, …, Am};For 1=j=m{ 根據(jù)給定的Aj屬性在VAj域中的序列對(duì)所有U中的對(duì)象進(jìn)行排序;確定分區(qū) U/IND(Aj);計(jì)算IND(Aj)的知識(shí)粒度KG(Aj);}For every x∈U{For 1=j=m {分別得計(jì)算出IND(aj) 和IND(Aj)下x的相對(duì)知識(shí)粒度RG{aj}(x)和RGAj(x); 對(duì)x賦權(quán)值W{aj}(x) ;對(duì)x賦權(quán)值WAj(x);}計(jì)算 KOF(x);對(duì)KOF進(jìn)行排序;If( KOF(x)V){就選擇}}返回 K。其中A={a1, a2, …, am},|U|=n 和 |A|=m, 閥值為v。在流程圖的基礎(chǔ)上,我們進(jìn)行了程序的編寫(xiě)。至此,我們可以很清楚的看出a4大于閥值,所以a4就是在信息系統(tǒng)IS中基于知識(shí)粒度的異常點(diǎn),而其它對(duì)象則不是異常點(diǎn)。類(lèi)似的,我們可以得到當(dāng)依次移除對(duì)象a,則我們可得到知識(shí)粒度則我們可以得到它相對(duì)知識(shí)粒度計(jì)算權(quán)重 和 如下因此,知識(shí)造粒a1異常因子的計(jì)算方法如下KOF(a1)=≈<V因此,在信息系統(tǒng)IS中a1不是一個(gè)基于知識(shí)粒度的異常點(diǎn)。根據(jù)知識(shí)粒度的大小,屬性序列是S=c1,c3,c2。 基于知識(shí)粒度異常點(diǎn)的例子給出一個(gè)信息系統(tǒng)IS=(U,C,V),其中U={a1,a2,a3,a4,a5,a6},C={C1,C2,C3},設(shè)閥值V=。設(shè)IS=(U, A)是一個(gè)信息系統(tǒng),V是一個(gè)給定的閾值。在IS中的對(duì)象x的知識(shí)粒度因子(KOF):()其中 和 是對(duì)象x的相對(duì)知識(shí)粒度,其中屬性子集Aj∈AS,屬性子集{aj}屬于A,1=j=k。在本文中,類(lèi)似Breunig的方法,我們確定一個(gè)知識(shí)粒度的異常因子(KOF),它可以顯示出信息系統(tǒng)中每個(gè)對(duì)象的領(lǐng)域的outlierness程度。因此,Breunig提出了一種基于密度的局部異常點(diǎn)檢測(cè)方法(Breunig,2000)。在現(xiàn)實(shí)生活中,它并不是那么簡(jiǎn)單的。此外,根據(jù)知識(shí)粒度我們可以唯一確定一個(gè)屬性序列和一個(gè)屬性子集的降序序列。從上面的定義,我們可以看出在AS= A1,,A2,…,Ak 中,1≤j<k,Aj+1是從A j刪除元素a`j后從A j改變的屬性子集。設(shè)一個(gè)信息系統(tǒng)IS=(U, A),其中A={ a1,,a2,…,ak },設(shè)S= a`1,a`2,…,a`k 是上面定義的屬性序列,給出屬性子集序列AS= A1,,A2,…,Ak ,其中A1,,A2,…,Ak A。我們對(duì)A的屬性構(gòu)造了一個(gè)序列S=a`1,a`2,…,a`k,其中1≤j<k,且KG({a`j })≥KG({a`j+1}),其中KG({a` j })是屬性A中每個(gè)子集{a’ j }的IND({a`j })的知識(shí)粒度。下面,我們構(gòu)造了兩種基于知識(shí)粒度的序列,分別是屬性序列和屬性子集序列。不確定可以被視為是一種不正常的屬性。X的相對(duì)知識(shí)粒度RGB(x)越高,則X的不確定性越高。反之,如果IND(B)的知識(shí)粒度變化不大,則我們就可以認(rèn)為在IND(B)下對(duì)象X的不確定性較低的。在IND(
點(diǎn)擊復(fù)制文檔內(nèi)容
語(yǔ)文相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1