freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

異常數(shù)據(jù)挖掘研究畢業(yè)論文正稿(文件)

 

【正文】 所組成的最小的集合。 粗糙集理論的優(yōu)點(diǎn)粗糙集方法的簡(jiǎn)單實(shí)用性是令人驚奇的,它能在創(chuàng)立后的不長(zhǎng)時(shí)間內(nèi)得到迅速應(yīng)用是因?yàn)榫哂幸韵绿攸c(diǎn):(1) 粗糙集是以分類為主并以不可分辨關(guān)系為基礎(chǔ),而模糊集則是基于元素對(duì)集合的隸屬程度大小,強(qiáng)調(diào)集合自己本身的含混性。處理不確定信息的常用方法是概率統(tǒng)計(jì)和模糊集方法,但這些方法都是要先了解數(shù)據(jù)信息或知識(shí)等,如概率分布和模糊隸屬函數(shù)等,其實(shí)這些數(shù)據(jù)并不是那么容易可以獲得的。而本文則主要是使用到屬性約簡(jiǎn)。: () 屬性約簡(jiǎn)在IS系統(tǒng)(U,A)中,屬性集合A中的子屬性都是對(duì)U有一定的分類能力,但是A(或它的子集BA)的分類能力可能與它的子集相同,也就是說(shuō)A中可能有些屬性是冗余的。(3) 如果B`B是獨(dú)立的,且ind(B`)=ind(B),則稱B`為B的一個(gè)約簡(jiǎn)。()式中,red(B)是B的所有約簡(jiǎn)族。(5) 如果屬性a∈B滿足POSB(d)=POS(B{a})(d),則稱屬性a∈B在B中是d可約去的;否則稱a∈B在B中是d不可約去的。如果ind(d)=ind(B),那么相對(duì)約簡(jiǎn)就退化為前面的普通約簡(jiǎn)了,所以我們下面只在決策系統(tǒng)中討論相對(duì)約簡(jiǎn)。 信息熵信息熵(Information Entropy)[20]是在數(shù)學(xué)上非常抽象的一個(gè)概念,在這里不妨把信息熵看成一種特定信息的出現(xiàn)概率也可以理解為離散隨機(jī)事件的出現(xiàn)概率。而信息的產(chǎn)生,則是為引入負(fù)熵的一個(gè)過程。 知識(shí)粒度 基于粗糙集理論的知識(shí)粒度表示粗糙集理論把知識(shí)看作是對(duì)論域的劃分,從而使知識(shí)具有了顆粒性。與其他的方法(如模糊集方法、統(tǒng)計(jì)方法)相比,粗糙集方法都是以顆粒狀的知識(shí)為主要特征來(lái)進(jìn)行知識(shí)的處理,嘗試從數(shù)據(jù)的結(jié)構(gòu)下手,挖掘更多對(duì)我們有用的知識(shí)。(1) 設(shè)U是有限非空集,稱之為論域。則稱A為U的劃分。因此[u]R其實(shí)就是指智能體對(duì)u∈U的認(rèn)知程度,而智能體只能辨別和表現(xiàn)不同顆粒狀的等價(jià)類。對(duì)于任意PR,由P產(chǎn)生的等價(jià)關(guān)系記為IND(P),根據(jù) ,它表達(dá)了智能體所能達(dá)到的最高認(rèn)知程度是通過識(shí)庫(kù)中的一部分知識(shí)P,而IND(R)表示為知識(shí)庫(kù)K=(U,R)的最高分辨、認(rèn)知程度。知識(shí)R的粒度為它的辨別能力,對(duì)任意u,v∈U,當(dāng)(u,v)∈R時(shí),表明對(duì)象u、v在R等價(jià),屬于R的同一個(gè)不可區(qū)分類;否則,它們可區(qū)分,屬于不同的R不可區(qū)分類。(6) 知識(shí)R的分辨度Dis(R):()設(shè)B=(U,R)為知識(shí)庫(kù),P,QR是B中的知識(shí),當(dāng)且僅當(dāng)IND(P)IND(Q)時(shí),稱知識(shí)Q完全依賴于知識(shí)P,記住PQ,當(dāng)且僅當(dāng)PQ且QP稱知識(shí)P和Q等價(jià),記作PQ。證明 (1) 由PQ知,IND(P)IND(Q),則|IND(P)|≤|IND(Q)|??梢匀菀椎贸觯篟1<R2<R3。粗糙集方法在AI與科學(xué)認(rèn)知是極為重要的,特別是在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等領(lǐng)域。在下面的部分,我們首先給出一些關(guān)于基于知識(shí)粒度異常點(diǎn)的定義。在本節(jié)中,基于上面給出的知識(shí)粒度概念定義,為了以粗糙集理論檢測(cè)異常,我們提出了一個(gè)新概念,稱之為相對(duì)知識(shí)粒度,其中給出了在論域U中每個(gè)對(duì)象的不確定性度量。在IND(B)下的對(duì)象x的相對(duì)知識(shí)粒度RGB(x):(4. 1)其中KG(B)表示IND(B)的知識(shí)粒度,上述定義中的意義可以如下說(shuō)明。X的相對(duì)知識(shí)粒度RGB(x)越高,則X的不確定性越高。下面,我們構(gòu)造了兩種基于知識(shí)粒度的序列,分別是屬性序列和屬性子集序列。設(shè)一個(gè)信息系統(tǒng)IS=(U, A),其中A={ a1,,a2,…,ak },設(shè)S= a`1,a`2,…,a`k 是上面定義的屬性序列,給出屬性子集序列AS= A1,,A2,…,Ak ,其中A1,,A2,…,Ak A。此外,根據(jù)知識(shí)粒度我們可以唯一確定一個(gè)屬性序列和一個(gè)屬性子集的降序序列。因此,Breunig提出了一種基于密度的局部異常點(diǎn)檢測(cè)方法(Breunig,2000)。在IS中的對(duì)象x的知識(shí)粒度因子(KOF):()其中 和 是對(duì)象x的相對(duì)知識(shí)粒度,其中屬性子集Aj∈AS,屬性子集{aj}屬于A,1=j=k。 基于知識(shí)粒度異常點(diǎn)的例子給出一個(gè)信息系統(tǒng)IS=(U,C,V),其中U={a1,a2,a3,a4,a5,a6},C={C1,C2,C3},設(shè)閥值V=。類似的,我們可以得到當(dāng)依次移除對(duì)象a,則我們可得到知識(shí)粒度則我們可以得到它相對(duì)知識(shí)粒度計(jì)算權(quán)重 和 如下因此,知識(shí)造粒a1異常因子的計(jì)算方法如下KOF(a1)=≈<V因此,在信息系統(tǒng)IS中a1不是一個(gè)基于知識(shí)粒度的異常點(diǎn)。在流程圖的基礎(chǔ)上,我們進(jìn)行了程序的編寫。For 每個(gè){根據(jù)給定的a屬性在Va域中的序列對(duì)所有U中的對(duì)象進(jìn)行排序;確定分區(qū)U/IND({a});計(jì)算IND(a)的知識(shí)粒度KG({a});}確定A的屬性序列S={a`1, a`2, …, a`m},其中1=jm, KG({a`j})=KG({a`j+1});構(gòu)建序列S的屬性子集遞減序列AS={A1, A2, …, Am};For 1=j=m{ 根據(jù)給定的Aj屬性在VAj域中的序列對(duì)所有U中的對(duì)象進(jìn)行排序;確定分區(qū) U/IND(Aj);計(jì)算IND(Aj)的知識(shí)粒度KG(Aj);}For every x∈U{For 1=j=m {分別得計(jì)算出IND(aj) 和IND(Aj)下x的相對(duì)知識(shí)粒度RG{aj}(x)和RGAj(x); 對(duì)x賦權(quán)值W{aj}(x) ;對(duì)x賦權(quán)值WAj(x);}計(jì)算 KOF(x);對(duì)KOF進(jìn)行排序;If( KOF(x)V){就選擇}}返回 K。 我們可以看出排在較前面的對(duì)象它們的決策值都為2,也就是我們所說(shuō)的異常點(diǎn),它沒有出現(xiàn)漏檢情況。 誤檢雖然會(huì)出現(xiàn)誤檢,但由于我們的數(shù)據(jù)挖掘?qū)ο笠话闱闆r是一組大數(shù)據(jù)集。 淋巴數(shù)據(jù)的檢測(cè)首先,我們可以在UCI機(jī)器學(xué)習(xí)庫(kù)中找到淋巴數(shù)據(jù)集。在我們的實(shí)驗(yàn)中,淋巴數(shù)據(jù)集被輸入一個(gè)信息表IS= (U,A),其中U包含所有483個(gè)淋巴數(shù)據(jù)集實(shí)例,A包含9個(gè)淋巴屬性數(shù)據(jù)集(不包括類屬性)。KNN甚至要到檢測(cè)前面12個(gè)對(duì)象后才把所有的6個(gè)異常點(diǎn)檢測(cè)出來(lái)。 漏檢和誤檢由于數(shù)據(jù)源、實(shí)驗(yàn)條件等各種因素的限制,檢測(cè)不可能達(dá)到無(wú)限精確,檢測(cè)的結(jié)果可能與現(xiàn)實(shí)情況存在誤差。所以該算法的檢測(cè)性能達(dá)到了我們的預(yù)期效果。而基于粗糙集理論的數(shù)據(jù)挖掘是把知識(shí)看作是論域的劃分,從而認(rèn)為知識(shí)是有粒度的,它是以代數(shù)的觀點(diǎn)描述知識(shí)粒度的,因而稱其為粗糙集理論的代數(shù)表示。此外,我們給出了基于KG檢測(cè)異常點(diǎn)的算法。所以在今后的工作中,為了完善基于KG異常檢測(cè)算法,我們應(yīng)當(dāng)考慮利用粗糙就特征選擇方法,以減少其特征的同時(shí)還保留它的性能。 2011年 5月. . . . .參考文獻(xiàn)[1] 李道國(guó),苗奪謙,張紅云. 粒度計(jì)算的理論,模型與方法[J]. 復(fù)旦學(xué)報(bào)(自然科學(xué)版),2004,43(5): 1~2.[2] Yao Y Y. Granular puting:Basic issues and possible solutions//the 5th Joint Conference on Information Jersey,USA. 2000, 108(11): 1149~1161.[3] . Liang, . Shi, . Li, Information entropy, rough entropy and knowledge granulation in inplete information systems[J], International Journal of General Systems (2009) 641654.[4] 毛國(guó)君,段立娟,王實(shí),石云.?dāng)?shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005, 108~124. [5] 苗奪謙,李道國(guó).粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008, 128~154. [6] 苗奪謙,王國(guó)胤,柳清,林早陽(yáng),姚一豫.粒計(jì)算:過去、現(xiàn)在與展望[M].北京:科學(xué)出版社,2007. [7] Miao D Q,Wang J. Informationbase algorithm for reduction of knowledge//IEEE International Conference on Intelligent Processing Systems. Beijing,China, 1998, 1149~1161.[8] 李道國(guó). 信息粒度計(jì)算模型及其在智能信息處理中的應(yīng)用研究[D].上海:同濟(jì)大學(xué),2006.[9] [M]. 西安:西安交通大學(xué)出版社,2001.[10] 王國(guó)胤,于洪,[N]. 計(jì)算機(jī)學(xué)報(bào),2010,21(5):300~376.[11] 史開泉,崔玉泉.s一粗集與粗決策[M].北京:科學(xué)出版社,2006.[12] [J].復(fù)旦學(xué)報(bào)(自然科學(xué)版),2009,35(3):134~231.[13] 譚政仁. 基于Rough Set的海量數(shù)據(jù)挖掘算法研究[D].重慶:重慶郵電大學(xué),2004. [14] 梁吉業(yè),曲開社,徐宗本.信息系統(tǒng)的屬性約簡(jiǎn)[J].系統(tǒng)工程理論與實(shí)踐,2001,21(12):76~80.[15] [M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2001,35(3):134~231.[16] 鄧蔚,黃海,王國(guó)胤,[J],武漢,中國(guó),2005:690~695.[17] [J].軟件學(xué)報(bào),1999,10(2):113~116.[18] Set理論及其在機(jī)器學(xué)習(xí)中的應(yīng)用研究[D].北京:中國(guó)科學(xué)院自動(dòng)化研究所,1997.[19] 張文修,梁怡,[M].北京:科學(xué)出版社,2003.[20] Wang J,Wang J. Reduction algorithms based on discernibility matrix: The order attributes method. Journal of Computer Science and Technology,2001,16(6):213~228.[21] 張鈸,[J].計(jì)算機(jī)科學(xué),2003,30(5):1~5.[22] Lin T Y. Granular puting. Announcement of the BISC Special Interest Group on Granular puting, 1997.[23] 苗奪謙. 粗糙集理論中知識(shí)粗糙集性與信息熵關(guān)系的討論[M].北京:清華大學(xué)出版社,2006.[24] 安久江,甘全,王國(guó)胤,[J].計(jì)算機(jī)科學(xué),2009,32(8A):137~140.[25] 王珍,余昭平,一種基于粗糙集的最小約簡(jiǎn)算法叨[J].微計(jì)算機(jī)信息,2006,42(2):218~219.[26] 陸汝鈐.知識(shí)科學(xué)與計(jì)算科學(xué)[M].北京:清華大學(xué)出版社,2003.[27] 頓毅杰,張小峰,孫吳,趙麗.一種基于粒度的規(guī)則挖掘方法[J].蘭州理工大學(xué)學(xué)報(bào),2006(2):105~108.[28] 張宏宇,梁吉業(yè).不完備信息系統(tǒng)下的變精度粗糙集模型及其知識(shí)約簡(jiǎn)算法[J].計(jì)算機(jī)科學(xué),2003,30(4):153~155.[29] 傅明,陳曦,劉翌南.基于信息顆粒的粗糙集約簡(jiǎn)研究[J].長(zhǎng)沙理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2004(6):80~85.[30] 彭玉樓,陳曦.基于粗糙信息顆粒的數(shù)據(jù)挖掘方法研究[J].湖南科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2004(12):67~69.[31] 卞東波,白碩,李國(guó)杰.聚類/分類中的粒度原理[J].計(jì)算機(jī)學(xué)報(bào),2002,25(8):8lO~815.[32] 李鈍,梁吉業(yè).利用聚類和粗糙集迸行文本分類研究[D].計(jì)算機(jī)工程與應(yīng)用,2003,3
點(diǎn)擊復(fù)制文檔內(nèi)容
語(yǔ)文相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1