freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

bp神經(jīng)網(wǎng)絡(luò)的異常點(diǎn)檢測(cè)應(yīng)用可行性分析畢業(yè)論文(存儲(chǔ)版)

  

【正文】 簡(jiǎn)化方案,只訓(xùn)練非異常數(shù)據(jù),異常數(shù)據(jù)特征不太可控。實(shí)驗(yàn)計(jì)算結(jié)果: 5個(gè)隱層實(shí)驗(yàn)結(jié)果 單位:個(gè)數(shù)分區(qū)正常點(diǎn)分布62554610588400000異常點(diǎn)分布01472367100000(單位:縱軸個(gè)數(shù),)注:,橫軸表示0到1區(qū)間,縱軸表示個(gè)數(shù);系列1表示非異常點(diǎn)計(jì)算結(jié)果,系列2表示異常點(diǎn)計(jì)算結(jié)果 5個(gè)隱層實(shí)驗(yàn)結(jié)果 15個(gè)隱層實(shí)驗(yàn)結(jié)果 單位:個(gè)數(shù)分區(qū)正常點(diǎn)計(jì)算分布004555762510201086409200異常點(diǎn)分布002223667704100 25個(gè)隱層實(shí)驗(yàn)結(jié)果 單位:個(gè)數(shù)分區(qū)正常點(diǎn)分布1146211843259700000異常點(diǎn)分布90109298200000(單位:縱軸個(gè)數(shù),)注:,橫軸表示0到1區(qū)間,縱軸表示個(gè)數(shù);系列1表示非異常點(diǎn)計(jì)算結(jié)果,系列2表示異常點(diǎn)計(jì)算結(jié)果 15個(gè)隱層實(shí)驗(yàn)結(jié)果(單位:縱軸個(gè)數(shù),)注:,橫軸表示0到1區(qū)間,縱軸表示個(gè)數(shù);系列1表示非異常點(diǎn)計(jì)算結(jié)果,系列2表示異常點(diǎn)計(jì)算結(jié)果 25個(gè)隱層實(shí)驗(yàn)結(jié)果、 、數(shù)據(jù)依然呈現(xiàn)之前實(shí)驗(yàn)地分布情況,不是BP算法隱層太多地問(wèn)題。解決設(shè)想,減少隱層個(gè)數(shù),生成隨機(jī),空間具有兩類特征地?cái)?shù)據(jù)。:從上表可以推出,對(duì)于未知檢測(cè)數(shù)據(jù)輸入,呈現(xiàn)無(wú)法區(qū)分地現(xiàn)象。已知正常數(shù)據(jù)3762,異常238.,通過(guò)這個(gè)可以輔助分析。數(shù)據(jù)都呈現(xiàn)正態(tài)分布,不好處理,特別是兩個(gè)教師信號(hào)數(shù)值中間區(qū)間異常點(diǎn)與非異常點(diǎn)占自己比例都是很大,難以區(qū)分。整個(gè)數(shù)據(jù)庫(kù)的所有計(jì)算結(jié)果,不管異常點(diǎn)非異常點(diǎn)的計(jì)算結(jié)果,都在0到1這個(gè)區(qū)間內(nèi)呈現(xiàn)正態(tài)分布。解決方法:第一種改變訓(xùn)練方案,改變判斷方案;第二種改變神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以便輸出數(shù)據(jù)區(qū)分度更高,便于區(qū)別異常非異常。經(jīng)觀察驗(yàn)證,測(cè)試數(shù)據(jù)與已知數(shù)據(jù)地相似性與否沒(méi)法與測(cè)試計(jì)算結(jié)果數(shù)據(jù)存在必然地比例關(guān)系。:把bp神經(jīng)網(wǎng)絡(luò)相似性代替距離算法相似度量起初思路是采用兩兩相似性地訓(xùn)練,然后得出一個(gè)整體數(shù)據(jù)庫(kù)屬性特征的神經(jīng)網(wǎng)絡(luò)。最后輸出0到1的數(shù)值。更精確地講,sigmoid單元這樣計(jì)算輸出。BP算法主要包括兩個(gè)過(guò)程,一是由學(xué)習(xí)樣本、網(wǎng)絡(luò)權(quán)值從輸入層→隱含層→輸出層逐次算出各層節(jié)點(diǎn)的輸出;二是反過(guò)來(lái)由計(jì)算輸出與實(shí)際輸出偏差構(gòu)出的誤差函數(shù)E(),用梯度下降法調(diào)節(jié)網(wǎng)絡(luò)權(quán)值,即 ()使誤差減小。人工神經(jīng)網(wǎng)絡(luò)是由許多相同的簡(jiǎn)單處理單元并聯(lián)組合而成,具有高度并行性特性,使其對(duì)特定任務(wù)的計(jì)算變得很快,對(duì)信息的處理能力與效果驚人,因此提供了一種解決高層復(fù)雜問(wèn)題的能力和方法。使其自學(xué)習(xí)特征,自動(dòng)控制調(diào)整權(quán)值及權(quán)值組合。設(shè)X為一組數(shù)據(jù)集合,可使趨向某個(gè)數(shù)值,表示這組數(shù)據(jù)某個(gè)總體特征。傳統(tǒng)算法從整個(gè)數(shù)據(jù)集合在空間中分布地特性出發(fā)研究,比如距離的從整個(gè)數(shù)據(jù)集空間距離進(jìn)行研究,同樣密度的按數(shù)據(jù)集空間密度研究,聚類也是按數(shù)據(jù)集空間特性。聚類算法發(fā)展方向是優(yōu)化聚類過(guò)程,而不是提高對(duì)異常點(diǎn)檢測(cè)的能力,異常點(diǎn)檢測(cè)和聚類是兩個(gè)相對(duì)立的過(guò)程,聚類是把屬于統(tǒng)一類的數(shù)據(jù)點(diǎn)聚集在一起,歸為一類,而異常點(diǎn)檢測(cè)是把和大多數(shù)數(shù)據(jù)點(diǎn)相異的點(diǎn)挖掘出來(lái)。這個(gè)算法復(fù)雜度與數(shù)據(jù)集大小呈線性關(guān)系,有優(yōu)異的計(jì)算性能。但是,此方法在實(shí)際應(yīng)用中計(jì)算量亦是不小,效率有待提高。也就是說(shuō)是否是異常點(diǎn)不僅僅取決于它與周圍數(shù)據(jù)的距離大小,而且與鄰域內(nèi)的密度情況有關(guān)。代表性算法主要有以下幾種。(2) 不必對(duì)數(shù)據(jù)集的相關(guān)信息(數(shù)據(jù)服從哪種統(tǒng)計(jì)分布模型,數(shù)據(jù)類型特點(diǎn)等)足夠了解。對(duì)低維空間的數(shù)據(jù)此方法優(yōu)于索引算法和NL算法,但對(duì)于高維數(shù)據(jù)此算法性能不高。對(duì)于參數(shù)的每個(gè)變化都需要調(diào)整單元結(jié)構(gòu),因此會(huì)影響了算法的結(jié)果。隨著維數(shù)的增加,所有的索引結(jié)構(gòu)的性能迅速下降,使得算法性能不佳。基于距離的異常點(diǎn)檢測(cè)算法的基本思想是把數(shù)據(jù)點(diǎn)看作空間中的點(diǎn),異常點(diǎn)被定義為與大多數(shù)數(shù)據(jù)距離較遠(yuǎn)的點(diǎn)。但是異常檢測(cè)過(guò)程,通常數(shù)據(jù)的位數(shù)較高,在高維特征存在冗余特征干擾,以及高維特征下數(shù)據(jù)不充分的問(wèn)題,因此,本文研究了BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于不同情況。例如,一個(gè)公司首席執(zhí)行官的工資自然遠(yuǎn)遠(yuǎn)高于公司其他雇員的工資,成為一個(gè)異常點(diǎn)。因此,本文分析BP神經(jīng)網(wǎng)絡(luò)處理各種數(shù)據(jù)的情況,并得到以下結(jié)果。這部分?jǐn)?shù)據(jù)的量小,但是對(duì)于我們的日常生產(chǎn)生活的影響極大。關(guān)鍵字:異常,BP,異常點(diǎn)檢測(cè),神經(jīng)網(wǎng)絡(luò)注:本設(shè)計(jì)(論文)題目來(lái)源于教師的國(guó)家級(jí)(或部級(jí)、省級(jí)、廳級(jí)、市級(jí)、校級(jí)、企業(yè))科研項(xiàng)目,項(xiàng)目編號(hào)為: 。因此人們開(kāi)始逐漸研究異常點(diǎn)挖掘算法。此類算法估計(jì)多維分布的概率模型的難度較大,且準(zhǔn)確性低。這類方法與基于密度的檢測(cè)算法有很大的相似之處,不需要事先知道數(shù)據(jù)集的分布模型,對(duì)于任意分布模型均有效。基于單元的方法是把數(shù)據(jù)集劃分為單元,逐個(gè)單元的檢測(cè),而非逐個(gè)對(duì)象的檢測(cè)。如果滿足的點(diǎn)q不超過(guò)n1個(gè),即,那么稱為異常點(diǎn)。代表性的算法有: 陸聲鏈等提出一個(gè)判斷異常點(diǎn)的新定義,并設(shè)計(jì)基于抽樣近似檢測(cè)算法?;诿芏鹊漠惓S^點(diǎn)比基于距離的異常觀點(diǎn)更貼近Hawkins的異常定義,因此能夠檢測(cè)出基于距離異常算法所不能識(shí)別的局部異常。(2)Ville Hautamaki等提出兩種基于密度的異常點(diǎn)檢測(cè)算法,第一種算法思路為在kNN圖中,若頂點(diǎn)u成為其它點(diǎn)的k近鄰的次數(shù)少于給定閾值T時(shí)就被認(rèn)為是異常點(diǎn),另一種算法則是先對(duì)所有頂點(diǎn)的平均k近鄰距離進(jìn)行排序,然后將平均k近鄰距離大于T點(diǎn)頂點(diǎn)視為異常點(diǎn)。LOF算法充分體現(xiàn)了“局部”的概念,每個(gè)點(diǎn)都給出了一個(gè)離群程度,離群程度最強(qiáng)的那個(gè)幾個(gè)點(diǎn)被標(biāo)記為異常點(diǎn)。相反,它通過(guò)檢查一組對(duì)象的主要特征來(lái)識(shí)別異常點(diǎn)。此方法是發(fā)現(xiàn)驅(qū)動(dòng)探索的一種形式。此類算法沒(méi)有先驗(yàn)知識(shí)指導(dǎo)如何確定聚類中心,只能是隨機(jī)選取,優(yōu)化搜索空間較大,算法的復(fù)雜度較大。假設(shè)數(shù)據(jù)特征表示在每個(gè)屬性上面,獨(dú)立沒(méi)有組合屬性表現(xiàn)特征地情況下,每一組數(shù)據(jù)屬性對(duì)應(yīng)權(quán)值數(shù)據(jù)乘積和,表示這個(gè)數(shù)據(jù)在這組數(shù)據(jù)中全局中所占的重要性。所有在屬性權(quán)值之上需要一組對(duì)屬性不同組合特征的權(quán)值調(diào)整。人工神經(jīng)網(wǎng)絡(luò)的輸入輸出映射能力對(duì)于預(yù)測(cè)有特別重要的意義。從單個(gè)權(quán)值中看不出所存儲(chǔ)的信息內(nèi)容,因而是分布式的存儲(chǔ)方式,這使得網(wǎng)絡(luò)具有良好的容錯(cuò)性,既能進(jìn)行模式信息處理工作,又能進(jìn)行模式識(shí)別工作。輸入層節(jié)點(diǎn),取其輸出與輸入相同,即隱含層節(jié)點(diǎn)輸入,輸出分別為: ()若令則有:。因?yàn)檫@個(gè)函數(shù)把非常大的書(shū)值域映射到一個(gè)小范圍的輸出。(1)定義誤差函數(shù)為期望輸出與實(shí)際輸出之差的平方和: ()其中yj是輸出單元的期望輸出,是實(shí)際的輸出。假設(shè)這樣能夠成功,則以后只要判斷測(cè)試數(shù)據(jù)與整體已知數(shù)據(jù)庫(kù)地整體差異大小,就可以判斷異常與否。經(jīng)多次嘗試,降低訓(xùn)練次數(shù)精度,本實(shí)驗(yàn)方案依然失敗。實(shí)驗(yàn)方案:對(duì)神經(jīng)網(wǎng)絡(luò)BP1,先使用非異常點(diǎn)經(jīng)行訓(xùn)練,教師信號(hào)為0。數(shù)據(jù)難以區(qū)分。同時(shí)測(cè)試數(shù)據(jù)可以通過(guò)進(jìn)行不同神經(jīng)網(wǎng)絡(luò)計(jì)算兩次,以便得結(jié)果進(jìn)行具體判斷結(jié)果。表 BP1正常測(cè)試數(shù)據(jù)地分布輸出統(tǒng)計(jì)(tictgts2000中為0) (單位:個(gè)數(shù))輸出范圍測(cè)試數(shù)據(jù)庫(kù)正常數(shù)據(jù)個(gè)數(shù)376200000000037623762表 BP1異常測(cè)試數(shù)據(jù)地分布統(tǒng)計(jì)輸出(tictgts2000中為1) (單位:個(gè)數(shù))輸出范圍測(cè)試數(shù)據(jù)庫(kù)異常數(shù)據(jù)個(gè)數(shù)2380000000000238 BP2正常測(cè)試數(shù)據(jù)地輸出統(tǒng)計(jì)(tictgts2000中為0) (單位:個(gè)數(shù))輸出范圍測(cè)試異常點(diǎn)數(shù)據(jù)數(shù)量個(gè)數(shù)0000004726 201238238表 BP2異常測(cè)試數(shù)據(jù)地輸出統(tǒng)計(jì)(tictgts2000中為1) (單位:個(gè)數(shù))輸出范圍測(cè)試數(shù)據(jù)庫(kù)正常數(shù)據(jù)數(shù)量個(gè)數(shù)000103654163512297403762(單位:縱軸個(gè)數(shù),)注:橫軸表示0到1區(qū)間,縱軸表示個(gè)數(shù);系列1表示異常點(diǎn)計(jì)算結(jié)果,系列2表示非異常點(diǎn)計(jì)算結(jié)果(單位:縱軸個(gè)數(shù),)注:橫軸表示0到1區(qū)間,縱軸表示個(gè)數(shù);系列2表示異常點(diǎn)計(jì)算結(jié)果,系列1表示非異常點(diǎn)計(jì)算結(jié)果已知BP1保存的是正常數(shù)據(jù)地特性,越逼近0越是屬于正常數(shù)據(jù)特性;BP2保存的是異常數(shù)據(jù)地特性
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1