freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

bp神經(jīng)網(wǎng)絡的異常點檢測應用可行性研究_畢業(yè)論文-全文預覽

2024-09-24 18:10 上一頁面

下一頁面
  

【正文】 在 之前,異常數(shù)據(jù)每個屬性都限制在 之間。 ( 2) 接入神經(jīng)網(wǎng)絡對非異常數(shù)據(jù)進行訓練。本實驗 BP 結(jié)構(gòu)采用隱層 5 個神經(jīng)元,輸出層一個。結(jié)果如表 至表 。 實驗計算結(jié)果: 表 5個隱層實驗結(jié)果 單位:個數(shù) 分區(qū) .1 .2 .3 .4 .5 .6 .7 .8 .9 正常點分布 6 2554 610 588 4 0 0 0 0 0 異常點分布 0 147 23 67 1 0 0 0 0 0 27 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間 ) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計算結(jié)果分布,縱軸表示個數(shù); 系列 1 表示非異常點計算結(jié)果,系列 2 表示異常點計算結(jié)果 圖 5個隱層實驗結(jié)果 表 15個隱層實驗結(jié)果 單位:個數(shù) 25個隱層實驗結(jié)果 單位:個數(shù) 分區(qū) .4 .5 .6 .7 .8 .9 .0 正常點計算分布 0 0 45 557 625 1020 1086 409 20 0 異常點分布 0 0 2 22 36 67 70 41 0 0 分區(qū) .1 .2 .3 .4 .5 .6 .7 .8 .9 .0 正常點分布 1146 2118 432 59 7 0 0 0 0 0 異常點分布 90 109 29 8 2 0 0 0 0 0 28 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計算結(jié)果分布 ,縱軸表示個數(shù); 系列 1 表示非異常點計算結(jié)果,系列 2 表示異常點計算結(jié)果 圖 15個隱層實驗結(jié)果 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計算結(jié)果分布,縱軸表示個數(shù); 系列 1 表示非異常點計算結(jié)果,系列 2 表示異常點計算結(jié)果 圖 25個隱層實驗結(jié)果 通過表 、表 、表 、 圖 、圖 、圖 觀察分析,數(shù)據(jù)依然呈現(xiàn)之前 29 實驗地分布情況,不是 BP 算法隱層太多地問題。一下摘取部分信息。 解決設想,減少隱層個數(shù),生成隨機,空間具有兩類特征地數(shù)據(jù)。 注:訓練數(shù)據(jù)庫中的,每個點代表一個屬性值,橫軸代表屬性順序,縱軸代表屬性值 . 圖 單位:橫軸屬性順序,縱軸屬性數(shù)值。 綜合上面各個表和圖 和圖 分析:從上表可以推出,對于未知檢測數(shù)據(jù)輸入,呈現(xiàn)無法區(qū)分地現(xiàn)象。剛好所 有正常數(shù)據(jù)都在 之下。 觀察測試數(shù)據(jù)庫計算分布結(jié)果分布情況,并統(tǒng)計分布情況(表 . 表 表)。訓練強度不要太大,以便避免無法發(fā)現(xiàn)局部異常特征地數(shù)據(jù)。 訓練方案三實驗:多神經(jīng)網(wǎng)絡各種形式訓練及其決策 實驗設計思路 用一個神經(jīng)網(wǎng)絡表示異常點地特征,教師信號 1;用另一個異常點表示非異常點地特征,教師信號 。 正態(tài)分布地兩邊。 實驗結(jié)果失敗。訓練完 19 后,保存訓練權(quán)值。為盡量得出可區(qū)分地數(shù)據(jù),強化局部異常點特性。第三,數(shù)據(jù)特征不顯著。然后又對測試數(shù)據(jù)與訓練數(shù)據(jù)庫,進行相似性求和,對比測試數(shù)據(jù)中異常點與非異常點與訓練數(shù)據(jù)庫地相似性和,依然沒有區(qū)分度。 具體方式,對已知數(shù)據(jù)集做兩兩訓練,比如數(shù)據(jù) X 和 Y,做差 fabsf(Xi Yi),然后輸入一個 BP 神經(jīng)網(wǎng)絡,已知數(shù)據(jù)庫中第 86 個屬性 ,(X 86,Y86)對應為( 0, 0)則教師信號為 1, (1, 1)則教師信號為 1, (0,1)則為 0,部分順序。在神經(jīng)網(wǎng)絡則表示為兩者整體特征差異大小。 反向傳播算法在網(wǎng)絡規(guī)模較大時計算量很大,收斂較慢,而且存在局部最小的問題,根據(jù)這一問題,在具體操作時采用了加入動量項的方法: )()1( 1 tWVdtW ijkjkjij ?????? ? ?? ( ) ? 稱為動量因子,這樣后一次的權(quán)值更新適當考慮上一次的權(quán)值更新,可以改善收斂特性。 訓練教師信號,按具體方案處理設定。 單個 BP 網(wǎng)絡結(jié)構(gòu)設計 X1 X2 Xn W1 W2 Wn X0 = 1 W0 = Θ ? f ??? ni WiXi 0 ne ten et ???? 1 1)(??14 采用 為神經(jīng)感知器,隱層感知器根據(jù)實際數(shù)據(jù)庫的屬性確定,一般少于等于屬性個數(shù),輸出層一個輸出感知器。注意它的輸出范圍為 0到 1,隨輸入單調(diào)遞增。 權(quán)值修正為: kjkjkj vvv ??? () jijiji ??? () 12 13 4 異常檢測中 BP 神經(jīng)網(wǎng)絡的設計 可微閾值單元 圖 如圖 可微閾值單元,圖中為 sigmoid 單元,與感知器相似, sigmoid 單元先計算它的線性組合,然后應用一個閾值到此結(jié)果。 輸出層節(jié)點輸入 pk ,輸出 pko 分別為: 39。 BP 算法主要包括兩個過程,一是由學習樣本、網(wǎng)絡權(quán)值 ? 從輸入層→隱含層→輸出層逐次算出各層節(jié)點的輸出;二是反過來由計算輸出與實際輸出偏差構(gòu)出的誤差函數(shù) E( ? ),用梯度下降法調(diào)節(jié)網(wǎng)絡權(quán)值,即 )(1 kkkE???? ?????? () 使誤差 )( 1?kE? 減小。 因為這些特點,神經(jīng)網(wǎng)絡廣泛應用在聚類分析、模式識別、信號處理、系統(tǒng)辨識、優(yōu)化計算、預測控制等領域。人工神經(jīng)網(wǎng)絡是由許多相同的簡單處理單元并聯(lián)組合而成,具有高度并行性特性,使其對特定任務的計算變得很快,對信息的處 理能力與效果驚人,因此提供了一種解決高層復雜問題的能力和方法。 ( 2)非線性特性。使其自學習特征,自動控制調(diào)整權(quán)值及權(quán)值組合。 圖 樣例圖示 8 如圖 ,某個異常點可能異常特征是屬性 1,可能是屬性 屬性 2 地組合,對于同個數(shù)據(jù)庫不同點具有組合不確定性。設 X 為一組數(shù)據(jù)集合,可使 ? WiXi* 趨向某個數(shù)值,表示這組數(shù)據(jù)某個總體特征。例如檢測是否是糖尿病人的數(shù)據(jù)庫,三十歲以下這個年齡維度上病人較少,然而五十歲后這個維度病人比例就多了。傳統(tǒng)算法從整個數(shù)據(jù)集合在空間中分布地特性出發(fā)研究,比如距離的從整個數(shù)據(jù)集空間距離進行研究,同樣密度的按數(shù)據(jù)集空間密度研究,聚類也是 按數(shù)據(jù)集空間 特性。 Hongyi Zhang 等引為了提高模糊核聚類 算法的運行效率,提出了新的模糊核聚類算法,該算法用先驗知識對參數(shù)初始化。聚類算法發(fā)展方向是優(yōu)化聚類過程,而不是提高對異常點檢測的能力,異常點檢測和聚類是兩個相對立的過程,聚類是把屬于統(tǒng)一類的數(shù)據(jù)點聚集在一起,歸為一類,而異常點檢測是把和大多數(shù)數(shù)據(jù)點相異的點挖掘出來。此方法由于搜索空間很大,人工探測非常困難。這個算法復雜度與數(shù)據(jù)集大小呈線性關系,有優(yōu)異的計算性能。背離這種描述的對象認為是異常點。 但是,此方法在實際應用中計算量亦是不小,效率有待提高。文獻有關發(fā) 5 面對 LOF 進行推廣:一是由原來的一個鄰域的變化為兩個(計算密度領域和比較密度領域);二是剪除非 異常對象來減小計算代價;因此,使用算法比傳統(tǒng)的 LOF 算法有所提高。也就是說是否是異常點不僅僅取決于它與周圍數(shù)據(jù)的距離大小,而且與鄰域內(nèi)的密度情況有關。 (3)Papadimitriou 定義了多粒度偏離系數(shù) (Multi— Granularity Deviation Factor,簡稱MDEF),該算法將多粒度偏離 系數(shù) 是所在鄰域的標準多粒度偏離系數(shù)的 3 倍的點判定為異常點,然而標 準多粒度偏離系數(shù)的計算量大,對算法的可行性有一定的限制。代表性算法主要有以下幾種。局部異常觀點摒棄了以前所有的異常定義中非此即彼的絕對異常觀念,更加符合現(xiàn)實生活的中的 應用。 (2) 不必對數(shù)據(jù)集的相關信息 (數(shù)據(jù)服從哪種統(tǒng)計分布模型,數(shù)據(jù)類型特點等 )足夠了解。使得算法性能有所提高 。對低維空間的數(shù)據(jù)此方法優(yōu)于索引算法和 NL 算法,但對于高維數(shù)據(jù)此算法性能不高。如果對數(shù)據(jù) 對 象根據(jù)它們的 )(pDk 距離進行排序,那么前 n 個點就被看作異常 點。對于參數(shù)的每個變化都需要調(diào)整單元結(jié)構(gòu),因此會影響了算法的結(jié)果。它的時間復雜度為)( NckO ? ,其中 ck 取決于單元的個數(shù)和維數(shù) k 。隨著維數(shù)的增加,所有的索引結(jié)構(gòu)的性能迅速下降,使得算法性能不佳。 基于距離方法最早是由 Knorr 和 Ng 在 1998 年提出的。 基于距離的異常點檢測算法 基于距離的異常點檢測算法的基本思想是把數(shù)據(jù)點看作空間中的點,異常點被定義為與大多數(shù)數(shù)據(jù)距離較遠的點?;谏疃确椒ㄖ饕杂嬎銕缀螢榛A,通過計算不同層的 KD 凸包將外層的對象判定為異常點。但是異常檢測過程,通常數(shù)據(jù)的位數(shù)較高,在高維特征存在冗余特征干擾,以及高維特征下數(shù)據(jù)不充分的問題,因此,本文研究了BP 神經(jīng)網(wǎng)絡應用于不同情況。目前異常 點檢測已經(jīng)開始用于信用卡欺詐、網(wǎng)絡入侵檢測以及金融申請和交易欺詐等領域 [2],近年來異常點檢測已成為數(shù)據(jù)挖掘研究中的一個熱點問題。例如,一個公司首席執(zhí)行官的工資自然遠遠高于公司其他雇員的工資,成為一個異常點。 III IV Abstract Outlier data is the data set different data. This part of the small amount of data, but for our daily production and life of great. Therefore, the anomaly detection is widely used in work intrusion detection, finance, insurance, weather, and new drug development and other fields. Relative to the large number of normal data mining, the anomaly detection model is called data mining small. BP algorithm is a monly used data mining algorithm. But the BP algorithm to real data outliers exist in the data mining process: the higher the dimension of the actual data, there are redundant features of the interference, and highdimensional feature, the issue of inadequate data. Therefore, this paper analyzes a variety of BP neural work processing of data, and to get the following results. (1) BP neural work can better separation characteristics of a single simulation data。因此,本文分析 BP 神經(jīng)網(wǎng)絡處理各種數(shù)據(jù)的情況,并得到以下結(jié)果。因此,異常點檢測被廣泛應用于網(wǎng)絡入侵檢測,金融保險,天氣預報以及新藥研制等領域。這部分數(shù)據(jù)的量小,但是對于我們的日常生產(chǎn)生活的影響極大。但是 BP 算法進行實際數(shù)據(jù)的異常點數(shù)據(jù)挖掘過程中存在:實際數(shù)據(jù)的維數(shù)較高,存在冗余特征的干擾,以及在 高維特征下,數(shù)據(jù)量不充分的問題。 關鍵字 :異常, BP,異常點檢測,神 經(jīng)網(wǎng)絡 注:本設計(論文)題目來源于教師的國家級(或部級、省級、廳級、市級、校級、企業(yè))科研項目,項目編號為: 。異常點可能由于度量或執(zhí)行錯誤產(chǎn)生,也可能是由于固有數(shù)據(jù)可變性的結(jié)果。因此人們開始逐漸研究異常點挖掘算法。 BP 神經(jīng)網(wǎng)絡適用于儲存和描述這種復雜的關系。此類算法估計多維分布的概率模型的難度較大,且準確性低。其次,此方法在很大程度上依賴于待挖掘的數(shù)據(jù)集是否滿足某種概率分布模型、模型的參數(shù)、異常點的數(shù)目等對基于統(tǒng)計的方法都有非常重要的意義,而確定這些參數(shù)通常比較困難
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1