freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

bp神經網絡的異常點檢測應用研究畢業(yè)論文-文庫吧資料

2025-07-04 08:08本頁面
  

【正文】 有很強地交叉特征。:從上表可以推出,對于未知檢測數據輸入,呈現(xiàn)無法區(qū)分地現(xiàn)象。,剛好是已知異常點個數。,正異常數據地實際輸出。觀察測試數據庫計算分布結果分布情況,并統(tǒng)計分布情況(. )。已知正常數據3762,異常238.,通過這個可以輔助分析。訓練強度不要太大,以便避免無法發(fā)現(xiàn)局部異常特征地數據。.BP1隱層......X1X2Xn...異常與否BP2隱層 圖 訓練方案圖 訓練方案,把訓練集合,分成兩個集合,一個為正常數據集合,一個異常。:多神經網絡各種形式訓練及其決策用一個神經網絡表示異常點地特征,教師信號1;用另一個異常點表示非異常點地特征。數據都呈現(xiàn)正態(tài)分布,不好處理,特別是兩個教師信號數值中間區(qū)間異常點與非異常點占自己比例都是很大,難以區(qū)分。正態(tài)分布地兩邊。根據實際數據,越逼近1地越小于第二次訓練地教師信號地,都為異常點。實驗結果失敗。整個數據庫的所有計算結果,不管異常點非異常點的計算結果,都在0到1這個區(qū)間內呈現(xiàn)正態(tài)分布。訓練完后,保存訓練權值。然后再對異常點進行訓練,教師信號為1。為盡量得出可區(qū)分地數據,強化局部異常點特性。解決方法:第一種改變訓練方案,改變判斷方案;第二種改變神經網絡結構,以便輸出數據區(qū)分度更高,便于區(qū)別異常非異常。第三,數據特征不顯著。經過大量實驗,失敗原因:第一,bp處理輸出區(qū)分度不夠,難以有判斷方案。然后又對測試數據與訓練數據庫,進行相似性求和,對比測試數據中異常點與非異常點與訓練數據庫地相似性和,依然沒有區(qū)分度。經觀察驗證,測試數據與已知數據地相似性與否沒法與測試計算結果數據存在必然地比例關系。具體方式,對已知數據集做兩兩訓練,比如數據X和Y,做差fabsf(Xi Yi),然后輸入一個BP神經網絡,已知數據庫中第86個屬性,(X 86,Y86)對應為(0,0)則教師信號為1,(1,1)則教師信號為1,(0,1)則為0,部分順序。神網絡結構大概如下:XY兩兩做差絕對值......輸入層 隱層 輸出層 注:每個方向箭頭抽象全連接圖 方案一圖隱層采用85個可微閾值單元,輸出采用一個,網絡全連接。在神經網絡則表示為兩者整體特征差異大小。:把bp神經網絡相似性代替距離算法相似度量起初思路是采用兩兩相似性地訓練,然后得出一個整體數據庫屬性特征的神經網絡。反向傳播算法在網絡規(guī)模較大時計算量很大,收斂較慢,而且存在局部最小的問題,根據這一問題,在具體操作時采用了加入動量項的方法: () 稱為動量因子,這樣后一次的權值更新適當考慮上一次的權值更新,可以改善收斂特性。(2)調節(jié)權值的公式為: () 其中為學習步長,取正參數,代表上一層神經元的輸出,而有兩種情況:1) 如果j是輸出層(第m層)的神經元,則 () 2) 如果j不在輸出層,而是隱含層的神經元,則 () 是該神經元的輸出,而求本層的必須用到上一層的,可見誤差函數的求取是一個始于輸出層的反向傳播的遞歸過程。訓練教師信號,按具體方案處理設定。最后輸出0到1的數值。,隱層感知器根據實際數據庫的屬性確定,一般少于等于屬性個數,輸出層一個輸出感知器。也叫擠壓函數。注意它的輸出范圍為0到1,隨輸入單調遞增。更精確地講,sigmoid單元這樣計算輸出。權值修正為: () () 4 異常檢測中BP神經網絡的設計fX0 = 1WnW2W1XnX2X1W0 = Θ圖 如圖 可微閾值單元,圖中為sigmoid單元,與感知器相似,sigmoid單元先計算它的線性組合,然后應用一個閾值到此結果。輸出層節(jié)點輸入,輸出分別為: () 若令,則有: () 修正權值設 其中為第p個學習樣本產生的輸出誤差,為總誤差。其中,下文中如不指明則相同。BP算法主要包括兩個過程,一是由學習樣本、網絡權值從輸入層→隱含層→輸出層逐次算出各層節(jié)點的輸出;二是反過來由計算輸出與實際輸出偏差構出的誤差函數E(),用梯度下降法調節(jié)網絡權值,即 ()使誤差減小。 3 BP神經網絡介紹 人工神經網絡理論是80年代中后期迅速發(fā)展起來的一項前沿研究領域,其應用已滲透到各個領域。因為這些特點,神經網絡廣泛應用在聚類分析、模式識別、信號處理、系統(tǒng)辨識、優(yōu)化計算、預測控制等領域。人工神經網絡通過自身的網絡結構能夠實現(xiàn)對信息的記憶,而所記憶的信息是存儲在神經元之間的權值中。人工神經網絡是由許多相同的簡單處理單元并聯(lián)組合而成,具有高度并行性特性,使其對特定任務的計算變得很快,對信息的處理能力與效果驚人,因此提供了一種解決高層復雜問題的能力和方法。利用神經網絡的非線性特性,可解決藥學研究及實驗數據處理過程中大量的非線性問題。(2)非線性特性。人工神經網絡具有自學習能力,通過學習,能夠根據網絡期望輸出和網絡實際輸出之差來調整神經元間連接權值和閾值,直至使實際輸出與期望輸出之間的誤差減小到滿意的程度,這樣就實現(xiàn)了輸入到輸出的映射。使其自學習特征,自動控制調整權值及權值組合。我們可以采用神經網絡自學習調整權值。 樣例圖示,某個異常點可能異常特征是屬性1,可能是屬性屬性2地組合,對于同個數據庫不同點具有組合不確定性。有時候數據組合的重要性是體現(xiàn)在幾個數據地組合里面,既可能體現(xiàn)在幾個屬性上面,比如說一組數組(A,B,C),可能AB組合特征不顯示異常,然而ABC組合就顯示異常,這些組合是不定地。設X為一組數據集合,可使趨向某個數值,表示這組數據某個總體特征。這樣我們可以添加一個權值與年齡這一項數據乘積,這個乘積必須使權值與當前數據乘積出來的數據成正比,表示年齡增長能夠體現(xiàn)在這組數據中的重要性。例如檢測是否是糖尿病人的數據庫,三十歲以下這個年齡維度上病人較少,然而五十歲后這個維度病人比例就多了。對于單屬性特征的情況,根據數據重要性調整特征(即維度)權值,并根據數據重要性調整。傳統(tǒng)算法從整個數據集合在空間中分布地特性出發(fā)研究,比如距離的從整個數據集空間距離進行研究,同樣密度的按數據集空間密度研究,聚類也是按數據集空間特性。 2基于屬性特征在異常點檢測中的研究傳統(tǒng)算法大都是通過數據在空間地特性來判斷檢測異常點。Hongyi Zhang等引為了提高模糊核聚類算法的運行效率,提出了新的模糊核聚類算法,該算法用先驗知識對參數初始化。模糊k均值聚類算法(FCM)常用于異常點檢測,該算法動態(tài)地分配權重給每一個數據點,權重表示該數據點和數據集中心之間的距離,通過各點的權重來判斷異常點。聚類算法發(fā)展方向是優(yōu)化聚類過程,而不是提高對異常點檢測的能力,異常點檢測和聚類是兩個相對立的過程,聚類是把屬于統(tǒng)一類的數據點聚集在一起,歸為一類,而異常點檢測是把和大多數數據點相異的點挖掘出來。第二種搜索空間大,人工探測困難,效率不高,只適用多維數據。此方法由于搜索空間很大,人工探測非常困難。(2) OLAP數據立方體技術:,該單元被認為是一個異常。這個算法復雜度與數據集大小呈線性關系,有優(yōu)異的計算性能。主要有兩種技術:第一種順序地比較集合中的對象,叫順
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1