freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

bp神經(jīng)網(wǎng)絡(luò)的異常點(diǎn)檢測應(yīng)用可行性研究_畢業(yè)論文-資料下載頁

2024-08-27 18:10本頁面

【導(dǎo)讀】異常點(diǎn)數(shù)據(jù)是指數(shù)據(jù)集中與眾不同數(shù)據(jù)。這部分?jǐn)?shù)據(jù)的量小,但是對于我們的日常。生產(chǎn)生活的影響極大。因此,異常點(diǎn)檢測被廣泛應(yīng)用于網(wǎng)絡(luò)入侵檢測,金融保險(xiǎn),天氣。預(yù)報(bào)以及新藥研制等領(lǐng)域。相對于大量的正常數(shù)據(jù)挖掘而言,異常點(diǎn)檢測被稱作小模式。但是BP算法進(jìn)行實(shí)際數(shù)據(jù)的異常點(diǎn)數(shù)。據(jù)挖掘過程中存在:實(shí)際數(shù)據(jù)的維數(shù)較高,存在冗余特征的干擾,以及在高維特征下,因此,本文分析BP神經(jīng)網(wǎng)絡(luò)處理各種數(shù)據(jù)的情況,并得到以下。BP神經(jīng)網(wǎng)絡(luò)能夠較好的分離特征單一的仿真數(shù)據(jù);但是特征相似性較。學(xué)習(xí)不充分,從而導(dǎo)致異常無法判斷。針對以上問題,本文提出了以下的改進(jìn)措施:。BP算法前進(jìn)行特征約簡(映射)從中選取有益于異常檢測的特征多神經(jīng)網(wǎng)絡(luò)融合,目,項(xiàng)目編號為:。KeyWords:Outliers-Data,BP,Algorithms,NeuralNetworks

  

【正文】 020 1086 409 20 0 異常點(diǎn)分布 0 0 2 22 36 67 70 41 0 0 分區(qū) .1 .2 .3 .4 .5 .6 .7 .8 .9 .0 正常點(diǎn)分布 1146 2118 432 59 7 0 0 0 0 0 異常點(diǎn)分布 90 109 29 8 2 0 0 0 0 0 28 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計(jì)算結(jié)果分布 ,縱軸表示個數(shù); 系列 1 表示非異常點(diǎn)計(jì)算結(jié)果,系列 2 表示異常點(diǎn)計(jì)算結(jié)果 圖 15個隱層實(shí)驗(yàn)結(jié)果 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計(jì)算結(jié)果分布,縱軸表示個數(shù); 系列 1 表示非異常點(diǎn)計(jì)算結(jié)果,系列 2 表示異常點(diǎn)計(jì)算結(jié)果 圖 25個隱層實(shí)驗(yàn)結(jié)果 通過表 、表 、表 、 圖 、圖 、圖 觀察分析,數(shù)據(jù)依然呈現(xiàn)之前 29 實(shí)驗(yàn)地分布情況,不是 BP 算法隱層太多地問題。 對實(shí)驗(yàn)三調(diào)整隱層實(shí)驗(yàn) 分別把隱層單元改為 1 25 分別按實(shí)驗(yàn)三方案做實(shí)驗(yàn)。 4000 組測試數(shù)據(jù)。下面為計(jì)算結(jié)果分布。結(jié)果如表 至表 。 表 5個隱層實(shí)驗(yàn)結(jié)果 單位 :個數(shù) 分區(qū) .1 .2 .3 .4 .5 .6 .7 .8 .9 .0 正常點(diǎn)分布 0 0 0 0 207 3495 60 0 0 0 異常點(diǎn)分布 0 0 0 0 12 218 8 0 0 0 表 15個隱層實(shí)驗(yàn)結(jié)果 單位 :個數(shù) 分區(qū) .1 .2 .3 .4 .5 .6 .7 .9 .0 正常點(diǎn)分布 427 1336 1617 368 11 3 0 0 0 0 異常點(diǎn)分布 43 85 102 8 0 0 0 0 0 0 表 25個隱層實(shí)驗(yàn)結(jié)果 單位 :個數(shù) 分區(qū) .1 .2 .3 .4 .5 .6 .7 .8 .9 .0 正 常 點(diǎn)計(jì) 算 分布 0 0 0 3 16 140 399 1149 1829 226 異 常 點(diǎn)分布 0 0 0 0 3 8 50 79 89 9 30 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計(jì)算結(jié)果分布,縱軸表示個數(shù); 系列 1 表示非異常點(diǎn)計(jì)算結(jié)果,系列 2 表示異常點(diǎn)計(jì)算結(jié)果 圖 5個隱層實(shí)驗(yàn)結(jié)果 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計(jì)算結(jié)果分布,縱軸表示個數(shù); 系列 1 表示非異常點(diǎn)計(jì)算結(jié)果,系列 2 表示異常點(diǎn)計(jì)算結(jié)果 圖 15個隱層實(shí)驗(yàn)結(jié)果 31 (單位:縱軸個數(shù),橫軸順序表示每隔 地區(qū)間) 注:對照表 , 橫軸表示 0 到 1 區(qū)間,比如 1 表示 0 到 計(jì)算結(jié)果分布,縱軸表示個數(shù); 系列 1 表示非異常點(diǎn)計(jì)算結(jié)果,系列 2 表示異常點(diǎn)計(jì)算結(jié)果 25個隱層實(shí)驗(yàn)結(jié)果 數(shù)據(jù)分布一樣,無法區(qū)分。 通過上面幾個實(shí)驗(yàn)可以知道,并非 BP 結(jié)構(gòu)過擬化,應(yīng)該是數(shù)據(jù)問題。 數(shù)據(jù)仿真實(shí)驗(yàn) 實(shí)驗(yàn)思路 根據(jù)實(shí) 驗(yàn) 失敗原因分析設(shè)計(jì),規(guī)范化數(shù)據(jù),隨機(jī)生成具備兩類特征數(shù)據(jù)。本實(shí)驗(yàn) BP 結(jié)構(gòu)采用隱層 5 個神經(jīng)元,輸出層一個。出于簡化方案,只訓(xùn)練非異常數(shù)據(jù),異常數(shù)據(jù)特征不太可控。 實(shí)驗(yàn)步驟 ( 1) 生成隨機(jī)數(shù)據(jù),正常數(shù)據(jù)五個屬性每個都限制在 之前,異常數(shù)據(jù)每個屬32 性都限制在 之間。先生成 20 組數(shù)據(jù), 17 組正常數(shù)據(jù), 3 組異常。 ( 2) 接入神經(jīng)網(wǎng)絡(luò)對非異常數(shù)據(jù)進(jìn)行訓(xùn)練。組數(shù)據(jù)結(jié)束條件 教師信號與實(shí)際輸出相差絕對值 和次數(shù) time 300 次。 ( 3) 保存訓(xùn)練后權(quán)值,對原訓(xùn)練數(shù)據(jù)進(jìn)行收斂性檢查,同時(shí)查看二十組數(shù)據(jù) 分布。 ( 4) 隨機(jī)生成具備 (1)特征地另一組數(shù)據(jù),采用( 2)已經(jīng)訓(xùn)練地權(quán)值,進(jìn)行計(jì)算測試,查看分析結(jié)果數(shù)據(jù)分布。 (單位:縱軸屬性值,橫軸順序表示屬性順序,同一種圖形表示一組數(shù)據(jù)) 注:正常數(shù)據(jù)五個屬性每個都限制在 之前,異常數(shù)據(jù)每個屬性都限制在 之間。總 20 組, 17 組正常數(shù)據(jù),3 組異常。每一組數(shù)據(jù)由一種圖形構(gòu)成。 17, 18, 19 為異常數(shù)據(jù)。 圖 隨機(jī)數(shù) 實(shí)驗(yàn)結(jié)果 33 訓(xùn)練完后神經(jīng)網(wǎng)絡(luò)與訓(xùn)練數(shù)據(jù)計(jì)算結(jié)果 ,如圖 。 計(jì)算第二組生成地隨機(jī)測試數(shù)據(jù),結(jié)果如圖 。 單位:橫軸表示順序,縱軸表示計(jì)算結(jié)果數(shù)值。 圖 測試訓(xùn)練收斂與否(每個點(diǎn)代表一個結(jié)果) 結(jié)果分析 根據(jù)上面結(jié)果,可以看出 BP 具備特征記憶能力能夠在這種情況下被使用,并且能夠區(qū)分自身訓(xùn)練集合地特征。圖 正常點(diǎn)計(jì)算范圍集中在 到 之間,異常點(diǎn)計(jì)算結(jié)果在 之間,可以明顯區(qū)分開發(fā)來。同樣圖 也可以區(qū)分清楚。證明 BP具備一定數(shù)據(jù)特征篩選能力。在本實(shí)驗(yàn)過程中同時(shí)進(jìn)行了不同數(shù)據(jù)集合地實(shí)驗(yàn),多屬性特征穿插混淆,總體能夠的到穩(wěn)定結(jié)果,多屬性特征則比較不穩(wěn)定。 實(shí)驗(yàn)整體分析 根據(jù)上面實(shí)驗(yàn),總地來說在實(shí)際異常點(diǎn)檢測上面,單純 BP 神經(jīng)網(wǎng)未能達(dá)到預(yù)期異常點(diǎn)檢測地效果, , , 的實(shí)驗(yàn)都失敗,不管異常非異常在訓(xùn)練后,計(jì)算結(jié)果分布都呈現(xiàn)難以區(qū)分判斷地現(xiàn)象。 呈現(xiàn)無規(guī)則分布,總體呈現(xiàn)靠近非異常點(diǎn)教師信號分布,對未知數(shù)據(jù)無法得到確切的判斷方案。對于 和 也一樣, 計(jì)算結(jié)果呈現(xiàn)正態(tài)分布,異常與非異常點(diǎn)計(jì)算結(jié)果都是,很難獲得一個較高準(zhǔn)確率地檢測方案,數(shù)據(jù)較集中分布狀況一樣,無法很好分離開來, 同樣也出現(xiàn)分布狀況一樣地現(xiàn)象。究其34 原因,可能是 BP 結(jié)構(gòu)隱層單元過多,數(shù)據(jù)特性之間交叉特性太多,以使計(jì)算結(jié)果無法區(qū)分開來。 證明不是 BP 結(jié)構(gòu)問題,而是由于數(shù)據(jù)特征相似性太大,只有一兩個屬性相異來分類。對于大規(guī)模多特征地?cái)?shù)據(jù)集合,單純 BP 很難做出很好解決方案。通過在圖表中顯示地 coil2020 異常與非異常數(shù)據(jù),具有很高地相似性,只有小部分屬性分布不同,很難使用 bp 獲得很好地分離方案。 單位:橫軸表示順序,縱軸表示計(jì)算結(jié)果數(shù)值。 圖 測試訓(xùn)練收斂與否(每個點(diǎn)代表一個結(jié)果) 但是實(shí)驗(yàn) 卻有讓我們看到了希望,對于區(qū)別單一、兩類特征數(shù)據(jù),還 是具備相當(dāng)?shù)乜尚行?。試?yàn)中我們采用了兩類特征地隨機(jī)數(shù),得到了很好地區(qū)分度。根據(jù)數(shù)據(jù)分布,可以很好得到判斷方案??梢?BP 具備一定的分類器能力,采用多分類器方法對數(shù)據(jù)集合進(jìn)行學(xué)習(xí),還是具備一定地可行性。當(dāng)然實(shí)際應(yīng)用還會出現(xiàn)其他很多需要解決地問題。 通過實(shí)驗(yàn) 后面實(shí)驗(yàn)過程多特征地實(shí)驗(yàn)地經(jīng)歷,可以知道如果做分類器對待多特征可以采用多 BP 網(wǎng)絡(luò)學(xué)習(xí)。同時(shí)對于出現(xiàn)特征交叉的問題,比如數(shù)據(jù)組 A 的前幾個屬性和 B 數(shù)據(jù)組前幾個屬性一樣,然后最后屬性存在不同,屬于不同類(異常和非異常),對與這種情況很難處理。時(shí)間限制未作深入研 究。 35 總結(jié)與展望 綜上分析所述, BP 具備一定特征分類能力,但是要通過這種分類能力去做異常點(diǎn)檢測需要考慮很多因素,并且需要做很多輔助工作。特別是對于不同類數(shù)據(jù)而且特征較少數(shù)據(jù),難以分離區(qū)別。 假設(shè)應(yīng)用 BP 神經(jīng)網(wǎng)絡(luò)做異常點(diǎn)檢測,實(shí)際應(yīng)用則采用 BP 充當(dāng)分類器,并且根據(jù)特征采用多分類器結(jié)構(gòu),解決數(shù)據(jù)多特征問題。同時(shí)對于那些不同類而且是數(shù)據(jù)特征相似性較大(比如很多屬性處在相同空間范圍,局部屬性不同)則需要采用更多神經(jīng)網(wǎng)絡(luò)訓(xùn)練這些特征,以便分離,或者采用專家系統(tǒng)方式,對這些具備相似性較高而又不同類進(jìn)行量化可控地判斷。 同時(shí)對于超出已知范疇特性地?cái)?shù)據(jù),進(jìn)行保存處理,訓(xùn)練出新的神經(jīng)網(wǎng)絡(luò),同時(shí)通過人工專家系統(tǒng)進(jìn)行更新。這樣保證在可控范圍能得到更高準(zhǔn)確性。 同樣如果能夠有好地方案,能夠明顯獲得已知數(shù)據(jù)特征,并且能夠很好分離相近特征屬性的方案,那將是有很好速度檢測到異常數(shù)據(jù),同時(shí)配合專家決策系統(tǒng)能夠使結(jié)果更具實(shí)際地準(zhǔn)確性,而不是單純地?cái)?shù)據(jù)異常準(zhǔn)確性。當(dāng)然這建立在已知數(shù)據(jù)集合有足夠豐富特征。對于未知數(shù)據(jù)特征可以報(bào)警,通過人工干預(yù)使系統(tǒng)學(xué)習(xí)到新特征,或者自動控制地方法學(xué)習(xí)。 總地來說,使用神經(jīng)網(wǎng)絡(luò)分類,對于相似性比較高,差異集中在局部 特征的數(shù)據(jù),可以使用特征映射相關(guān)技術(shù)遺傳算法、啟發(fā)式搜索、特征隨機(jī)選取等得到這些特征差異。對于正常數(shù)據(jù)多特征地問題,特別是正常數(shù)據(jù)有多類數(shù)據(jù)的,可以采用多神經(jīng)網(wǎng)絡(luò)融合,即多神經(jīng)網(wǎng)絡(luò)記錄多特征。 36 37 參考文獻(xiàn) [1] Hawkins D. Identification of Outliers[M]. and hall. 1980. [2] Edwin M. Knorr, Raymond T. Ng, Vladimir Tucakov. DistanceBased Outlier:Algorithms Applications[J].(34):237253. [3] Edwin M. Knorr, Raymod T. Ng. Algorithms for Mining DistanceBased Outliers in Large Datasets[R]. Very Large Data Bases Conference :2427. [4] 王元明,熊偉 . 異常數(shù)據(jù)的檢測方法 [J]. 重慶工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)), 2020,第 23 卷: 8689. [5] 楊永銘,王喆 . 孤立點(diǎn)算法研究 [J]. 計(jì)算機(jī)與數(shù)字工程, 2020, 219 期: 1115. [6] Aleksandar Lazarevic, Vipin Kumar. Feature Bagging for Outlier Detection[C]. Proceedings of the eleventh ACM SIGKDD international conference on Knowledge discovery in data mining, Chicago, Illinois, USA, Pages: 157 166 . [7] Tom . 機(jī)器學(xué)習(xí) [M]. 北京:機(jī)械工業(yè)出版社, 2020: 6090. [8] Jiawei Han. 數(shù)據(jù)挖掘概念與技術(shù) [M]. 北京:機(jī)械工業(yè)出版社, 2020: 295301. [9] 馬少平,朱小燕 . 人工智能 [M]. 北京:清華出版社, 2020: 245268. [10] 彭清娥,曹叔尤,劉興年,黃爾,李昌志 . BP 算法中固定學(xué)習(xí)率 ? 的性能分析 [A].成都 :四川大學(xué)高速水力學(xué)國家重點(diǎn)實(shí)驗(yàn)室, 2020. [11] Stefano Melacci, Marco Maggini, Lorenzo Sarti. Semisupervised Clustering using Similarity Neural Networks[A]. Proceedings of International Joint Conference on Neural Networks[C], Atlanta, Geia, USA, June 1419, 2020. [12] 李炎,李皓 . 異常檢測算法分析 [J]. 計(jì)算機(jī)工程, 2020, 28(6):56,32. [13] 鄢團(tuán)軍 ,劉勇 . 孤立點(diǎn)檢測算法與應(yīng)用 [J]. 三峽大學(xué)學(xué)報(bào) (自然科學(xué)版) ,2020,31(1):98102. [14] 劉合兵 ,尚俊平 . 基于距離和密度的聚類和孤立檢測算法 [J]. 河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版 ), 2020, 38(3): 3840. [15] 張寧 . 離群點(diǎn)檢測算法研究 [J]. 桂林電子科技大學(xué)學(xué)報(bào) ,2020,29(1):2225. 38 39 致 謝 本論文是在我的指導(dǎo)老師王麗娟老師的親切關(guān)懷和悉心指導(dǎo)下完成的。她嚴(yán)肅的科學(xué)態(tài)度,嚴(yán)謹(jǐn)?shù)闹螌W(xué)精神,精益求精的工作作風(fēng),深深地感染和激勵這我。從題目的選擇到最終完成,王麗娟老師適中基于我細(xì)心的指導(dǎo)和不懈的支持。比如題 目開題研究前期,老師幫忙找了很多資料,并及時(shí)和我溝通,因?yàn)榍捌谠谕鈱?shí)習(xí),有時(shí)候老師還會打電話詢問具體進(jìn)度,并及時(shí)對出現(xiàn)問題進(jìn)行引導(dǎo)。后期實(shí)驗(yàn)出現(xiàn)了問題,在老師指導(dǎo)下才知道如何論證本算法地可行性,并支持了我設(shè)計(jì)上地一些問題。這些都給我很大地幫助。也是一步步支持我能夠圓滿結(jié)題地推動力。在此,感謝老師地辛勤付出!愿一切順利平安! 40
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1