freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

廣東工業(yè)大學(xué)本科論文模板-wenkub

2022-08-31 04:13:14 本頁面
 

【正文】 a, but for our daily production and life of great. Therefore, the anomaly detection is widely used in network intrusion detection, finance, insurance, weather, and new drug development and other fields. Relative to the large number of normal data mining, the anomaly detection model is called data mining small. BP algorithm is a monly used data mining algorithm. But the BP algorithm to real data outliers exist in the data mining process: the higher the dimension of the actual data, there are redundant features of the interference, and highdimensional feature, the issue of inadequate data. Therefore, this paper analyzes a variety of BP neural network processing of data, and to get the following results. (1) BP neural network can better separation characteristics of a single simulation data。例如,一個(gè)公司首席執(zhí)行官的工資自然遠(yuǎn)遠(yuǎn)高于公司其他雇員的工資,成為一個(gè)異常點(diǎn)。目前異常點(diǎn)檢測已經(jīng)開始用于信用卡欺詐、網(wǎng)絡(luò)入侵檢測以及金融申請和交易欺詐等領(lǐng)域[2],近年來異常點(diǎn)檢測已成為數(shù)據(jù)挖掘研究中的一個(gè)熱點(diǎn)問題。但是異常檢測過程,通常數(shù)據(jù)的位數(shù)較高,在高維特征存在冗余特征干擾,以及高維特征下數(shù)據(jù)不充分的問題,因此,本文研究了BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于不同情況?;谏疃确椒ㄖ饕杂?jì)算幾何為基礎(chǔ),通過計(jì)算不同層的KD凸包將外層的對象判定為異常點(diǎn)。基于距離的異常點(diǎn)檢測算法的基本思想是把數(shù)據(jù)點(diǎn)看作空間中的點(diǎn),異常點(diǎn)被定義為與大多數(shù)數(shù)據(jù)距離較遠(yuǎn)的點(diǎn)?;诰嚯x方法最早是由Knorr和Ng在1998年提出的。隨著維數(shù)的增加,所有的索引結(jié)構(gòu)的性能迅速下降,使得算法性能不佳。它的時(shí)間復(fù)雜度為,其中取決于單元的個(gè)數(shù)和維數(shù)。對于參數(shù)的每個(gè)變化都需要調(diào)整單元結(jié)構(gòu),因此會影響了算法的結(jié)果。如果對數(shù)據(jù)對象根據(jù)它們的距離進(jìn)行排序,那么前n個(gè)點(diǎn)就被看作異常點(diǎn)。對低維空間的數(shù)據(jù)此方法優(yōu)于索引算法和NL算法,但對于高維數(shù)據(jù)此算法性能不高。使得算法性能有所提高。(2) 不必對數(shù)據(jù)集的相關(guān)信息(數(shù)據(jù)服從哪種統(tǒng)計(jì)分布模型,數(shù)據(jù)類型特點(diǎn)等)足夠了解。局部異常觀點(diǎn)摒棄了以前所有的異常定義中非此即彼的絕對異常觀念,更加符合現(xiàn)實(shí)生活的中的應(yīng)用。代表性算法主要有以下幾種。 (3)Papadimitriou定義了多粒度偏離系數(shù)(Multi—Granularity Deviation Factor,簡稱MDEF),該算法將多粒度偏離系數(shù)是所在鄰域的標(biāo)準(zhǔn)多粒度偏離系數(shù)的3倍的點(diǎn)判定為異常點(diǎn),然而標(biāo)準(zhǔn)多粒度偏離系數(shù)的計(jì)算量大,對算法的可行性有一定的限制。也就是說是否是異常點(diǎn)不僅僅取決于它與周圍數(shù)據(jù)的距離大小,而且與鄰域內(nèi)的密度情況有關(guān)。文獻(xiàn)有關(guān)發(fā)面對LOF進(jìn)行推廣:一是由原來的一個(gè)鄰域的變化為兩個(gè)(計(jì)算密度領(lǐng)域和比較密度領(lǐng)域);二是剪除非異常對象來減小計(jì)算代價(jià);因此,使用算法比傳統(tǒng)的LOF算法有所提高。但是,此方法在實(shí)際應(yīng)用中計(jì)算量亦是不小,效率有待提高。背離這種描述的對象認(rèn)為是異常點(diǎn)。這個(gè)算法復(fù)雜度與數(shù)據(jù)集大小呈線性關(guān)系,有優(yōu)異的計(jì)算性能。此方法由于搜索空間很大,人工探測非常困難。聚類算法發(fā)展方向是優(yōu)化聚類過程,而不是提高對異常點(diǎn)檢測的能力,異常點(diǎn)檢測和聚類是兩個(gè)相對立的過程,聚類是把屬于統(tǒng)一類的數(shù)據(jù)點(diǎn)聚集在一起,歸為一類,而異常點(diǎn)檢測是把和大多數(shù)數(shù)據(jù)點(diǎn)相異的點(diǎn)挖掘出來。Hongyi Zhang等引為了提高模糊核聚類算法的運(yùn)行效率,提出了新的模糊核聚類算法,該算法用先驗(yàn)知識對參數(shù)初始化。傳統(tǒng)算法從整個(gè)數(shù)據(jù)集合在空間中分布地特性出發(fā)研究,比如距離的從整個(gè)數(shù)據(jù)集空間距離進(jìn)行研究,同樣密度的按數(shù)據(jù)集空間密度研究,聚類也是按數(shù)據(jù)集空間特性。例如檢測是否是糖尿病人的數(shù)據(jù)庫,三十歲以下這個(gè)年齡維度上病人較少,然而五十歲后這個(gè)維度病人比例就多了。設(shè)X為一組數(shù)據(jù)集合,可使趨向某個(gè)數(shù)值,表示這組數(shù)據(jù)某個(gè)總體特征。 樣例圖示,某個(gè)異常點(diǎn)可能異常特征是屬性1,可能是屬性屬性2地組合,對于同個(gè)數(shù)據(jù)庫不同點(diǎn)具有組合不確定性。使其自學(xué)習(xí)特征,自動控制調(diào)整權(quán)值及權(quán)值組合。(2)非線性特性。人工神經(jīng)網(wǎng)絡(luò)是由許多相同的簡單處理單元并聯(lián)組合而成,具有高度并行性特性,使其對特定任務(wù)的計(jì)算變得很快,對信息的處理能力與效果驚人,因此提供了一種解決高層復(fù)雜問題的能力和方法。因?yàn)檫@些特點(diǎn),神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用在聚類分析、模式識別、信號處理、系統(tǒng)辨識、優(yōu)化計(jì)算、預(yù)測控制等領(lǐng)域。BP算法主要包括兩個(gè)過程,一是由學(xué)習(xí)樣本、網(wǎng)絡(luò)權(quán)值從輸入層→隱含層→輸出層逐次算出各層節(jié)點(diǎn)的輸出;二是反過來由計(jì)算輸出與實(shí)際輸出偏差構(gòu)出的誤差函數(shù)E(),用梯度下降法調(diào)節(jié)網(wǎng)絡(luò)權(quán)值,即 ()使誤差減小。輸出層節(jié)點(diǎn)輸入,輸出分別為: () 若令,則有: () 修正權(quán)值設(shè) 其中為第p個(gè)學(xué)習(xí)樣本產(chǎn)生的輸出誤差,為總誤差。更精確地講,sigmoid單元這樣計(jì)算輸出。也叫擠壓函數(shù)。最后輸出0到1的數(shù)值。(2)調(diào)節(jié)權(quán)值的公式為: () 其中為學(xué)習(xí)步長,取正參數(shù),代表上一層神經(jīng)元的輸出,而有兩種情況:1) 如果j是輸出層(第m層)的神經(jīng)元,則 () 2) 如果j不在輸出層,而是隱含層的神經(jīng)元,則 () 是該神經(jīng)元的輸出,而求本層的必須用到上一層的,可見誤差函數(shù)的求取是一個(gè)始于輸出層的反向傳播的遞歸過程。:把bp神經(jīng)網(wǎng)絡(luò)相似性代替距離算法相似度量起初思路是采用兩兩相似性地訓(xùn)練,然后得出一個(gè)整體數(shù)據(jù)庫屬性特征的神經(jīng)網(wǎng)絡(luò)。神網(wǎng)絡(luò)結(jié)構(gòu)大概如下:XY兩兩做差絕對值......輸入層 隱層 輸出層 注:每個(gè)方向箭頭抽象全連接圖 方案一圖隱層采用85個(gè)可微閾值單元,輸出采用一個(gè),網(wǎng)絡(luò)全連接。經(jīng)觀察驗(yàn)證,測試數(shù)據(jù)與已知數(shù)據(jù)地相似性與否沒法與測試計(jì)算結(jié)果數(shù)據(jù)存在必然地比例關(guān)系。經(jīng)過大量實(shí)驗(yàn),失敗原因:第一,bp處理輸出區(qū)分度不夠,難以有判斷方案。解決方法:第一種改變訓(xùn)練方案,改變判斷方案;第二種改變神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以便輸出數(shù)據(jù)區(qū)分度更高,便于區(qū)別異常非異常。然后再對異常點(diǎn)進(jìn)行訓(xùn)練,教師信號為1。整個(gè)數(shù)據(jù)庫的所有計(jì)算結(jié)果,不管異常點(diǎn)非異常點(diǎn)的計(jì)算結(jié)果,都在0到1這個(gè)區(qū)間內(nèi)呈現(xiàn)正態(tài)分布。根據(jù)實(shí)際數(shù)據(jù),越逼近1地越小于第二次訓(xùn)練地教師信號地,都為異常點(diǎn)。數(shù)據(jù)都呈現(xiàn)正態(tài)分布,不好處理,特別是兩個(gè)教師信號數(shù)值中間區(qū)間異常點(diǎn)與非異常點(diǎn)占自己比例都是很大,難以區(qū)分。.BP1隱層......X1X2Xn...異常與否BP2隱層 圖 訓(xùn)練方案圖 訓(xùn)練方案,把訓(xùn)練集合,分成兩個(gè)集合,一個(gè)為正常數(shù)據(jù)集合,一個(gè)異常。已知正常數(shù)據(jù)3762,異常238.,通過這個(gè)可以輔助分析。,正異常數(shù)據(jù)地實(shí)際輸出。:從上表可以推出,對于未知檢測數(shù)據(jù)輸入,呈現(xiàn)無法區(qū)分地現(xiàn)象。注:訓(xùn)練數(shù)據(jù)庫中的,每個(gè)點(diǎn)代表一個(gè)屬性值,橫軸代表屬性順序,縱軸代表屬性值.圖 單位:橫軸屬性順序,縱軸屬性數(shù)值。解決設(shè)想,減少隱層個(gè)數(shù),生成隨機(jī),空間具有兩類特征地?cái)?shù)據(jù)。一下摘取部分信息。實(shí)驗(yàn)計(jì)算結(jié)果: 5個(gè)隱層實(shí)驗(yàn)結(jié)果 單位:個(gè)數(shù)分區(qū)正常點(diǎn)分布62554610588400000異常點(diǎn)分布01472367100000(單位:縱軸個(gè)數(shù),)注:,橫軸表示0到1區(qū)間,縱軸表示個(gè)數(shù);系列1表示非異常點(diǎn)計(jì)算結(jié)果,系列2表示異常點(diǎn)計(jì)算結(jié)果 5個(gè)隱層實(shí)驗(yàn)結(jié)果 15個(gè)隱層實(shí)驗(yàn)結(jié)果 單位:個(gè)數(shù)分區(qū)正常點(diǎn)計(jì)算分布
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1