freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

bp神經(jīng)網(wǎng)絡(luò)的異常點(diǎn)檢測(cè)應(yīng)用可行性研究畢業(yè)論文-免費(fèi)閱讀

  

【正文】 比如題目開(kāi)題研究前期,老師幫忙找了很多資料,并及時(shí)和我溝通,因?yàn)榍捌谠谕鈱?shí)習(xí),有時(shí)候老師還會(huì)打電話詢問(wèn)具體進(jìn)度,并及時(shí)對(duì)出現(xiàn)問(wèn)題進(jìn)行引導(dǎo)。當(dāng)然這建立在已知數(shù)據(jù)集合有足夠豐富特征。時(shí)間限制未作深入研究。單位:橫軸表示順序,縱軸表示計(jì)算結(jié)果數(shù)值。在本實(shí)驗(yàn)過(guò)程中同時(shí)進(jìn)行了不同數(shù)據(jù)集合地實(shí)驗(yàn),多屬性特征穿插混淆,總體能夠的到穩(wěn)定結(jié)果,多屬性特征則比較不穩(wěn)定。每一組數(shù)據(jù)由一種圖形構(gòu)成。(1) 生成隨機(jī)數(shù)據(jù)。分別把隱層單元改為125分別按實(shí)驗(yàn)三方案做實(shí)驗(yàn)。 對(duì)上面三個(gè)實(shí)驗(yàn)地隱層進(jìn)行調(diào)整,主要分別取5個(gè)、15個(gè)、25個(gè)隱層單元進(jìn)行訓(xùn)練測(cè)試。即分布一樣,無(wú)法區(qū)分異常與異常與否。流程:(1)第一組數(shù)據(jù)單個(gè)輸入BP1訓(xùn)練,保存相應(yīng)BP1權(quán)值,ticdata2000正常數(shù)據(jù)訓(xùn)練;(2)第二組數(shù)據(jù)單個(gè)輸入BP2訓(xùn)練,保存BP2權(quán)值,ticdata2000異常數(shù)據(jù)訓(xùn)練;測(cè)試方法:通過(guò)測(cè)試地兩個(gè)數(shù)據(jù)庫(kù),輸?shù)接?xùn)練后地兩個(gè)神經(jīng)網(wǎng)絡(luò),同時(shí)借助已知數(shù)據(jù)捕獲有用數(shù)據(jù)進(jìn)行分析。解決方案,找一種訓(xùn)練方法讓異常非異常點(diǎn)往不同方向逼近,并使其不互相影響。數(shù)據(jù)主要疊加在兩個(gè)教師信號(hào)數(shù)值之間,難以區(qū)分。:用單個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)庫(kù)整體特性進(jìn)行學(xué)習(xí)實(shí)驗(yàn)設(shè)計(jì)思路:為避免上述問(wèn)題,改變訓(xùn)練順序和訓(xùn)練方法,單組數(shù)據(jù)輸入單個(gè)bp神經(jīng)網(wǎng)絡(luò)。輸出結(jié)果的所有數(shù)據(jù),在0到1區(qū)間之間,不管相似不相似都集中分布在靠近0,沒(méi)有區(qū)分度,不能明顯表示相似與否地概念。采用表示X與Y兩者相似性差異。隱層輸出層的神經(jīng)元,其他權(quán)值都初始化:(double) ((rand()/)*21);隨機(jī)數(shù)種子為系統(tǒng)時(shí)間。 ()其中: ()經(jīng)常被稱為sigmoid函數(shù)或者也可以稱為logistic函數(shù)。設(shè)輸入層節(jié)點(diǎn)數(shù)為n,隱含層節(jié)點(diǎn)數(shù)為r,輸出層節(jié)點(diǎn)數(shù)為m,隱含層與輸入層之間的權(quán)值矩陣為,隱含層節(jié)點(diǎn)閥值為,輸出層與隱含層之間權(quán)值矩陣為,輸出層節(jié)點(diǎn)閥值為,并設(shè)有N個(gè)學(xué)習(xí)樣本其中為第P個(gè)學(xué)習(xí)樣本的輸入向量,為其實(shí)際輸出向量。(4)良好的容錯(cuò)性與聯(lián)想記憶功能。人工神經(jīng)網(wǎng)絡(luò)作為一種新型信息處理系統(tǒng),在信息處理方面,具有如下顯著的特點(diǎn):(1)輸入輸出映射能力。異常或者非異常,可以通過(guò)趨向某個(gè)數(shù)值表示特征異常,另一個(gè)方向數(shù)值表示非異常。而本文直接從已知部分?jǐn)?shù)據(jù)維度的特征著手,即是直接從每一組數(shù)據(jù)的特征來(lái)研究。Su等人首先提出基于聚類的異常點(diǎn)檢測(cè)算法,聚集的較小簇被認(rèn)為是異常點(diǎn),但這中方法忽略了小聚集簇和大聚集簇之間的距離,當(dāng)一個(gè)小聚集簇和一個(gè)大聚集簇非常接近的時(shí)候,小聚集簇中的這些點(diǎn)更可能是大聚集簇的邊界點(diǎn)而不是異常點(diǎn)。但是并沒(méi)有得到普遍的認(rèn)同,這是因?yàn)樾蛄挟惓T诟拍钌嫌幸欢ǖ娜毕?,它?duì)異常點(diǎn)存在的假設(shè)太過(guò)理想化,對(duì)現(xiàn)實(shí)復(fù)雜數(shù)據(jù)效果不太好。另外,岳峰等利用反向K近鄰(RKNN)這個(gè)概念提出了一個(gè)異常點(diǎn)檢測(cè)算法(ODRKNN),在綜合數(shù)據(jù)集和正式數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)構(gòu)表明,該算法能有效地檢測(cè)出異常點(diǎn),且算法效率高于典型的基于密度的異常點(diǎn)檢測(cè)算法LOF和LSC的效率。一個(gè)對(duì)象領(lǐng)域內(nèi)的密度可以用包含固定結(jié)點(diǎn)個(gè)數(shù)的域半徑指定半徑領(lǐng)域中包含的結(jié)點(diǎn)數(shù)來(lái)描述。(1) Brito等提出相互k近鄰圖(Mutual k—Nearest Neighbor,簡(jiǎn)稱MkNN)算法,其主要思想是對(duì)每個(gè)連通子圖進(jìn)行檢測(cè),如果包含多個(gè)結(jié)點(diǎn)就組成一個(gè)簇,如果僅有一個(gè)結(jié)點(diǎn),那么該結(jié)點(diǎn)就是異常點(diǎn)。實(shí)際上在給出了距離的度量,并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后。Bay和Sc hwabacher在沿用Rastogi和Ramaswamy對(duì)于異常定義的基礎(chǔ)上,提出了一種基于隨機(jī)抽樣的檢測(cè)方法,它通過(guò)隨機(jī)抽樣的方法,減少了尋找k近鄰的范圍,在試驗(yàn)數(shù)據(jù)上獲得了幾乎線性的計(jì)算復(fù)雜度。后來(lái),Rastogi和Ramaswamy提出了一個(gè)新的基于距離的異常點(diǎn)定義,即基于距離的第最近鄰(kth Nearest Neighbor)異常點(diǎn)挖掘方法。NL算法可以避免構(gòu)建索引結(jié)構(gòu),減少了算法的次數(shù)。通常這類異常被描述為。 傳統(tǒng)已有異常點(diǎn)算法介紹早期的異常點(diǎn)檢測(cè)算法大多數(shù)是基于統(tǒng)計(jì)學(xué)實(shí)現(xiàn)的,通??梢苑譃榛诜植嫉臋z測(cè)算法和基于深度的檢測(cè)算法兩類。許多數(shù)據(jù)挖掘算法試圖減少異常點(diǎn)的對(duì)挖掘結(jié)果的影響,或者在挖掘過(guò)程中排除異常點(diǎn)。(1)BP神經(jīng)網(wǎng)絡(luò)能夠較好的分離特征單一的仿真數(shù)據(jù);但是(2)特征相似性較大的數(shù)據(jù)集,難以分離判斷;(3)正常數(shù)據(jù)不充分或者不具有代表性,因此正常數(shù)據(jù)類學(xué)習(xí)不充分,從而導(dǎo)致異常無(wú)法判斷。本科畢業(yè)設(shè)計(jì)(論文) BP神經(jīng)網(wǎng)絡(luò)的異常點(diǎn)檢測(cè)應(yīng)用可行性研究 摘 要異常點(diǎn)數(shù)據(jù)是指數(shù)據(jù)集中與眾不同數(shù)據(jù)。針對(duì)以上問(wèn)題,本文提出了以下的改進(jìn)措施:(1)BP算法前進(jìn)行特征約簡(jiǎn)(映射)從中選取有益于異常檢測(cè)的特征(2)多神經(jīng)網(wǎng)絡(luò)融合,不同神經(jīng)網(wǎng)絡(luò)識(shí)別不同的特征,相互取長(zhǎng)補(bǔ)短,融合后得到最終的結(jié)果。然而異常點(diǎn)可能隱藏著重要的信息,也許比一般的數(shù)據(jù)更有價(jià)值。前者一般通過(guò)先構(gòu)造一個(gè)標(biāo)準(zhǔn)概率分布來(lái)擬合數(shù)據(jù)集,然后根據(jù)概率分布來(lái)確定異常點(diǎn),例如Rosner提出的單樣本多個(gè)異常檢測(cè)算法ESD算法,和Yamnishi等使用混合高斯模型的異常點(diǎn)檢測(cè)算法。當(dāng)且僅當(dāng)數(shù)據(jù)集中至少有個(gè)數(shù)據(jù)點(diǎn)與點(diǎn)的距離大于時(shí),數(shù)據(jù)對(duì)象點(diǎn)稱為異常點(diǎn)。以上兩方法的算法時(shí)間復(fù)雜度為,當(dāng)遇到大量數(shù)據(jù)集時(shí)它們還有待改進(jìn)。給定維空間中包含個(gè)點(diǎn)的數(shù)據(jù)集、參數(shù)和 (自然數(shù)),表示點(diǎn)和它的第最近鄰的距離。隨著人們對(duì)基于距離的方法的不斷研究,一些新的、較好的算法也不斷的涌現(xiàn)?;诿芏确椒ㄊ窃诨诰嚯x的方法上改進(jìn)而來(lái)。該算法針對(duì)數(shù)據(jù)點(diǎn)的分布對(duì)各種特殊形狀都有效,但算法執(zhí)行效率不高。這樣就不會(huì)像DB(p,d)異常點(diǎn)那樣遺漏一部分異常點(diǎn)?;谄畹漠惓|c(diǎn)檢測(cè)不使用統(tǒng)計(jì)檢驗(yàn)或者基于距離的度量來(lái)識(shí)別異常對(duì)象。(2) OLAP數(shù)據(jù)立方體技術(shù):,該單元被認(rèn)為是一個(gè)異常。模糊k均值聚類算法(FCM)常用于異常點(diǎn)檢測(cè),該算法動(dòng)態(tài)地分配權(quán)重給每一個(gè)數(shù)據(jù)點(diǎn),權(quán)重表示該數(shù)據(jù)點(diǎn)和數(shù)據(jù)集中心之間的距離,通過(guò)各點(diǎn)的權(quán)重來(lái)判斷異常點(diǎn)。對(duì)于單屬性特征的情況,根據(jù)數(shù)據(jù)重要性調(diào)整特征(即維度)權(quán)值,并根據(jù)數(shù)據(jù)重要性調(diào)整。有時(shí)候數(shù)據(jù)組合的重要性是體現(xiàn)在幾個(gè)數(shù)據(jù)地組合里面,既可能體現(xiàn)在幾個(gè)屬性上面,比如說(shuō)一組數(shù)組(A,B,C),可能AB組合特征不顯示異常,然而ABC組合就顯示異常,這些組合是不定地。人工神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)能力,通過(guò)學(xué)習(xí),能夠根據(jù)網(wǎng)絡(luò)期望輸出和網(wǎng)絡(luò)實(shí)際輸出之差來(lái)調(diào)整神經(jīng)元間連接權(quán)值和閾值,直至使實(shí)際輸出與期望輸出之間的誤差減小到滿意的程度,這樣就實(shí)現(xiàn)了輸入到輸出的映射。人工神經(jīng)網(wǎng)絡(luò)通過(guò)自身的網(wǎng)絡(luò)結(jié)構(gòu)能夠?qū)崿F(xiàn)對(duì)信息的記憶,而所記憶的信息是存儲(chǔ)在神經(jīng)元之間的權(quán)值中。其中,下文中如不指明則相同。注意它的輸出范圍為0到1,隨輸入單調(diào)遞增。訓(xùn)練教師信號(hào),按具體方案處理設(shè)定。在神經(jīng)網(wǎng)絡(luò)則表示為兩者整體特征差異大小。然后又對(duì)測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)庫(kù),進(jìn)行相似性求和,對(duì)比測(cè)試數(shù)據(jù)中異常點(diǎn)與非異常點(diǎn)與訓(xùn)練數(shù)據(jù)庫(kù)地相似性和,依然沒(méi)有區(qū)分度。為盡量得出可區(qū)分地?cái)?shù)據(jù),強(qiáng)化局部異常點(diǎn)特性。實(shí)驗(yàn)結(jié)果失敗。:多神經(jīng)網(wǎng)絡(luò)各種形式訓(xùn)練及其決策用一個(gè)神經(jīng)網(wǎng)絡(luò)表示異常點(diǎn)地特征,教師信號(hào)1;用另一個(gè)異常點(diǎn)表示非異常點(diǎn)地特征。觀察測(cè)試數(shù)據(jù)庫(kù)計(jì)算分布結(jié)果分布情況,并統(tǒng)計(jì)分布情況(. )。(1)可能是數(shù)據(jù)特征疊加問(wèn)題,異常與分異常具有很強(qiáng)地交叉特征。 實(shí)驗(yàn)方式主要通過(guò)對(duì)訓(xùn)練數(shù)據(jù)庫(kù)地訓(xùn)練,然后采用測(cè)試數(shù)據(jù)庫(kù)進(jìn)行測(cè)試統(tǒng)計(jì),實(shí)驗(yàn)一方案采用組測(cè)試數(shù)據(jù)與原訓(xùn)練數(shù)據(jù)庫(kù)4000組兩兩計(jì)算,然后求和,結(jié)果為與元數(shù)據(jù)庫(kù)整體相異地程度。4000組測(cè)試數(shù)據(jù)。先生成20組數(shù)據(jù),17組正常數(shù)據(jù),3組異常。17,18,19為異常數(shù)據(jù)。 根據(jù)上面實(shí)驗(yàn),總地來(lái)說(shuō)在實(shí)際異常點(diǎn)檢測(cè)上面,單純BP神經(jīng)網(wǎng)未能達(dá)到預(yù)期異常點(diǎn)檢測(cè)地效果,不管異常非異常在訓(xùn)練后,計(jì)算結(jié)果分布都呈現(xiàn)難以區(qū)分判斷地現(xiàn)象。 測(cè)試訓(xùn)練收斂與否(每個(gè)點(diǎn)代表一個(gè)結(jié)果),對(duì)于區(qū)別單一、兩類特征數(shù)據(jù),還是具備相當(dāng)?shù)乜尚行浴?偨Y(jié)與展望綜上分析所述,BP具備一定特征分類能力,但是要通過(guò)這種分類能力去做異常點(diǎn)檢測(cè)需要考慮很多因素,并且需要做很多輔助工作。對(duì)于未知數(shù)據(jù)特征可以報(bào)警,通過(guò)人工干預(yù)使系統(tǒng)學(xué)習(xí)到新特征,或者自動(dòng)控制地方法學(xué)習(xí)。后期實(shí)驗(yàn)出現(xiàn)了問(wèn)題,在老師指導(dǎo)下才知道如何論證本算法地可行性,并支持了我設(shè)計(jì)上地一些問(wèn)題。從題目的選擇到最終完成,王麗娟老師適中基于我細(xì)心的指導(dǎo)和不懈的支持。同樣如果能夠有好地方案,能夠明顯獲得已知數(shù)據(jù)特征,并且能夠很好分離相近特征屬性的方案,那將是有很好速度檢測(cè)到異常數(shù)據(jù),同時(shí)配合專家決策系統(tǒng)能夠使結(jié)果更具實(shí)際地準(zhǔn)確性,而不是單純地?cái)?shù)據(jù)異常準(zhǔn)確性。同時(shí)對(duì)于出現(xiàn)特征交叉的問(wèn)題,比如數(shù)據(jù)組A的前幾個(gè)屬性和B數(shù)據(jù)組前幾個(gè)屬性一樣,然后最后屬性存在不同,屬于不同類(異常和非異常),對(duì)與這種情況很難處理。通過(guò)在圖表中顯示地coil2000異常與非異常數(shù)據(jù),具有很高地相似性,只有小部分屬性分布不同,很難使用bp獲得很好地分離方案。證明BP具備一定數(shù)據(jù)特征篩選能力???0組,17組正常數(shù)據(jù),3組異常。出于簡(jiǎn)
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1