freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

bp神經(jīng)網(wǎng)絡(luò)的異常點檢測應(yīng)用可行性分析畢業(yè)論文-展示頁

2025-07-07 07:46本頁面
  

【正文】 低維空間的數(shù)據(jù)此方法優(yōu)于索引算法和NL算法,但對于高維數(shù)據(jù)此算法性能不高。相對于異常點挖掘,異常點挖掘方法人為干預(yù)的因素要小一些。如果對數(shù)據(jù)對象根據(jù)它們的距離進(jìn)行排序,那么前n個點就被看作異常點。給定維空間中包含個點的數(shù)據(jù)集、參數(shù)和 (自然數(shù)),表示點和它的第最近鄰的距離。對于參數(shù)的每個變化都需要調(diào)整單元結(jié)構(gòu),因此會影響了算法的結(jié)果。相對前兩者,基于單元的算法無論是在數(shù)據(jù)量還是在維數(shù)增加時,性能都是最好的。它的時間復(fù)雜度為,其中取決于單元的個數(shù)和維數(shù)。以上兩方法的算法時間復(fù)雜度為,當(dāng)遇到大量數(shù)據(jù)集時它們還有待改進(jìn)。隨著維數(shù)的增加,所有的索引結(jié)構(gòu)的性能迅速下降,使得算法性能不佳。與此 定 義 相應(yīng)的算法有三種,它們是基于索引(Indexbased)的算法,嵌套循環(huán)(NestLoop,NL)算法,基于單元或劃分(cellbased)的算法等。基于距離方法最早是由Knorr和Ng在1998年提出的。當(dāng)且僅當(dāng)數(shù)據(jù)集中至少有個數(shù)據(jù)點與點的距離大于時,數(shù)據(jù)對象點稱為異常點。基于距離的異常點檢測算法的基本思想是把數(shù)據(jù)點看作空間中的點,異常點被定義為與大多數(shù)數(shù)據(jù)距離較遠(yuǎn)的點?;诮y(tǒng)計的異常點檢測方法易于理解,實現(xiàn)方便,但此方法檢測出來的異常點很可能被不同的分布模型檢測出來,解釋異常點意義時經(jīng)常發(fā)生多義性。基于深度方法主要以計算幾何為基礎(chǔ),通過計算不同層的KD凸包將外層的對象判定為異常點。前者一般通過先構(gòu)造一個標(biāo)準(zhǔn)概率分布來擬合數(shù)據(jù)集,然后根據(jù)概率分布來確定異常點,例如Rosner提出的單樣本多個異常檢測算法ESD算法,和Yamnishi等使用混合高斯模型的異常點檢測算法。但是異常檢測過程,通常數(shù)據(jù)的位數(shù)較高,在高維特征存在冗余特征干擾,以及高維特征下數(shù)據(jù)不充分的問題,因此,本文研究了BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于不同情況。本文從特征與異常檢測的關(guān)系出發(fā)進(jìn)行研究。目前異常點檢測已經(jīng)開始用于信用卡欺詐、網(wǎng)絡(luò)入侵檢測以及金融申請和交易欺詐等領(lǐng)域[2],近年來異常點檢測已成為數(shù)據(jù)挖掘研究中的一個熱點問題。然而異常點可能隱藏著重要的信息,也許比一般的數(shù)據(jù)更有價值。例如,一個公司首席執(zhí)行官的工資自然遠(yuǎn)遠(yuǎn)高于公司其他雇員的工資,成為一個異常點。 (3) normal data is not sufficient or not representative, so the normal data class learning is not sufficient, leading to abnormal can not judge. To solve the above problem, this paper proposes the following improvements: (1) BP algorithm before feature reduction (map) benefit from anomaly detection features selected (2) integration of multiple neural networks, different neural network to recognize the different characteristics of each each other, the final fusion result.Key Words:OutliersData,BP,Algorithms,Neural Networks 目 錄1引言 1 1 傳統(tǒng)已有異常點算法介紹 1 1 2 3 5 62基于屬性特征在異常點檢測中的研究 73 BP神經(jīng)網(wǎng)絡(luò)介紹 9 9 9 修正權(quán)值 104 異常檢測中BP神經(jīng)網(wǎng)絡(luò)的設(shè)計 13 13 13 145實驗研究 17 17:把bp神經(jīng)網(wǎng)絡(luò)相似性代替距離算法相似度量 17:用單個神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)庫整體特性進(jìn)行學(xué)習(xí) 18:多神經(jīng)網(wǎng)絡(luò)各種形式訓(xùn)練及其決策 19 19 20 22 23 25 25 26 29 31 31 31 32 33 33總結(jié)與展望 35致謝 39 1引言異常點(離群點或者孤立點)檢測是數(shù)據(jù)挖掘中一個重要方面,Hawkins[1]最早給出了異常點的本質(zhì)定義:異常點是數(shù)據(jù)集中與眾不同地數(shù)據(jù),以至于使人懷疑這些數(shù)據(jù)并非隨機(jī)偏差,而是產(chǎn)生與完全不同的機(jī)制。 AbstractOutlier data is the data set different data. This part of the small amount of data, but for our daily production and life of great. Therefore, the anomaly detection is widely used in network intrusion detection, finance, insurance, weather, and new drug development and other fields. Relative to the large number of normal data mining, the anomaly detection model is called data mining small. BP algorithm is a monly used data mining algorithm. But the BP algorithm to real data outliers exist in the data mining process: the higher the dimension of the actual data, there are redundant features of the interference, and highdimensional feature, the issue of inadequate data. Therefore, this paper analyzes a variety of BP neural network processing of data, and to get the following results. (1) BP neural network can better separation characteristics of a single simulation data。針對以上問題,本文提出了以下的改進(jìn)措施:(1)BP算法前進(jìn)行特征約簡(映射)從中選取有益于異常檢測的特征(2)多神經(jīng)網(wǎng)絡(luò)融合,不同神經(jīng)網(wǎng)絡(luò)識別不同的特征,相互取長補(bǔ)短,融合后得到最終的結(jié)果。因此,本文分析BP神經(jīng)網(wǎng)絡(luò)處理各種數(shù)據(jù)的情況,并得到以下結(jié)果。BP算法是一種常用的數(shù)據(jù)挖掘算法。因此,異常點檢測被廣泛應(yīng)用于網(wǎng)絡(luò)入侵檢測,金融保險,天氣預(yù)報以及新藥研制等領(lǐng)域。本科畢業(yè)設(shè)計(論文) BP神經(jīng)網(wǎng)絡(luò)的異常點檢測應(yīng)用可行性研究 摘 要異常點數(shù)據(jù)是指數(shù)據(jù)集中與眾不同數(shù)據(jù)。這部分?jǐn)?shù)據(jù)的量小,但是對于我們的日常生產(chǎn)生活的影響極大。相對于大量的正常數(shù)據(jù)挖掘而言,異常點檢測被稱作小模式數(shù)據(jù)挖掘。但是BP算法進(jìn)行實際數(shù)據(jù)的異常點數(shù)據(jù)挖掘過程中存在:實際數(shù)據(jù)的維數(shù)較高,存在冗余特征的干擾,以及在高維特征下,數(shù)據(jù)量不充分的問題。(1)BP神經(jīng)網(wǎng)絡(luò)能夠較好的分離特征單一的仿真數(shù)據(jù);但是(2)特征相似性較大的數(shù)據(jù)集,難以分離判斷;(3)正常數(shù)據(jù)不充分或者不具有代表性,因此正常數(shù)據(jù)類學(xué)習(xí)不充分,從而導(dǎo)致異常無法判斷。關(guān)鍵字:異常,BP,異常點檢測,神經(jīng)網(wǎng)絡(luò)注:本設(shè)計(論文)題目來源于教師的國家級(或部級、省級、廳級、市級、校級、企業(yè))科研項目,項目編號為: 。 but (2) the characteristics of similar large data sets, separation is difficult to judge。異常點可能由于度量或執(zhí)行錯誤產(chǎn)生,也可能是由于固有數(shù)據(jù)可變性的結(jié)果。許多數(shù)據(jù)挖掘算法試圖減少異常點的對挖掘結(jié)果的影響,或者在挖掘過程中排除異常點。因此人們開始逐漸研究異常點挖掘算法。傳統(tǒng)數(shù)據(jù)挖掘主要有以下幾類:基于統(tǒng)計的方法,基于距離的方法,基于偏移方法,基于聚類方法,基于密度方法。BP神經(jīng)網(wǎng)絡(luò)適用于儲存和描述這種復(fù)雜的關(guān)系。 傳統(tǒng)已有異常點算法介紹早期的異常點檢測算法大多數(shù)是基于統(tǒng)計學(xué)實現(xiàn)的,通??梢苑譃榛诜植嫉臋z測算法和基于深度的檢測算法兩類。此類算法估計多維分布的概率模型的難度較大,且準(zhǔn)確性低。但當(dāng)數(shù)據(jù)集較大,此類方法在維數(shù)上的伸縮性不好。其次,此方法在很大程度上依賴于待挖掘的數(shù)據(jù)集是否滿足某種概率分布模型、模型的參數(shù)、異常點的數(shù)目等對基于統(tǒng)計的方法都有非常重要的意義,而確定這些參數(shù)通常比較困難;另外,此方法大多適合于挖掘單變量的數(shù)值型數(shù)據(jù),然而許多數(shù)據(jù)挖掘問題要求在多維空間中發(fā)現(xiàn)異常點,目前幾乎沒有多元的不一致檢驗,當(dāng)沒有特定的檢驗時,或觀察到的分布不能恰當(dāng)?shù)赜萌魏螛?biāo)準(zhǔn)的
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1