freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

bp神經(jīng)網(wǎng)絡的異常點檢測應用可行性分析畢業(yè)論文-文庫吧在線文庫

2025-07-31 07:46上一頁面

下一頁面
  

【正文】 。單位:橫軸屬性順序,縱軸屬性數(shù)值。根據(jù)數(shù)據(jù)分布,和原來測試結果進行對照分析。下面為計算結果分布。(2) 接入神經(jīng)網(wǎng)絡對非異常數(shù)據(jù)進行訓練。 隨機數(shù)訓練完后神經(jīng)網(wǎng)絡與訓練數(shù)據(jù)計算結果,。總體呈現(xiàn)靠近非異常點教師信號分布,對未知數(shù)據(jù)無法得到確切的判斷方案。試驗中我們采用了兩類特征地隨機數(shù),得到了很好地區(qū)分度。特別是對于不同類數(shù)據(jù)而且特征較少數(shù)據(jù),難以分離區(qū)別??偟貋碚f,使用神經(jīng)網(wǎng)絡分類,對于相似性比較高,差異集中在局部特征的數(shù)據(jù),可以使用特征映射相關技術遺傳算法、啟發(fā)式搜索、特征隨機選取等得到這些特征差異。這些都給我很大地幫助。她嚴肅的科學態(tài)度,嚴謹?shù)闹螌W精神,精益求精的工作作風,深深地感染和激勵這我。這樣保證在可控范圍能得到更高準確性。,可以知道如果做分類器對待多特征可以采用多BP網(wǎng)絡學習。對于大規(guī)模多特征地數(shù)據(jù)集合,單純BP很難做出很好解決方案。可以明顯區(qū)分開發(fā)來。(單位:縱軸屬性值,橫軸順序表示屬性順序,同一種圖形表示一組數(shù)據(jù))注:。本實驗BP結構采用隱層5個神經(jīng)元,輸出層一個。實驗方式,調整隱層神經(jīng)單元個數(shù)125分別做一次,每次訓練完的權值去計算測試數(shù)據(jù)庫,然后通過已知結果,統(tǒng)計異常點與非異常在0到1之間的分布情況,看是否有區(qū)分度較高地方案。(2)BP結構過擬化。,BP2為異常點特性,證明正常數(shù)據(jù)有很大一部分特征與異常數(shù)據(jù)特征有交集。訓練準備:,前85個屬性為訓練輸入,第86個為訓練用教師信號。第二次訓練把非異常數(shù)據(jù)都集中在兩次教師信號中間。實驗觀察:測試數(shù)據(jù)庫獨個輸進BP1計算。第四,訓練順序導致。實驗訓練數(shù)據(jù)庫100與4000組數(shù)據(jù)做兩兩訓練還有4000組與4000組數(shù)據(jù)訓練。 5實驗研究在嘗試各種算法方案地研究中,使用的數(shù)據(jù)庫名稱:The Insurance Company Benchmark (COIL 2000).關于保險的數(shù)據(jù),其中包括:,訓練數(shù)據(jù),5822組數(shù)據(jù),每組86個屬性,第86個為是否異常的標志變量,總地為兩類數(shù)據(jù);TICEVAL2000,測試數(shù)據(jù),4000組,每組為85個特征屬性;,與ticeval2000對應組地結果。輸入隱層輸出層圖 BP結構輸入層為一組數(shù)據(jù),全連接到隱層,隱層計算輸出受擠壓函數(shù)處理后的數(shù)值,輸出層的輸入為隱層輸出。然而,對sigmoid單元,閾值輸出是輸入的連續(xù)函數(shù)。BP神經(jīng)網(wǎng)絡模型是人工神經(jīng)網(wǎng)絡的重要模型之一,應用尤為廣泛。(3)高度并行性。同時根據(jù)已知數(shù)據(jù)訓練修改這些權值,使其具有識別某種組合特征的能力。以便全局統(tǒng)籌決策較容易。本文的方向是從特征出發(fā)研究。在聚類算法中,異常點檢測僅僅是聚類的副產(chǎn)品。(1) 序列異常技術:Aming和Argrawal 提出一種序列異常(sequential exception)的概念。這種方法主要是引入局部稀疏系數(shù)(LSC)這一概念,根據(jù)每個對象的LSC值按從大到小的順序排列整個數(shù)據(jù)集并把前n個對象作為異常點。(5)Breuning 提出了局部異常的概念及相應異常檢測方法(DBOM算法),即數(shù)據(jù)集中的每個對象的異常程度用局部異常因子LOF來衡量?;诿芏鹊漠惓|c檢測,就是探測局部密度,通過不同的密度估計策略來檢測異常點。(1) 在理論上可以處理任意維任意類型的數(shù)據(jù),這就克服了基于統(tǒng)計方法僅能檢測單個屬性的缺點。但它也有自身缺陷,就是要計算數(shù)據(jù)集中所有點的,這顯然影響到算法的效率。此算法需要將數(shù)據(jù)空間分隔成彼此獨立的單元結構,經(jīng)過多次選擇來判斷離群數(shù)據(jù)?;谒饕姆椒ㄒ蕾嚩嗑S索引結構(Rtrees,X trees,KD tress等)的性能。其次,此方法在很大程度上依賴于待挖掘的數(shù)據(jù)集是否滿足某種概率分布模型、模型的參數(shù)、異常點的數(shù)目等對基于統(tǒng)計的方法都有非常重要的意義,而確定這些參數(shù)通常比較困難;另外,此方法大多適合于挖掘單變量的數(shù)值型數(shù)據(jù),然而許多數(shù)據(jù)挖掘問題要求在多維空間中發(fā)現(xiàn)異常點,目前幾乎沒有多元的不一致檢驗,當沒有特定的檢驗時,或觀察到的分布不能恰當?shù)赜萌魏螛藴实姆植冀r,此類方法不能確保所有的異常點被發(fā)現(xiàn)。BP神經(jīng)網(wǎng)絡適用于儲存和描述這種復雜的關系。異常點可能由于度量或執(zhí)行錯誤產(chǎn)生,也可能是由于固有數(shù)據(jù)可變性的結果。但是BP算法進行實際數(shù)據(jù)的異常點數(shù)據(jù)挖掘過程中存在:實際數(shù)據(jù)的維數(shù)較高,存在冗余特征的干擾,以及在高維特征下,數(shù)據(jù)量不充分的問題。因此,異常點檢測被廣泛應用于網(wǎng)絡入侵檢測,金融保險,天氣預報以及新藥研制等領域。 AbstractOutlier data is the data set different data. This part of the small amount of data, but for our daily production and life of great. Therefore, the anomaly detection is widely used in network intrusion detection, finance, insurance, weather, and new drug development and other fields. Relative to the large number of normal data mining, the anomaly detection model is called data mining small. BP algorithm is a monly used data mining algorithm. But the BP algorithm to real data outliers exist in the data mining process: the higher the dimension of the actual data, there are redundant features of the interference, and highdimensional feature, the issue of inadequate data. Therefore, this paper analyzes a variety of BP neural network processing of data, and to get the following results. (1) BP neural network can better separation characteristics of a single simulation data。目前異常點檢測已經(jīng)開始用于信用卡欺詐、網(wǎng)絡入侵檢測以及金融申請和交易欺詐等領域[2],近年來異常點檢測已成為數(shù)據(jù)挖掘研究中的一個熱點問題?;谏疃确椒ㄖ饕杂嬎銕缀螢榛A,通過計算不同層的KD凸包將外層的對象判定為異常點。基于距離方法最早是由Knorr和Ng在1998年提出的。它的時間復雜度為,其中取決于單元的個數(shù)和維數(shù)。如果對數(shù)據(jù)對象根據(jù)它們的距離進行排序,那么前n個點就被看作異常點。使得算法性能有所提高。局部異常觀點摒棄了以前所有的異常定義中非此即彼的絕對異常觀念,更加符合現(xiàn)實生活的中的應用。 (3)Papadimitriou定義了多粒度偏離系數(shù)(Multi—Granularity Deviation Factor,簡稱MDEF),該算法將多粒度偏離系數(shù)是所在鄰域的標準多粒度偏離系數(shù)的3倍的點判定為異常點,然而標準多粒度偏離系數(shù)的計算量大,對算法的可行性有一定的限制。文獻有關發(fā)面對LOF進行推廣:一是由原來的一個鄰域的變化為兩個(計算密度領域和比較密度領域);二是剪除非異常對象來減小計算代價;因此,使用算法比傳統(tǒng)的LOF算法有所提高。背離這種描述的對象認為是異常點。此方法由于搜索空間很大,人工探測非常困難。Hongyi Zhang等引為了提高模糊核聚類算法的運行效率,提出了新的模糊核聚類算法,該算法用先驗知識對參數(shù)初始化。例如檢測是否是糖尿病人的數(shù)據(jù)庫,三十歲以下這個年齡維度上病人較少,然而五十歲后這個維度病人比例就多了。 樣例圖示,某個異常點可能異常特征是屬性1,可能是屬性屬性2地組合,對于同個數(shù)據(jù)庫不同點具有組合不確定性。(2)非線性特性。因為這些特點,神經(jīng)網(wǎng)絡廣泛應用在聚類分析、模式識別、信號處理、系統(tǒng)辨識、優(yōu)化計算、預測控制等領域。輸出層節(jié)點輸入,輸出分別為: () 若令,則有: () 修正權值設 其中為第p個學習樣本產(chǎn)生的輸出誤差,為總誤差。也叫擠壓函數(shù)。(2)調節(jié)權值的公式為: () 其中為學習步長,取正參數(shù),代表上一層神經(jīng)元的輸出,而有兩種情況:1) 如果j是輸出層(第m層)的神經(jīng)元,則 () 2) 如果j不在輸出層,而是隱含層的神經(jīng)元,則
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1