freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘可挖掘的知識(shí)類型-資料下載頁

2025-05-15 11:38本頁面
  

【正文】 掘可以利用統(tǒng)計(jì)學(xué)中的回歸方法,通過歷史數(shù)據(jù)直接產(chǎn)生連續(xù)的對(duì)未來數(shù)據(jù)的預(yù)測(cè)值;可以借助于經(jīng)典的統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)等技術(shù)。無論如何,經(jīng)典的統(tǒng)計(jì)學(xué)方法是挖掘預(yù)測(cè)知識(shí)的基礎(chǔ)。 20 時(shí)間序列 具有一個(gè)或多個(gè)時(shí)間屬性的預(yù)測(cè)應(yīng)用稱為時(shí)間序列問題 。時(shí)間序列是數(shù)據(jù)存在的特殊形式,序列的過去值會(huì)影響到將來值,這種影響的大小以及影響的方式可由時(shí)間序列中的趨勢(shì)周期及非平穩(wěn)等行為來刻畫。 例如:系統(tǒng)調(diào)用日志記錄了操作系統(tǒng)及其系統(tǒng)進(jìn)程調(diào)用的時(shí)間序列,通過對(duì)正常調(diào)用序列的學(xué)習(xí)可以預(yù)測(cè)隨后發(fā)生的系統(tǒng)調(diào)用序列、發(fā)現(xiàn)異常的調(diào)用。表 24給出了一個(gè)系統(tǒng)調(diào)用數(shù)據(jù)表。 這樣的數(shù)據(jù)源可以通過適當(dāng)?shù)臄?shù)據(jù)整理使之成為調(diào)用序列,如表 25,再通相應(yīng)的挖掘算法達(dá)到跟蹤和分析操作系統(tǒng)審計(jì)數(shù)據(jù)的目的。 21 時(shí)間序列 進(jìn)程號(hào) ( pro— id) 調(diào)用時(shí)間 ( call— time) 調(diào)用號(hào) ( call— id) 744 744 1069 9 1069 744 1069 9 1 04: 01: 10: 30 04: 01: 10: 31 04: 01: 10: 32 04: 01: 10: 34 04: 01: 10: 35 04: 01: 10: 38 04: 01: 10: 39 04: 01: 10: 40 23 14 4 24 5 81 62 16 進(jìn)程號(hào)( pro— id) 調(diào)用序列( call— sequence) 744 1069 9 ( 23, 14, 81) ( 14, 24, 16) ( 4, 5, 62) 表 24 系統(tǒng)進(jìn)程調(diào)用數(shù)據(jù)示例 表 25 系統(tǒng)調(diào)用序列數(shù)據(jù)表示例 22 偏差檢測(cè) ? 偏差檢測(cè)( deviation detection)就是對(duì)數(shù)據(jù)集中的偏差數(shù)據(jù)進(jìn)行檢測(cè)與分析 。 ? 在要處理的大量數(shù)據(jù)中,常常存在一些異常數(shù)據(jù),它們與其它的數(shù)據(jù)的一般行為或模型不一致。這里數(shù)據(jù)記錄就是偏差( deviation),也就是孤立點(diǎn) 。 ? 偏差包括很多潛在的知識(shí),如不滿足常規(guī)類的異常例子、分類中出現(xiàn)的反常實(shí)例、在不同時(shí)刻發(fā)生了顯著變化的某個(gè)對(duì)象或集合、觀察值與模型推測(cè)出的期望值之間有顯著差異的事例等。 ? 偏差的產(chǎn)生可能是某種數(shù)據(jù)錯(cuò)誤造成的,也可能是數(shù)據(jù)變異所固有的結(jié)果。從數(shù)據(jù)集中檢測(cè)出這些偏差很有意義,例如在欺詐探測(cè)中,偏差可能預(yù)示著欺詐行為。 23 偏差檢測(cè) ? 偏差檢測(cè)的主要問題在于:偏差點(diǎn)與數(shù)據(jù)記錄之間不一致的標(biāo)準(zhǔn)如何確定;以及如何找到一個(gè)有效的方法來發(fā)現(xiàn)這樣的偏差點(diǎn)。 ? 偏差檢測(cè)的基本方法是,尋找觀測(cè)結(jié)果與參照值之間有意義的差別?;谟?jì)算機(jī)的偏差檢測(cè)算法大致有三類:統(tǒng)計(jì)學(xué)方法,基于距離的方法和基于偏移的方法。 ? 例如,偏差檢測(cè)可以發(fā)現(xiàn)信用卡欺騙。通過檢測(cè)一個(gè)給定帳號(hào)的支付記錄,如果發(fā)現(xiàn)存在著某個(gè)付款數(shù)額比一般的付款數(shù)額高出很多的付費(fèi)記錄,則可能是信用卡欺詐。 ? 偏差分析的一個(gè)重要特征就是它可以有效地過濾大量的不感興趣的模式。 2
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1