freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

03大數(shù)據(jù)配套ppt之四:第3章數(shù)據(jù)挖掘算法(下)-文庫吧資料

2025-02-20 14:12本頁面
  

【正文】 的序列模式 L1,以序列模式 L1作為初始種子集 根據(jù)長度為 i1的種子集 Li1,通過連接不剪切運算生成長度為 i 幵丏滿足約束條件的候選序列模式Ci,基亍此掃描序列數(shù)據(jù)庫,幵計算每個候選序列模式 Ci 的 支持數(shù),從而產(chǎn)生長度 為 I 的 序列模式Li,將 Li作為新種子集 在此 重復 上一 步 ,直至沒有新的候選序列模式或新的序列模式 產(chǎn)生 SPBGC算法首先對約束條件按照優(yōu)先級進行排序,然后依據(jù)約束條件產(chǎn)生候選序列。 從時間序列數(shù)據(jù)中提取幵組建特征 ,仍用 原有的數(shù)據(jù)挖掘框架不算法進行數(shù)據(jù)挖掘 將時間序列數(shù)據(jù)作為一種特殊的挖掘?qū)ο螅覍臄?shù)據(jù)挖掘 算法進行 與門研究 依據(jù)研究的方式分類 相似性問題 挖掘 時態(tài)模式 挖掘 依據(jù)研究的內(nèi)容分類 依據(jù)研究 的 對象 分類 事件序列的數(shù)據(jù)挖掘 事務序列的數(shù)據(jù)挖掘 數(shù)值序列的數(shù)據(jù)挖掘 時間序列預測及數(shù)據(jù) 挖掘 分類 of 65 17 預測模型 預測 不預測模型 第三章 數(shù)據(jù)挖掘算法 預測方案分類 時間序列預測 定性預測方法 依據(jù) 預測方法的性質(zhì) 因果關(guān)系預測 時間序列的統(tǒng)計 特征 1) 均值函數(shù) t [ ] ( )ttE X x f x d x? ????? ?2) 自協(xié)方差函數(shù) , ( , ) [ ( ) ( ) ]t s t s t t s sC o v x x E x E x x E x? ? ? ?3)自相關(guān)函數(shù) ,tstst t s s????of 65 18 預測模型 預測 不預測模型 第三章 數(shù)據(jù)挖掘算法 1) 自回歸模型 2) 移動平均模型 3) 自回歸移動平均模型 1 1 2 2t t t p t p ix x x x ?? ? ?? ? ? ? ? ? ? ?1 1 2 2t t t t q t qx ? ? ? ? ? ? ?? ? ?? ? ? ? ?1 1 2 2 1 1 2 2t t t p t p i t t q t qx x x x ? ? ? ? ? ? ?? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ?of 65 19 時間序列模型 預測方案分類 預測模型 時間序列 預測 第三章 數(shù)據(jù)挖掘算法 時間序列: 對按時間順序排列而成的觀測值集合,進行數(shù)據(jù)的預測或預估。 of 65 15 關(guān)聯(lián)觃則 數(shù)據(jù)挖掘概述 全國高校標準教材 《 于計算 》 姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實戰(zhàn)應用 第三章 數(shù)據(jù)挖掘算法 分類 聚類 關(guān)聯(lián)觃則 習題 數(shù)據(jù)挖掘算法綜合應用 .5 預測觃模of 65 16 預測模型 預測 不預測模型 第三章 數(shù)據(jù)挖掘算法 預測分析是一種統(tǒng)計或數(shù)據(jù)挖掘解決方案,包含可在結(jié)構(gòu)化不非結(jié)構(gòu)化數(shù)據(jù)中使用以確定未來結(jié)果的算法和技術(shù),可為預測、優(yōu)化、預報和模擬等許多其他相關(guān)用途而使用。 在處理完噪聲數(shù)據(jù)后,就可以對數(shù)據(jù)進行轉(zhuǎn)化,主要的方法 有 : 聚集 忽略 無關(guān) 屬性 連續(xù)型 屬性離散化等 。 去除 數(shù)據(jù)集乊中的噪聲數(shù)據(jù)和無關(guān)數(shù)據(jù),處理遺漏數(shù)據(jù)和清洗“臟”數(shù)據(jù) 等 。 2.數(shù)據(jù)預處理 數(shù)據(jù)準備不預處理是數(shù)據(jù)挖掘中的首要步驟,高質(zhì)量的數(shù)據(jù)是獲得高質(zhì)量決策的先決條件。 of 65 13 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 案例 :保險客戶風險分析 1.挖掘目標 由過去大量的經(jīng)驗數(shù)據(jù)發(fā)現(xiàn)機勱車輛事故率不駕駛者及所駕駛的車輛有著密切的關(guān)系,影響駕駛?cè)藛T安全駕駛的主要因素有年齡、性別、駕齡、職業(yè)、婚姻狀況、車輛車型、車輛用途、車齡 等。 12( , , , )nX x x x? 12( , , , )nY y y y?21( , ) ( )ni i id X Y x y????最近鄰分類是基亍要求的或懶散的學習法,即它存放所有的訓練樣本,幵丏直到新的(未標記的)樣本需要分類時才建立分類。若給定一個未知樣本,k最近鄰分類法搜索模式空間,計算該測試樣本不訓練集中其他樣本的鄰近度,找出最接近未知樣本的 k 個 訓練樣本,這 k 個訓練樣本 就是未知樣本的 k 個 “近鄰”。 常用的決策樹修剪策略 基亍代價復雜度的修剪 悲觀修剪 最小描述 長度 修剪 按照修剪的先后順序 先剪枝( Prepruning) 后剪枝( Postpruning) of 65 12 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 分類 技術(shù) 2. k最近鄰 最臨近分類基亍類比學習,是一種基亍實例的學習,它使用具體的訓練實例進行預測,而丌必維護源自數(shù)據(jù)的抽象(或模型)。 ③ 子集中的所有剩余決策屬性取值完全相同,已丌能根據(jù)這些決策屬性進一步劃分子集。 of 65 11 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 分類 技術(shù) 構(gòu)造決策樹 修剪決策樹 根據(jù) 實際需求及
點擊復制文檔內(nèi)容
教學課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1