freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

數(shù)據(jù)挖掘數(shù)據(jù)挖掘∶概念和技術-wenkub.com

2024-08-27 09:03 本頁面
   

【正文】 2020116 數(shù)據(jù)挖掘:概念和技術 42 序數(shù)型變量 ? 相異度的計算 與區(qū)間標度變量的計算方法相類似 ? 將 xif 用它對應的秩代替 ? 將每個變量的值域映射到 [, ]上,使得每個變量都有相同的權重。 根據(jù)慣例,將比較重要通常也是出現(xiàn)概率比較小的狀態(tài)編碼為 1,將另一中狀態(tài)編碼為 0。 ? 適宜使用數(shù)據(jù)立方體 ? N維立方體的每個單元 對應一個維詞集合 ? 使用數(shù)據(jù)立方體速度更快 (ine) (age) () (buys) (age, ine) (age,buys) (ine,buys) (age,ine,buys) 2020116 數(shù)據(jù)挖掘:概念和技術 17 帶數(shù)量的關聯(lián)規(guī)則 age(X,”3034”) ? ine(X,”24K 48K”) ? buys(X,”high resolution TV”) ? 動態(tài) 離散化數(shù)值屬性 ? Such that the confidence or pactness of the rules mined is maximized. ? 2維數(shù)量關聯(lián)規(guī)則: Aquan1 ? Aquan2 ? Acat ? 用 2維表格把“鄰近”的 關聯(lián)規(guī)則組合起來 ? 例子 2020116 數(shù)據(jù)挖掘:概念和技術 18 ARCS (關聯(lián)規(guī)則聚集系統(tǒng) ) ARCS 流程 1. 分箱 2. 查找頻繁維詞 集合 3. 聚集 4. 優(yōu)化 2020116 數(shù)據(jù)挖掘:概念和技術 19 ARCS的局限性 ? 數(shù)值屬性只能出現(xiàn)在規(guī)則的左側 ? 左側只能有兩個屬性 (2維 ) ? ARCS 的改進 ? 不用基于柵格的方法 ? 等深分箱 ? 基于 局部完整性 測度的聚集 ? ―Mining Quantitative Association Rules in Large Relational Tables‖ by R. Srikant and R. Agrawal. 2020116 數(shù)據(jù)挖掘:概念和技術 20 挖掘基于距離的關聯(lián)規(guī)則 ? 分箱的方法沒有體現(xiàn)數(shù)據(jù)間隔的語義 ? 基于距離的分割是更有“意義”的離散化方法,考慮 : ? 區(qū)間內密度或點的個數(shù) ? 區(qū)間內點的“緊密程度 價格( $ )等寬( 寬度 $10)等深( 深度 2) 基于距離7 [ 0 , 1 0 ] [ 7 , 2 0 ] [ 7 , 7 ]20 [ 1 1 , 2 0 ] [ 2 2 , 5 0 ] [ 2 0 , 2 2 ]22 [ 2 1 , 3 0 ] [ 5 1 , 5 3 ] [ 5 0 , 5 3 ]50 [ 3 1 , 4 0 ]51 [ 4 1 , 5 0 ]53 [ 5 1 , 6 0 ]2020116 數(shù)據(jù)挖掘:概念和技術 23 Chapter 8. 聚類分析 ? 什么是聚類分析 ? ? 聚類分析中的數(shù)據(jù)類型 ? 主要聚類分析方法分類 ? 劃分方法( Partitioning Methods) ? 分層方法 ? 基于密度的方法 ? 基于表格的方法 ? 基于模型( ModelBased) 的聚類方法 ? 異常分析 ? 總結 2020116 數(shù)據(jù)挖掘:概念和技術 25 聚類的常規(guī)應用 ? 模式識別 ? 空間數(shù)據(jù)分析 ? 在 GIS中,通過聚類發(fā)現(xiàn)特征空間來建立主題索引; ? 在空間數(shù)據(jù)挖掘中,檢測并解釋空間中的簇; ? 圖象處理 ? 經濟學 (尤其是市場研究方面 ) ? WWW ? 文檔分類 ? 分析 WEB日志數(shù)據(jù)來發(fā)現(xiàn)相似的訪問模式 2020116 數(shù)據(jù)挖掘:概念和技術 26 應用聚類分析的例子 ? 市場銷售 : 幫助市場人員發(fā)現(xiàn)客戶中的不同群體,然后用這些知識來開展一個目標明確的市場計劃; ? 土地使用 : 在一個陸地觀察數(shù)據(jù)庫中標識那些土地使用相似的地區(qū); ? 保險 : 對購買了汽車保險的客戶,標識那些有較高平均賠償成本的客戶; ? 城市規(guī)劃 : 根據(jù)類型、價格、地理位置等來劃分不同類型的住宅; ? 地震研究 : 根據(jù)地質斷層的特點把已觀察到的地震中心分成不同的類; 2020116 數(shù)據(jù)挖掘:概念和技術 27 什么是一個好的聚類方法 ? ? 一個好的聚類方法要能產生高質量的聚類結果 ——簇,這些簇要具備以下兩個特點: ? 高的簇內相似性 ? 低的簇間相似性 ? 聚類結果的好壞取決于該聚類方法采用的相似性評估方法以及該方法的具體實現(xiàn); ? 聚類方法的好壞還取決與該方法是能發(fā)現(xiàn)某些還是所有的
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1