freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第3章資料的探索(完整版)

2024-11-15 16:11上一頁面

下一頁面
  

【正文】 數(shù)對於具有離群值的資料很敏感 169。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 資料探索使用的技術(shù) ? Tukey 所發(fā)展的 EDA – 強(qiáng)調(diào)視覺化 – 將分群分析和異常偵測皆視為資料探索技術(shù) – 分群分析和異常偵測是資料探勘的重要研究領(lǐng)域,而非僅視為資料探索 ? 本章將資料探索的重點放在 – 統(tǒng)計彙總 – 視覺化 – 線上分析處理( OLAP) 169。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 鳶尾花( Iris )資料集 ? 有許多的資料探索技術(shù)是利用鳶尾花資料集進(jìn)行說明 – 有三種主要的類別: ? Setosa ? Virginica ? Versicolour – 有四種屬性 ? 萼長 ? 萼寬 ? 花瓣長 ? 花瓣寬 Virginica Iris的圖片( Robert H. Mohlenbrock USDANRCS PLANTS Database/USDA NRCS. 1995)。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 資料的分佈:全距及變異數(shù) ? 全距是指最大值和最小值間的差距 ? 變異數(shù)和標(biāo)準(zhǔn)差是最常用來衡量一組資料分佈的方式 ? 平均數(shù)易受離群值所影響,但因變異數(shù)也要用到平均數(shù),所以也不適用於具有離群值的資料上 169。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 視覺化技術(shù):盒狀圖 ? 盒狀圖 – J. Tukey 發(fā)明 – 另一種呈現(xiàn)單一數(shù)值屬性分佈的作法 – 下圖是萼長的盒狀圖,在箱子的最底層及最上層分別為第 25及第 75個百分位數(shù),而中間的線則為第 50個百分位數(shù)。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 等高線範(fàn)例 Celsius 1998年 12月平均海平面溫度的等高線圖 169。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 其他視覺化技術(shù) ? 星狀座標(biāo)軸 – 類似平行座標(biāo),但軸是從中心點開始放射 – 物件將用以下步驟進(jìn)行對應(yīng):首先將物件的每個屬性值,轉(zhuǎn)換成屬性間的最小及最大值間的距離。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 範(fàn)例:將鳶尾花資料視為多維度陣列(續(xù)) ? 每個屬性的組合,都是多維陣列中的一個元素 ? 這個元素會被指定一個數(shù)值 ? 下方的圖是以多維度表示 鳶尾花資料 169。 2020 臺灣培生教育出版 (Pearson Education Taiwan) 資料立體方塊:聚集總和 ? 多維度分析的主要動機(jī)在於用不同的方法來進(jìn)行資料的彙總,一般我們所討論的彙總資料是
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1