freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘概念與技術(shù)chapter2-了解數(shù)據(jù)(完整版)

2025-04-27 07:50上一頁面

下一頁面
  

【正文】 小 . ? 加權(quán)算術(shù)均值 : ? 截斷均值 : 去掉高低極端值 ? 中位數(shù) : ? 奇數(shù)則為有序集的中間值 , 否則為中間兩個數(shù)的平均 ? (基于分組數(shù)據(jù) )可以插值估計 ? 眾數(shù) Mode ? 出現(xiàn)頻率最高的值 (不惟一 /每個值出現(xiàn)一次則沒有 ) ? 1/2/3個眾數(shù) 〉 單峰的 , 雙峰的 , 三峰的 ? Empirical formula: ???niixnx11?????niiniiiwxwx11wi d thf r e q f r e qnLm e d i a nm e d i a ns m a l l ))(2/(1????)(3 m e di a nm e anm odem e an ????Nx???14 2022年 4月 12日星期二 Data Mining: Concepts and Techniques 14 對稱 /偏斜數(shù)據(jù) ? 中位數(shù) , 均值 , 眾數(shù):對稱 , 正傾斜和負傾斜數(shù)據(jù) positively skewed negatively skewed symmetric 15 度量數(shù)據(jù)的離散度 ? 四分位數(shù) Quartiles, 離群點 outliers ,盒圖 boxplots ? 四分位數(shù) : Q1 (25th 百分位數(shù) percentile), Q3 (75th percentile) ? 中間四分位數(shù)極差 Interquartile range: IQR = Q3 – Q1 ? 五數(shù)概括 : min, Q1, median, Q3, max ? 盒圖 : 盒兩端為四分位數(shù) 。 中位數(shù)標記 。類別(帶)必須相鄰 051015202530354010000 30000 50000 70000 9000021 Histograms Often Tell More than Boxplots ? 兩個直方圖顯示在左邊有同樣的boxplot表示 ? 相同的值 : min, Q1, median, Q3, max ? 他們擁有的是不同的數(shù)據(jù)分布 ? But they have rather different data distributions 22 Data Mining: Concepts and Techniques 分位數(shù)圖 Quantile Plot ? 顯示所有數(shù)據(jù) (允許用戶評估全部行為和不尋常的事件 ) ? Plots quantile information ? 對于升序中的值點 xi , fi 表明近似 100 fi % 的數(shù)據(jù) ? xi ; 成對繪制 (xi , fi ) 23 分位數(shù) 分位數(shù)圖 (圖 ) ? 對著另一個分位數(shù),繪制一個單變量分布的分位數(shù) ? 觀察 :正從一種分布到另一個種是否有偏移 ? ? 例子表示 分店 1出售的物品單價 vs. 分店 2 的每個分位數(shù) .分店 1出售的物品單價 傾向于低于分店 2. 24 散布圖 Scatter plot ? 提供雙變量的數(shù)據(jù)的第一印象:點的聚集,離群點 , 等 ? 每個值對作為一個坐標點繪于平面上 25 正 /負 相關(guān)數(shù)據(jù) ? The left half fragment is positively correlated ? The right half is negative correlated 26 不相關(guān)的數(shù)據(jù) 27 散布圖的例子 28 Chapter 2: 了解數(shù)據(jù) ? 數(shù)據(jù)對象和屬性類型 Data Objects and Attribute Types ? 數(shù)據(jù)的 (基本 )統(tǒng)計描述 Basic Statistical Descriptions of Data ? 數(shù)據(jù)可視化 Data Visualization ? 測量數(shù)據(jù)相似性和相異性 Measuring Data Similarity and Dissimilarity ? 總結(jié) Summary 29 數(shù)據(jù)可視化 ? Why data visualization? ? 把數(shù)據(jù)映射到圖形信息空間中獲取視角 ? 提供 定性的概述 (大數(shù)據(jù)集的 ) ? 在數(shù)據(jù)中搜尋 模式 , 趨勢 , 結(jié)構(gòu) ,不規(guī)則 , 關(guān)聯(lián) ? 為進一步的量化分析發(fā)現(xiàn) 有意義的區(qū)域及合時的參數(shù) ? 為衍生的計算機表示提供 一個視覺證據(jù) ? 可視化方法的分類 : ? 基于像素的可視化技術(shù) Pixeloriented visualization ? 幾何投影可視化技術(shù) Geometric projection ? 基于圖標的可視化技術(shù) Iconbased visualization ? 分層可視化技術(shù) Hierarchical visualization ? 可視化復雜數(shù)據(jù)和關(guān)系 30 基于像素的可視化技術(shù) ? 對一個維度 m的數(shù)據(jù),在屏幕上產(chǎn)生 m個窗口 ,每個維度一個 ? 一個記錄的 m維度值被匹配到窗口中對應位置的 m個像素上 ? 像素的顏色值反映了相應的值 (a) Ine (b) 信用限額 (c)交易額 (d) age 31 安排象素于圓弧片斷 ? 為節(jié)省空間并顯示多個維度間的聯(lián)系 ,往往是以一個弧形片段填充空間 (a) Representing a data record in circle segment (b) Laying out pixels in circle segment 32 像素圖的例子 33 幾何投影可視化技術(shù) ? 可視化數(shù)據(jù)的幾何變換和投影 ? 方法 ? 直接可視化 ? 散布圖和散布圖矩陣 matrices ? 透視地形 Landscapes ? 投影捕獲技術(shù) : 幫助用戶發(fā)現(xiàn)有意義的投影(多維數(shù)據(jù)上) ? 解剖視角 Prosection views projections and sections ? sections, ., intersections of subspaces with a highdimensional object, can easily display structure of only low codimension ? Hyperslice ? 平行坐標 Parallel coordinates 34 直接數(shù)據(jù)可視化 基于渦度的含扭曲絲帶 35 散布圖矩陣 Matrix of scatterplots (xydiagrams) of the kdim. data [total of (k2/2k) scatterplots] Used by ermission of M. Ward, Worcester Polytechnic Institute 36 news articles visualized as a landscape Used by permission of B. Wright, Visible Decisions Inc. 透視地形 /景觀 ? 透視方式可視化數(shù)據(jù) ? 數(shù)據(jù)要被轉(zhuǎn)化為能保持數(shù)據(jù)特點的二維表示(可能人工) 37 平行坐標 ? 對應于屬性的 n個等距軸平行于一個屏幕軸 ? 這些軸縮放到 [最小值,最大值 ]:相應的屬性范圍 ? 每個數(shù)據(jù)項對應于一折線,屬性軸的對應取值點處相交 38 一個數(shù)據(jù)集的平行坐標 39 基于圖標的可視化技術(shù) ? 以圖標特征可視化數(shù)據(jù)值 ? 典型的可視化方法 ? Chernoff Faces 臉譜圖 ? Stick Figures 棍棒圖 ? 常用技術(shù) ? 形狀編碼 Shape coding: 使用形狀來表示特定信息的編碼
點擊復制文檔內(nèi)容
教學課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1