【正文】
noff Faces ? 一種方法在二維空間顯示變量 ,如設(shè) X眉傾斜 ,Y是眼睛大小 ,Z是鼻子長(zhǎng)度等 ? 圖中的面孔使用 10個(gè)特點(diǎn)產(chǎn)生 頭離心率,眼睛大小,眼間距,眼離心率,瞳孔大小,斜眉,鼻大小,嘴形,嘴的大小,張口程度 : Each assigned one of 10 possible values, generated using Mathematica (S. Dickson) ? REFERENCE: Gonick, L. and Smith, W. The Cartoon Guide to Statistics. New York: Harper Perennial, p. 212, 1993 ? Weisstein, Eric W. Chernoff Face. From MathWorldA Wolfram Web Resource. 41 人口普查數(shù)據(jù)圖顯示年齡、收入、性別、教育、等 棍棒圖 Stick Figure 一個(gè) 5piece棍棒圖 (身體和四肢 ),兩個(gè)屬性映射到軸,其余的屬性映射到角度或肢體長(zhǎng)度 42 分層可視化技術(shù) ? 使用子空間層次劃分可視化數(shù)據(jù) ? 方法 ? 維數(shù)堆疊 Dimensional Stacking ? WorldswithinWorlds ? TreeMap 樹(shù)狀圖 ? Cone Trees錐形樹(shù) ? InfoCube 43 維數(shù)堆疊 Dimensional Stacking a t t r i b u t e 1a t t r ib u t e 2a t t r ib u t e 3a t t r ib u t e 4? 把 n維屬性空間剖分為 2D子空間,互相堆疊與一起 ? 屬性值的范圍劃分為等級(jí),重要的屬性分布在外層 . ? 適合次序?qū)傩暂^少的數(shù)據(jù) ? 超過(guò) 9個(gè)維度時(shí)顯示困難 ? 重要的是匹配維度適當(dāng) 44 Used by permission of M. Ward, Worcester Polytechnic Institute 可視化石油勘探數(shù)據(jù), 經(jīng)度和緯度映射到外 x, y軸, 油質(zhì)和深度映射到內(nèi)部 x, y軸 維數(shù)堆疊 Dimensional Stacking 45 WorldswithinWorlds ? 分配功能 f和兩個(gè)重要參數(shù)給內(nèi)部世界 ? 固定其他參數(shù) draw other (1 or 2 or 3 世界選擇他們?yōu)樽鴺?biāo)軸 ) ? 使用這種模式的軟件 ? N–vision:通過(guò)數(shù)據(jù)手套和立體顯示以動(dòng)態(tài)互動(dòng),包括旋轉(zhuǎn),縮放(內(nèi)部)和轉(zhuǎn)換(內(nèi) /外) ? 自動(dòng)視覺(jué):經(jīng)查詢手段靜態(tài)互動(dòng) 46 樹(shù)狀圖 TreeMap ? 屏幕填充方法:依賴于屬性值把 屏幕層次劃分為區(qū)域 ? 根據(jù)屬性值(類(lèi))屏幕的 xy維交替剖分 MSR Netscan Image 47 TreeMap of a File System (Schneiderman)? 48 InfoCube ? 3D可視化技術(shù):層次信息被顯示成嵌套的半透明立方體 ? 最外層的立方體對(duì)應(yīng)頂層數(shù)據(jù) , 子節(jié)點(diǎn) or低層數(shù)據(jù)作為稍小的立方體顯示于外層立方體中 , 以此類(lèi)推 49 3d錐樹(shù) ThreeD Cone Trees ? 3D cone tree 可用于數(shù)千個(gè)節(jié)點(diǎn) ? 先構(gòu)造 2D環(huán)形樹(shù), 安排節(jié)點(diǎn)于根節(jié)點(diǎn)為中心的同心圓環(huán) ? 投影到 2維時(shí)將不可避免重疊 ? G. Robertson, J. Mackinlay, S. Card. ―Cone Trees: Animated 3D Visualizations of Hierarchical Information‖, ACM SIGCHI39。 中位數(shù)標(biāo)記 。 ? 分布式度量 distributive measure ? 可通過(guò)如下方法計(jì)算的度量(函數(shù)):將數(shù)據(jù)劃分成較小子集,計(jì)算每個(gè)子集的度量,合并計(jì)算結(jié)果得到整個(gè)數(shù)據(jù)集的度量值。1 Data Mining: Concepts and Techniques 楊昆 修譯 — Chapter 2 — Jiawei Han, Micheline Kamber, and Jian Pei University of Illinois at UrbanaChampaign Simon Fraser University 2 Chapter 2: 了解數(shù)據(jù) ? 數(shù)據(jù)對(duì)象和屬性類(lèi)型 Data Objects and Attribute Types ? 數(shù)據(jù)的 (基本 )統(tǒng)計(jì)描述 Basic Statistical Descriptions of Data ? 數(shù)據(jù)可視化 Data Visualization ? 測(cè)量數(shù)據(jù)相似性和相異性 Measuring Data Similarity and Dissimilarity ? 總結(jié) Summary 3 數(shù)據(jù)集合的類(lèi)型 ? 記錄 Record ? 關(guān)系記錄 ? 數(shù)據(jù)矩陣 , ., 數(shù)值矩陣 , 交叉表 ? 文檔數(shù)據(jù) : 文本文檔 :詞頻向量 termfrequency vector ? 交易數(shù)據(jù) ? 圖 and 網(wǎng)絡(luò) ? 萬(wàn)維網(wǎng) ? 社會(huì)或信息網(wǎng)絡(luò) ? 分子結(jié)構(gòu) Molecular Structures ? 有序的 Ordered ? 視頻數(shù)據(jù) : sequence of images ? 時(shí)間數(shù)據(jù) : 時(shí)間序列 timeseries ? 序列數(shù)據(jù) :交易序列 transaction sequences ? 遺傳序列數(shù)據(jù) ? 空間 , 圖像 image and 多媒體 multimedia: ? Spatial data: maps ? Image data: ? Video data: D o c u m e n t 1seasontimeoutlostwingamescoreballplaycoachteamD o c u m e n t 2D o c u m e n t 33 0 5 0 2 6 0 2 0 2007 0 2 1 0 0 3 0 01 0 0 1 2 2 0 3 0T ID It e m s 1 B r e ad , C o k e , M ilk 2 Beer, Bread 3 B e e r , C o k e, D iape r , M ilk 4 Beer, Bread , D ia p er, M il k 5 C ok e, D iap er, M ilk 4 結(jié)構(gòu)數(shù)據(jù)的重要特征 ? 維度 Dimensionality ? 維數(shù)災(zāi)難 Curse of dimensionality ? 稀疏 Sparsity ? 只有計(jì)數(shù) Only presence counts ? 分辯率 Resolution ? 模式依賴于尺度 ? 分布 Distribution ? 中心性和分散 Centrality and dispersion 5 數(shù)據(jù)對(duì)象 ? 數(shù)據(jù)集由數(shù)據(jù)對(duì)象構(gòu)成 ? 一個(gè)數(shù)據(jù)對(duì)象代表一個(gè)實(shí)體 ? 例子 : ? 銷(xiāo)售數(shù)據(jù)庫(kù) sales database:客戶 /顧客 ,商店物品 , sales ? 醫(yī)學(xué)數(shù)據(jù)庫(kù) : patients, treatments ? 大學(xué)數(shù)據(jù)庫(kù) : students, professors, courses ? 又稱為 樣本 , 事例 ,實(shí)例 , 數(shù)據(jù)點(diǎn) , 對(duì)象 ,元組 tuples. ? 數(shù)據(jù)對(duì)象由屬性來(lái)描述 ? Database rows data objects。 c