【導讀】什麼是資料的探索?資料探索的主要目的在於。人們可以利用視覺化的方式來發(fā)現(xiàn)樣式以及進行結果的解釋。本章將資料探索的重點放在。東北國家技術中心,Chester. 彙總統(tǒng)計屬於量化的資料。眾數(shù)是指具有最高次數(shù)的屬性值。具順序性的資料,其百分位數(shù)是很。對順序性屬性或是連續(xù)值屬性x而言,其值p介於0到100. 如第50個百分位數(shù)是x50%. 對連續(xù)型資料,平均數(shù)和中位數(shù)是兩個最常見的彙。全距是指最大值和最小值間的差距。變異數(shù)和標準差是最常用來衡量一組資料分佈的方。平均數(shù)易受離群值所影響,但因變異數(shù)也要用到平。視覺化的圖表通??梢杂脕斫忉寶庀蟆⒔洕斑x舉。將物件、屬性及關係映射至視覺化物件、屬性及關。物件的三種表示方法。選取某些要刪除、或是不重要的物件或屬性。選取包含選擇物件的子集合。將每個屬性分成兩個區(qū)間,再將其區(qū)間的資料視為。盒狀圖可以用來比較不同物件類別間屬性的差異。–二維或三維圖形可用來表示額外的屬性,但資料愈多,