freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘復(fù)習(xí)題綱(編輯修改稿)

2025-05-14 01:46 本頁面
 

【文章內(nèi)容簡介】 的散點圖和qq圖。三,age包括如下值(以遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70.A) 使用蔞3的箱,用箱均值光滑以上數(shù)據(jù)。說明你的步驟,討論這種技術(shù)對緞帶定數(shù)據(jù)的效果。B) 如何確定該數(shù)據(jù)中的離群點?C) 還有什么其他方法來光滑數(shù)據(jù)?(a) 使用分箱均值光滑對以上數(shù)據(jù)進行光滑,箱的深度為3。解釋你的步驟。評述對于給定的數(shù)據(jù),該技術(shù)的效果。用箱深度為3 的分箱均值光滑對以上數(shù)據(jù)進行光滑需要以下步驟:?? 步驟1:對數(shù)據(jù)排序。(因為數(shù)據(jù)已被排序,所以此時不需要該步驟。)?? 步驟2:將數(shù)據(jù)劃分到大小為3 的等頻箱中。箱1:13,15,16 箱2:16,19,20 箱3:20,21,22箱4:22,25,25 箱5:25,25,30 箱6:33,33,35箱7:35,35,35 箱8:36,40,45 箱9:46,52,70?? 步驟3:計算每個等頻箱的算數(shù)均值。?? 步驟4:用各箱計算出的算數(shù)均值替換每箱中的每個值。箱1:44/3,44/3,44/3 箱2:55/3,55/3,55/3 箱3:21,21,21箱4:24,24,24 箱5:80/3,80/3,80/3 箱6:101/3,101/3,101/3箱7:35,35,35 箱8:121/3,121/3,121/3 箱9:56,56,56(b) 如何確定數(shù)據(jù)中的離群點?聚類的方法可用來將相似的點分成組或“簇”,并檢測離群點。落到簇的集外的值可以被視為離群點。作為選擇,一種人機結(jié)合的檢測可被采用,而計算機用一種事先決定的數(shù)據(jù)分布來區(qū)分可能的離群點。這些可能的離群點能被用人工輕松的檢驗,而不必檢查整個數(shù)據(jù)集。(c) 對于數(shù)據(jù)光滑,還有哪些其他方法?其它可用來數(shù)據(jù)光滑的方法包括別的分箱光滑方法,如中位數(shù)光滑和箱邊界光滑。作為選擇,等寬箱可被用來執(zhí)行任何分箱方式,其中每個箱中的數(shù)據(jù)范圍均是常量。除了分箱方法外,可以使用回歸技術(shù)擬合成函數(shù)來光滑數(shù)據(jù),如通過線性或多線性回歸。分類技術(shù)也能被用來對概念分層,這是通過將低級概念上卷到高級概念來光滑數(shù)據(jù)。?A) 最小最大規(guī)范化B) Z分?jǐn)?shù)規(guī)范化。C) Z分?jǐn)?shù)規(guī)范化,使用均值絕對念頭而不是標(biāo)準(zhǔn)差。D) 小數(shù)定標(biāo)規(guī)范化。(a) minmax 規(guī)范化。值域是[new_min, new_max]。(b) zscore 規(guī)范化。值域是[(old_min-mean)/σ,(old_max-mean)/σ],總的來說,對于所有可能的數(shù)據(jù)集的值域是(-∞,+∞)。(c) 小數(shù)定標(biāo)規(guī)范化。值域是(-,)。:200,300,400,600,1000(a) min=0,max=1,最小最大規(guī)范化。(b) Z分?jǐn)?shù)規(guī)范化。(c) Z分?jǐn)?shù)規(guī)范化,使用均值絕對偏差而不是標(biāo)準(zhǔn)差。(d) 小數(shù)定標(biāo)規(guī)范化。(a) minmax 規(guī)范化。值域是[new_min, new_max]。(b) zscore 規(guī)范化。值域是[(old_min-mean)/σ,(old_max-mean)/σ],總的來說,對于所有可能的數(shù)據(jù)集的值域是(-∞,+∞)。(c) 小數(shù)定標(biāo)規(guī)范化。值域是(-,)。,為什么許多公司更愿意使用更 新驅(qū)動的方法(構(gòu)造和使用數(shù)據(jù)倉庫),而不是查詢驅(qū)動的方法(使用包裝程序和集成程序)。描述一些查詢驅(qū)動方法比更 新驅(qū)動方法更可取的情況。 答: 因為對于多個異種信息源的集成, 查詢驅(qū)動方法需要復(fù)雜的信息過濾和集成處理, 并且與局部數(shù)據(jù)源上的處理競爭資源,是一種低效的方法,并且對于頻繁的查詢,特別是需 要聚集操作的查詢,開銷很大。而更新驅(qū)動方法為集成的異種數(shù)據(jù)庫系統(tǒng)帶來了高性能,因 為數(shù)據(jù)被處理和重新組織到一個語義一致的數(shù)據(jù)存儲中, 進行查詢的同時并不影響局部數(shù)據(jù) 源上進行的處理。此外,數(shù)據(jù)倉庫存儲并集成歷史信息,支持復(fù)雜的多維查詢。 ,可以用例子解釋你的觀點。(a) 雪花模式、事實星座、星網(wǎng)查詢模型。(b) 數(shù)據(jù)清理、數(shù)據(jù)變換、刷新。(c) 發(fā)現(xiàn)驅(qū)動的立方體、多特征冷言冷語腐朽 、虛擬倉庫(a) 雪花形模式、事實星座形、星形網(wǎng)查詢模型。 答:雪花形和事實星形模式都是變形的星形模式,都是由事實表和維表組成,雪花形模式的維表都是規(guī)范化的;而事實星座形的某幾個事實表可能會共享一些維表;星形網(wǎng)查詢模型是一個查詢模型而不是模式模型,它是由中心點發(fā)出的涉嫌組成,其中每一條射線代表一
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1