【正文】
入理解多維數(shù)據(jù)集中的信息。第一章數(shù)據(jù)倉庫就是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合。ROLAP是基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn),而MOLAP是基于多維數(shù)據(jù)結(jié)構(gòu)組織的OLAP實現(xiàn)?!皩崟r數(shù)據(jù)倉庫”以為著源數(shù)據(jù)系統(tǒng)、決策支持服務(wù)和倉庫倉庫之間以一個接近實時的速度交換數(shù)據(jù)和業(yè)務(wù)規(guī)則。因此,我們要求ETL過程產(chǎn)生的數(shù)據(jù)(即調(diào)和數(shù)據(jù)層)是詳細的、歷史的、規(guī)范的、可理解的、即時的和質(zhì)量可控制的。粒度越小,細節(jié)程度越高,綜合程度越低,回答查詢的種類越多。對于主鍵可以選擇兩種方式:一種是采用自然鍵,另一種是采用代理鍵。第三章SQL Server SSAS提供了所有業(yè)務(wù)數(shù)據(jù)的同意整合試圖,可以作為傳統(tǒng)報表、在線分析處理、關(guān)鍵性能指示器記分卡和數(shù)據(jù)挖掘的基礎(chǔ)。確定了數(shù)據(jù)倉庫的粒度模型以后,為提高數(shù)據(jù)倉庫的使用性能,還需要根據(jù)擁護需求設(shè)計聚合模型。維度可以根據(jù)其變化快慢分為元變化維度、緩慢變化維度和劇烈變化維度三類。如果L2={{a,b},{a,c},{a,d},{b,c},{b,d}},則連接產(chǎn)生的C3={{a,b,c},{a,b,d},{a,c,d},{b,c,d}}再經(jīng)過修剪,C3={{a,b,c},{a,b,d}}設(shè)定supmin=50%,交易集如則L1={A},{B},{C} L2={A,C}T1 A B CT2 A CT3 A D T4 B E F第五章分類的過程包括獲取數(shù)據(jù)、預(yù)處理、分類器設(shè)計和分類決策。第六章聚類分析包括連續(xù)型、二值離散型、多值離散型和混合類型4種類型描述屬性的相似度計算方法。填空題20分,簡答題25分,計算題2個(25分),綜合題30分數(shù)據(jù)倉庫的組成?P2 數(shù)據(jù)倉庫數(shù)據(jù)庫,數(shù)據(jù)抽取工具,元數(shù)據(jù),訪問工具,數(shù)據(jù)集市,數(shù)據(jù)倉庫管理,信息發(fā)布系統(tǒng)數(shù)據(jù)挖掘技術(shù)對聚類分析的要求有哪幾個方面?P131 可伸縮性;處理不同類型屬性的