【正文】
據(jù)。 ? 元數(shù)據(jù)管理器的用戶接口:以接口形式向用戶提供對元數(shù)據(jù) 增、刪、改、查的服務(wù),包括:源數(shù)據(jù)信息、數(shù)據(jù)倉庫信息、星型模型信息、維信息、維表字段信息、事實(shí)表字段信息、映射事實(shí)表字段信息、映射維表字段信息、鏈接事實(shí)表與維表字段的信息。 34 元數(shù)據(jù)管理器的設(shè)計(jì)與實(shí)現(xiàn) ? 元數(shù)據(jù)的作用 :定義數(shù)據(jù)倉庫的作用 ,指明數(shù)據(jù)倉庫中信息的內(nèi)容和位置 ,刻畫數(shù)據(jù)的抽取和轉(zhuǎn)換規(guī)則 ,存儲與數(shù)據(jù)倉庫主題有關(guān)的各種商業(yè)信息。例如,用戶想在多維模型中加入一維或者在某一維中加入維元素,不僅可以通過圖形化界面工具完成而且可以在用戶自已編寫的應(yīng)用程序中調(diào)用應(yīng)用程序接口函數(shù),修改后的結(jié)果將記入元數(shù)據(jù)庫中。 35 操作數(shù)據(jù)存儲 Business data warehouse 業(yè)務(wù)系統(tǒng)( Operational systems) 數(shù)據(jù)集市( Data marts) 操作數(shù)據(jù)存儲( Operational data store) 元數(shù)據(jù)(Meta Data) 36 數(shù)據(jù)倉庫中的數(shù)據(jù)組織 高度綜合級 輕度綜合級 當(dāng)前綜合級 早期細(xì)節(jié)級 多級數(shù)據(jù) 37 數(shù)據(jù)倉庫的數(shù)據(jù)模型 星型圖模型 物理數(shù)據(jù)模型 概念模型 邏輯模型 物理模型 面向用戶的需求 細(xì) 化層次 更詳細(xì)的 技術(shù)細(xì)節(jié) 信息包圖 38 數(shù)據(jù)倉庫建模和設(shè)計(jì) ? Process of building an abstract model for the data, which is stored in the data and represents the data warehouse content. 39 概念模型 ? 由于大多數(shù)商務(wù)數(shù)據(jù)是多維的,但傳統(tǒng)的數(shù)據(jù)模型表示三維以上的數(shù)據(jù)有一定困難。 解:首先根據(jù)銷售分析的實(shí)際需求,確定信息包的維度、類別和指標(biāo)與事實(shí): ( 1)維度:包括日期維、銷售地點(diǎn)維、銷售產(chǎn)品維、年齡組別維、性別維等。 ( 3)度量和事實(shí):確定用于進(jìn)行分析的數(shù)值化信息,包括預(yù)測銷售量、實(shí)際銷售量和預(yù)測偏差等。與傳統(tǒng)的關(guān)系模型相比,星型圖模型簡化了用戶分析所需的關(guān)系,從支持決策的角度去定義數(shù)據(jù)實(shí)體,更適合大量復(fù)雜查詢。 44 sales數(shù)據(jù)倉庫的雪花模式 45 Information Modelling of Sales Information Demand Unique Identifier Attribute Strong Entity Type 1n Relationship 0n Relationship Derived Attribute Weak Entity Type 46 DW Layer and the Mapping to Information Model Data Warehouse Layer (logical layer) Information Model (conceptual layer) Map Information Objects To Database fields Rename Objects to User friendly names Calculate fields Define object display attributes Convert currencies etc…. 47 星型模型例子 48 物理數(shù)據(jù)模型 ? 物理數(shù)據(jù)模型:數(shù)據(jù)模型的第三層,它是星型圖模型在數(shù)據(jù)倉庫中的實(shí)現(xiàn),如物理的存取方式、數(shù)據(jù)存儲結(jié)構(gòu)等。重要程度高、經(jīng)常存取并對響應(yīng)時間高的數(shù)據(jù)就存放在高速存儲設(shè)備上,如硬盤;存取頻率低或?qū)Υ嫒№憫?yīng)時間要求低的數(shù)據(jù)則可以放在低速存儲設(shè)備上。 ? 粒度越小,綜合程度越低,回答查詢的種類越多; 粒度越高,綜合程度越高,查詢的效率也越高。 50 維度 ? 維度:是一個物理特性(如時間、地點(diǎn)、產(chǎn)品等),它是表達(dá)數(shù)據(jù)倉庫中信息的一個基本途徑,可作為標(biāo)識數(shù)據(jù)的索引。 ? 例如: ? 一個銷售系統(tǒng)中的數(shù)據(jù)可分為時間維、產(chǎn)品維和地理位置維等; ? 一個財(cái)務(wù)系統(tǒng)中的數(shù)據(jù)可分為時間維、支出維和收入維等; ? 一個企業(yè)決策支持系統(tǒng)中的數(shù)據(jù)可分為成本開支維、銷售收入維、利潤維、股票價值維等。例如,在地理位置維中,由所有的街區(qū)組成了地區(qū),由所有的地區(qū)組成了城市等。 ? 聚合和匯總不同 52 分解與合成 ? 分解與合成是在一個維度內(nèi)進(jìn)一步細(xì)分?jǐn)?shù)據(jù)或?qū)?shù)據(jù)按照另一標(biāo)準(zhǔn)組合的過程。而合成則是分解的逆過程,例如用戶開始以省市為觀察對象,接著再以地區(qū)、國家等為觀察對象,就是一個數(shù)據(jù)合成的過程。數(shù)據(jù)倉庫正是構(gòu)建這種新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲和組織技術(shù)。在數(shù)據(jù)倉庫中,數(shù)據(jù)按照粒度從小到大可分為四個級別:早期細(xì)節(jié)級、當(dāng)前細(xì)節(jié)級、輕度細(xì)節(jié)級和高度細(xì)節(jié)級。 54 數(shù)據(jù)倉庫的數(shù)據(jù)組織方式 ? 虛擬存儲方式:數(shù)據(jù)倉庫數(shù)據(jù)的虛擬存儲方式是指在數(shù)據(jù)倉庫中實(shí)際上并沒有具體的數(shù)據(jù)存儲,數(shù)據(jù)倉庫中的數(shù)據(jù)仍然存儲在源數(shù)據(jù)庫中,只是根據(jù)用戶的多維分析需求而形成多維視圖,臨時在源數(shù)據(jù)庫中找出并提取所需要的數(shù)據(jù),完成多維分析。 55 數(shù)據(jù)集市 ? 數(shù)據(jù)倉庫是企業(yè)級的,能為整個企業(yè)各部門的運(yùn)行提供決策支持手段。 ? 數(shù)據(jù)集市有兩種:獨(dú)立的數(shù)據(jù)集市和從屬的數(shù)據(jù)集市。包括:數(shù)據(jù)源中所有物理數(shù)據(jù)結(jié)構(gòu);所有數(shù)據(jù)項(xiàng)的業(yè)務(wù)定義;每個數(shù)據(jù)項(xiàng)更新的頻率,以及由誰或哪個過程更新的說明;每個數(shù)據(jù)項(xiàng)的有效值;其它系統(tǒng)中具有相同業(yè)務(wù)含義的數(shù)據(jù)項(xiàng)的清單。維表中的一個字段或多個字段構(gòu)成了維的層次。通過多個維表的連接最大限度地減少了數(shù)據(jù)存儲量,增加了模型的靈活性,但也使得查詢變得復(fù)雜化。它通常只與源數(shù)據(jù)庫中某個表的日期型字段相對應(yīng),所以時間維的層次不可以由維表的字段來表示。 58 推薦資料( IBM紅皮書) ? Getting Started with DataWarehouse ? Managing Multidimensional Data Marts ? BI Tutorial Introduction to the Data Warehouse Center 59 演講完畢,謝謝觀看!