【正文】
這個角度而言是一條理想的路線。 ? 方式二 ? 在 ODS數據相當完整時,再一次性轉向 ODS。 應用 A 應用 B 應用 C 兩級數據源及數據源定義圖示 操作型環(huán)境 ODS數據環(huán)境 ODS數據源 ODS數據源定義 DW數據源 DW環(huán)境 DW數據源定義 ODS數據源定義 ? 規(guī)定原有 DB系統的哪些數據將送往 ODS。 ? 要進行從數據源到 ODS的數據集成模型設計工作,主要是一致化工作,消除沖突 ? 字段命名 ? 度量單位 ? 存儲方式 ? 轉換 ? … ( 3)參照 DW環(huán)境建立起 ODS模型 ? ODS的一個重要作用 ? 作為 DW的一個數據接口 ? ODS的模型最終還要考慮到 DW的需求,消除兩者的模型的矛盾之處。 ? 擬定主題 ? 通過了解原有系統,根據 ODS之上的應用需求,擬定一些基本的主題,如商品、顧客、供應商等; ? 以面向主題的角度來觀察原有的數據庫系統的數據環(huán)境。 ? 由于 ODS數據庫表的設計接近于業(yè)務系統,而DW數據庫表的設計則是進一步完整集成了各類詳細歷史數據,所以 ODS- DW數據轉換過程本質上實現了從過渡數據( ODS數據)到數據倉庫核心層數據( DW數據)的轉換。 三層結構中的集成問題 ? DW和 ODS的數據源 ? 來源于各自的記錄系統 ? ODS的記錄系統在各個操作型應用 ? DW的記錄系統一般在 ODS之中。 ( 3)二者的技術支持不盡相同 ? ODS ? 需要 OLTP中的 DB技術,以實現面向記錄的聯機更新 ? 需要多個源系統數據間的一致性 ? DW ? 只涉及裝入和存取 ( 4)面向需求不同 ? ODS的需求 ? 企業(yè)級 OLTP和即時 OLAP,向數據倉庫提供一致的數據環(huán)境以供抽取。 ? 內容,數量級,技術支持,面向的需求,使用者 ( 1)數據內容的不同 ? 最大的不同 ODS DW 當前或接近當前的數據 細節(jié)數據 可在線更新 歷史數據 細節(jié)數據和綜合數據 不可變快照或不能在線更新 ODS與 DW中存放數據的差別 時間跨度 ? 時間跨度上的區(qū)別 ? ODS僅存放當前或近期內生成的數據 ? DW中大量是長期保存并可重復查詢的歷史數據。 ? 兩種模式在數據處理上的差別導致了所需的技術支持有著很大差異。在記錄系統上所做的任何修改操作都需要反應在相應的 ODS記錄中; ? 另一方面, ODS系統中還存放著一些參考表,它所反應的關系是 ODS全局更新時所必須反應到的所有 DB中的相關記錄的信息。 in parison, the data warehouse is more like long term memory in that it stores relatively permanent information. Class III ? In the early 1990s, the original ODS systems were developed as a reporting tool for administrative purposes. ? They were usually updated daily and provided reports about business transactions for that day, such as sales totals or orders filled. ? This type of system is now referred to as a Class III ODS. Class II ? With changes in technology and business needs, the Class II ODS evolved to track more plex information such as product and location codes, and to update the database more frequently (perhaps hourly) to reflect changes. Class I ? Class I ODS systems arose from the development of customer relationship management (CRM). ? In Class I systems, synchronous or nearsynchronous updates are used to provide customers with consistently valid and anized information. Class IV ? Another version, the Class IV ODS, was recently developed with an added capacity for more interaction between the data warehouse or data mart and the ODS. 四類 ODS的比較 ? I: 實時 ? II: 數據與操作型環(huán)境中的時間差為小時級 ? III: 數據與操作型環(huán)境中的數據隔夜,最多 24個小時 ? IV: 與 DW交互,從中獲取分析處理結果,向用戶在線發(fā)布 常見的數據倉庫體系結構 Data Warehouse ODS Application Application Application Mart Mart Mart Operation System Operational Data Store Data Mart Data Warehouse Interaction ODS功能與實現機制 ? ODS的產生根源 ? 適應企業(yè)級的全局應用的需求而產生的 ? 企業(yè)全局應用可以大致地劃分為兩類 ? 進行企業(yè)級在線事務處理 ? 即時 OLAP數據處理 ( 1) ODS與企業(yè)級 OLTP ? 企業(yè)級 OLTP ? 指在實際數據處理中,一個事務同時涉及多個部門的數據。 ? 方法 2:將其放在數據量巨大的 DW中去處理 ? 顯然會較費時,可能涉及許多不必要的數據檢索。 ? 因為企業(yè)的數據處理雖然可以較為粗略地劃分成操作型和分析型兩部分,但有時,這兩種處理之間并沒非常明晰的界限。 ? 前述兩種解決方法都不太可行,該如何解決? 另一種數據環(huán)境 ? 這種信息處理的特點引出了一種數據環(huán)境 ? ODS, operational data store ? 操作型數據存儲 ? 它是在 OLTPDW兩層體系結構的基礎上再增加一個層次 ODS,從而形成 OLTPODSDW的三層數據存儲體系。 ? OLTP數據環(huán)境間的可能存在不一致性 ? 某個操作型環(huán)境的數據組織很少考慮其它操作型環(huán)境的特點和需求,因而數據缺乏一致性。 ? 對于企業(yè)的日常經營中常常需要進行的一些非戰(zhàn)略性的中層決策來說,該如何實現呢? Uptosecond OLAP ? 這類中層決策過程的特點 ? 不需要參考太多的歷史數據 ? 主要是參考和存取當前的和接近當前的數據 ? 并且要求有較快的響應速度 ? 可以把這類對數據的即時分析處理稱為“即時 OLAP”“ uptosecond OLAP”。 如何兼容這些差異? ? 方法 1: ? 使 ODS系統能在不同時間工作于操作型環(huán)境和分析型環(huán)境兩種狀態(tài),需要加入切換機制 ? 方法 2: ? 采用多個服務器,建立多個數據備份,使某些數據庫服務器始終處于分析型環(huán)境,采用復制技術使用其環(huán)境與其他服務器保持一致,同時保證分析處理的性能。 ? 由于數據不常更新,所以可以保存相當數量的各級綜合數據以備重復訪問,而不必為維護這些綜合數據付出多少代價。 OLTPODSDW三層體系結構 ? 由前述可知 ? 不能將 DW與 ODS相混淆。 ? 在 ODS對操作型數據進行集成較為容易實現,原因: ? 數據量比較小 建立 ODS目的 ? 并不單純是為了簡化 DW與操作型 DB環(huán)境的接口 ? 主要還是由于它具有其自身的需求: ? 建立企業(yè)級的全局應用。 ? ODS主要針對日常決策需要而出現的。 ? 假定擬定了“商品分析”主題 ? 從商品這一角度去看待采購子系統、庫存子系統和銷售子系統中有關的信息; ? 濾去商品流動的外在形式,抓住其靜態(tài)內容; ? 初步確定出商品主題所應包含的基本數據內容。 ? 原因 ? DW影響面大 ? 如果 DW已經建立,則影響面更大 ODS與 DW的建立順序方案 ? ODS在 DW之后建立 ? DW建立以后, OLTP系統變得簡單,容易建立 ODS。 ( 2)數據裝入 ? 明確數據源 ?進行 ODS數據裝入。 ( 3)元