【正文】
數(shù)據(jù)生成 ? ODS元數(shù)據(jù)主要包括以下內(nèi)容 ? ODS數(shù)據(jù)的描述 ? ODS數(shù)據(jù)源定義 ? 記錄從 OLTP的 DB向 ODS裝入時的轉(zhuǎn)換邏輯 ? ODS記錄之間的聯(lián)系 ? 建模時需要建立元數(shù)據(jù)模型 ? 數(shù)據(jù)生成的同時生成新的元數(shù)據(jù)內(nèi)容 三層體系中元數(shù)據(jù)示意圖 ODS DW 整個體系元數(shù)據(jù) ODS元數(shù)據(jù) DW元數(shù)據(jù) OLTP元數(shù)據(jù) ODS之上的功能體系實現(xiàn) ? 運(yùn)維功能體系 ? 從數(shù)據(jù)源到 ODS的數(shù)據(jù)集成 ? 從 ODS到 DW的數(shù)據(jù)集成 ? 層內(nèi)數(shù)據(jù)維護(hù) ? 應(yīng)用功能體系 ? 全局型 OLTP應(yīng)用 ? ERP,全局?jǐn)?shù)據(jù)管理 ? 即時 OLAP ? 客服,營銷, … ODS的兩條技術(shù)路線 ? 操作型數(shù)據(jù)存儲是一個新的提法,但它并不是一個新的事物。 ( 2)自底向上的建設(shè)路線 ? 如果一個企業(yè)已經(jīng)建立起了成功的較為完善的各部門的數(shù)據(jù)庫應(yīng)用系統(tǒng),那么完全放棄這些應(yīng)用系統(tǒng)去重新創(chuàng)建以全局 ODS為中心的數(shù)據(jù)庫體系結(jié)構(gòu),重復(fù)投資會很大。 ? 系統(tǒng)目標(biāo) ? 要具有即時 OLAP能力 ? 在線地與市場庫存管理子系統(tǒng)、采購子系統(tǒng)、銷售管理子系統(tǒng)和財務(wù)管理子系統(tǒng)保持?jǐn)?shù)據(jù)同步和一致的能力。 得到的 ODS數(shù)據(jù)模式 ? 商品(商品號,商品名,類別,供應(yīng)商號,時間,供應(yīng)價,差價,售出量,庫存量, ……) ? 供應(yīng)商(供應(yīng)商號,商品號,時間,供應(yīng)價,供應(yīng)量, ……) ? 顧客(顧客號,住址,電話,商品號,時間,售價,金額, ……) 步驟 3—確定數(shù)據(jù)源 ? 找到最好的數(shù)據(jù),得到數(shù)據(jù)源定義 ? 分析后認(rèn)定 ? 采購子系統(tǒng)中生成的供應(yīng)商信息、商品供應(yīng)信息是最準(zhǔn)確和及時的,所以將這部分的數(shù)據(jù)的來源定義在采購子系統(tǒng)中。 :42:0202:42:02January 20, 2023 ? 1他鄉(xiāng)生白發(fā),舊國見青山。 :42:0202:42Jan2320Jan23 ? 1世間成事,不求其絕對圓滿,留一份不足,可得無限完美。 , January 20, 2023 ? 閱讀一切好書如同和過去最杰出的人談話。 2023年 1月 20日星期五 2時 42分 2秒 02:42:0220 January 2023 ? 1一個人即使已登上頂峰,也仍要自強(qiáng)不息。勝人者有力,自勝者強(qiáng)。 。 2023年 1月 20日星期五 2時 42分 2秒 02:42:0220 January 2023 ? 1做前,能夠環(huán)視四周;做時,你只能或者最好沿著以腳為起點的射線向前。 , January 20, 2023 ? 雨中黃葉樹,燈下白頭人。 實施步驟 1—建立企業(yè)模型 ? 了解 OLTP系統(tǒng)中的數(shù)據(jù)庫模式 ? 知道原有數(shù)據(jù)庫中有什么 ? 參考數(shù)據(jù)倉庫系統(tǒng)中的主題域 ? 商品,供應(yīng)商,顧客 ? 以這些主題域為基本主題域,建立起全局的面向主題的企業(yè)模型 企業(yè)模式 ? 商品(商品號,商品名,類別,供應(yīng)商號,供應(yīng)日期,供應(yīng)價,供應(yīng)量,售價,售出量,庫存量, ……) ? 供應(yīng)商(供應(yīng)商號,供應(yīng)商名,地址,電話,商品號,供應(yīng)日期,供應(yīng)價,供應(yīng)量, ……) ? 顧客(顧客號,顧客名,性別,年齡,文化程度,住址,電話,商品號,數(shù)量,購買時間,購價,金額, ……) 步驟 2—參考 DW模型建立 ODS模型 ? 有些主題可以完全參考 DW中的主題模型 ? 假定顧客主題只做中長期分析,分析操作可以在 DW數(shù)據(jù)中進(jìn)行, ODS的作用僅限于數(shù)據(jù)傳輸,保持?jǐn)?shù)據(jù)的一致性,因此,可以采用 DW中的顧客主題的定義。 ? 建立 ODS是一個循序漸進(jìn)的過程,上面兩種路線并不定能涵蓋所有的實際情況。 ( 1)自頂向下的建設(shè)路線 ? 方法 ? 在建立 ODS過程中拋棄原有的 OLTP系統(tǒng); ? 從全局的企業(yè)模式出發(fā),重新建立起面向主題的企業(yè)全局的數(shù)據(jù)庫,即 ODS; ? 然后再從全局的數(shù)據(jù)庫系統(tǒng)出發(fā),去改造原有的應(yīng)用系統(tǒng),或者重新建立起企業(yè)的各級數(shù)據(jù)庫應(yīng)用系統(tǒng)。 ? ODS中沒有的 DW其它部分?jǐn)?shù)據(jù)仍從原 DB中抽取,最后逐步轉(zhuǎn)向 ODS。 ? ODS和 DW都有自己的數(shù)據(jù)源 ? ODS的數(shù)據(jù)源是原有分散的數(shù)據(jù)庫系統(tǒng); ? ODS這個數(shù)據(jù)環(huán)境則作為 DW重要數(shù)據(jù)源。 ( 2)進(jìn)行數(shù)據(jù)集成 ? 通過上一步,得到了在原有的操作型系統(tǒng)基礎(chǔ)上建立起來的多個面向主題的數(shù)據(jù)模型,并確定了數(shù)據(jù)源。 改造的本質(zhì) ? 以原有業(yè)務(wù)系統(tǒng)為有基礎(chǔ) ? 并非推翻原有的面向業(yè)務(wù)應(yīng)用的數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)模型,重建各數(shù)據(jù)庫系統(tǒng)。 ODSDW數(shù)據(jù)轉(zhuǎn)換實例功能 ? ODS- DW數(shù)據(jù)轉(zhuǎn)換是將 ODS Model內(nèi)數(shù)據(jù)庫表中的數(shù)據(jù)經(jīng)過轉(zhuǎn)換處理,導(dǎo)入到數(shù)據(jù)倉庫核心層- DataWareHouse Model內(nèi)數(shù)據(jù)庫表中的過程。 ? 一方面, ODS是一個全局系統(tǒng),它在原來獨立的各個 DB基礎(chǔ)上建立了一個一致的、面向主題的數(shù)據(jù)環(huán)境,從而使原有的 DB系統(tǒng)得到改造,實現(xiàn)全局?jǐn)?shù)據(jù)的一致性 ? 另一方面, ODS一致的和完整的數(shù)據(jù)世界,將 DW和原有的 DB隔離, DW卸去數(shù)據(jù)集成、結(jié)構(gòu)轉(zhuǎn)換等一系列沉重負(fù)擔(dān),使往 DW的數(shù)據(jù)追加通過 ODS進(jìn)行從而變得異常簡單,大大簡化了 DW的數(shù)據(jù)傳輸接口及 DW管理數(shù)據(jù)的復(fù)雜度。 ? DW則幾乎無所不包,從細(xì)節(jié)數(shù)據(jù)到程度各異的綜合數(shù)據(jù),從當(dāng)前數(shù)據(jù)到歷史檔案數(shù)據(jù),有時還涉及外部數(shù)據(jù)。但是,在ODS與 DW之間在如下方面仍然存在基本而重要的區(qū)別。 ? 操作型處理 ? 指含有更新操作的工作模式。 數(shù)據(jù)間的雙向映射關(guān)系 ? 為了實現(xiàn)企業(yè)級 OLTP,需要建立 ODS與OLTP數(shù)據(jù)環(huán)境間的雙向映射關(guān)系 ? 目的 ? 保持雙方數(shù)據(jù)的一致性 應(yīng)用 A 應(yīng)用 B 應(yīng)用 C 雙向映射關(guān)系示意圖 定義于OLTP環(huán)境中記錄系統(tǒng) 全局更新時應(yīng)反映到各環(huán)境中的記錄 記錄系統(tǒng)定義 參考表 分散的 OLTP數(shù)據(jù)環(huán)境 ODS數(shù)據(jù)環(huán)境 雙向映射關(guān)系所表達(dá)的兩方面 ? 一方面, ODS記錄系統(tǒng)定義表達(dá)的是ODS從操作型環(huán)境的數(shù)據(jù)抽取關(guān)系。 ? 區(qū)別與 DW中的數(shù)據(jù) ? 存放當(dāng)前數(shù)據(jù)或接近當(dāng)前的數(shù)據(jù) ? 可以進(jìn)行在線修改 Reference Materials Four Class ODSes Four classes of ODS ? From the beginning, it was predicted that there would be different classes of ODSs based on how fast data was loaded into the ODS and the source of the load. ? It was predicted that there would be four classes of ODSs: Class I. ? Transactions were moved to the ODS in an immediate manner from applications in a range of one to two seconds from the moment the transaction was executed in the operational environment until the transaction arrived at the ODS. ? In this case, the end user could hardly tell the difference between an activity that had occurred in the operational environment and the same activity as it was transmitted in the ODS environment. Class II. ? Activities that occurred in the operational environment were stored and forwarded to the ODS every four hours or so. ? In this case, there was a noticeable lag between the original execution of the transaction and the reflection of that transaction in the ODS environment. ? However, this class of ODS was much easier to build and to operate than a Class I ODS. Class III. ? The time lag between execution in the operational environment and reflection in the ODS is overnight. ? In a Class III O