【正文】
稱數(shù)據(jù)集市和數(shù)據(jù)倉庫是相同的系統(tǒng),試圖通過這種偷梁換柱的方式來進(jìn)入數(shù)據(jù)倉庫市場。事實上,他們在銷售時強調(diào)數(shù)據(jù)集市的建設(shè)周期短,是以企業(yè)信息系統(tǒng)結(jié)構(gòu)的長期規(guī)劃為代價的。認(rèn)為企業(yè)多建立一些數(shù)據(jù)集市,將來自然就形成了數(shù)據(jù)倉庫。而業(yè)界公認(rèn)的數(shù)據(jù)倉庫之父 Bill Inmon在今年1月立即撰文反駁,旗幟鮮明地指出,你可以在大海中捕到很多的小魚并堆積起來,但它們?nèi)匀徊皇泅L。持?jǐn)?shù)據(jù)集市主張的人認(rèn)為,決策支持系統(tǒng)的成功實現(xiàn),除了數(shù)據(jù)倉庫以外,還有更簡便、更有效的其它途徑。在各種展示會期間,他們不遺余力地進(jìn)行著各種宣傳,從而混淆了數(shù)據(jù)集市與數(shù)據(jù)倉庫的概念。和原來不同的是,他們現(xiàn)在宣稱,數(shù)據(jù)倉庫只不過是多個數(shù)據(jù)集市的集成而已。這種關(guān)系使得部門之間沒有任何約束,而許多數(shù)據(jù)在整個企業(yè)內(nèi)原本應(yīng)該是相互制約、相互協(xié)調(diào)的。換言之,數(shù)據(jù)集市中往往靠對數(shù)據(jù)的預(yù)處理來換取運行時的高速度,當(dāng)業(yè)務(wù)部門提出新的問題時,如果不在原來設(shè)計的范圍內(nèi),則需要數(shù)據(jù)庫管理員對數(shù)據(jù)庫作許多調(diào)整和優(yōu)化處理。數(shù)據(jù)集市供應(yīng)商們所大力宣傳的其實正是這種獨立數(shù)據(jù)集市,因此在本文的討論中,我們所指的數(shù)據(jù)集市也是獨立數(shù)據(jù)集市。數(shù)據(jù)倉庫的數(shù)據(jù)模型一般是規(guī)范的,比較多的是符合第三范式。從圖中可以看出,數(shù)據(jù)倉庫的建設(shè)是分步進(jìn)行的,每步都能取得階段性的成果,不需要等到二、三年后才能訪問數(shù)據(jù)倉庫中的信息。數(shù)據(jù)集市中包含有許多概要和累計數(shù)據(jù),而數(shù)據(jù)倉庫中則包含有大量的詳細(xì)數(shù)據(jù)。數(shù)據(jù)集市中的主題和數(shù)據(jù)倉庫中的主題關(guān)聯(lián)并不很多。數(shù)據(jù)集市的主要結(jié)構(gòu)與數(shù)據(jù)倉庫的主要結(jié)構(gòu)具有顯著的區(qū)別。雖然這兩種綠色植物在生長的某個階段具有一些相同的特征,但這并不能遮蓋兩者的區(qū)別。數(shù)據(jù)集市中的關(guān)系與數(shù)據(jù)倉庫中的關(guān)系不同。對業(yè)務(wù)分析而言,詳細(xì)數(shù)據(jù)在很多場合都非常重要。圖3目前,數(shù)據(jù)集市的理論是,先建立一個或多個數(shù)據(jù)集市,然后把它們集成起來,當(dāng)它們增長到一定規(guī)模時就變成了數(shù)據(jù)倉庫。因此,建立數(shù)據(jù)倉庫最好是分步進(jìn)行,否則建設(shè)周期將非常長。數(shù)據(jù)倉庫中的數(shù)據(jù)量