freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)概述(ppt90頁(yè))-文庫(kù)吧資料

2025-01-14 01:53本頁(yè)面
  

【正文】 更容易索引、監(jiān)控和順序掃描,并且重構(gòu)、重組簡(jiǎn)單。如果涉及的數(shù)量非常大,可愛按照問題的需求從多個(gè)角度進(jìn)行分割,例如按照時(shí)間和地理位置兩個(gè)角度進(jìn)行分割,如圖 1- 29。分割方法常??梢赃x擇時(shí)間、地點(diǎn)、業(yè)務(wù)領(lǐng)域來劃分。等到抽樣獲得的樣本 4,樣本 5和樣本 6它們的數(shù)值特征非常的相似,則認(rèn)為再繼續(xù)進(jìn)行抽樣的樣本集合的數(shù)值特征也都類似,并且都同數(shù)據(jù)源具有類似的特征,抽樣的過程到此即可以結(jié)束,過程如圖 1- 26. 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM源數(shù)據(jù)樣本 1樣本 2樣本 3樣本 4樣本 5樣本 6抽樣 1抽樣 2抽樣 3抽樣 4抽樣 5抽樣 6圖 126 數(shù)據(jù)抽樣的評(píng)價(jià)方法 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM三、 數(shù)據(jù)分割: 將數(shù)據(jù)分散到各自的物理單元中,以便能夠獨(dú)立處理,提高數(shù)據(jù)處理的效率,數(shù)據(jù)分割后的數(shù)據(jù)單元成為:分片。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM數(shù)據(jù)倉(cāng)庫(kù) 樣本數(shù)據(jù)庫(kù) 數(shù)據(jù)挖掘 算法以一定抽樣率進(jìn)行抽樣圖 124 使用樣本數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM數(shù)據(jù)倉(cāng)庫(kù) 樣本數(shù)據(jù)庫(kù)數(shù)據(jù)挖掘算法( 1)以一定抽樣率進(jìn)行抽樣( 2)通過挖掘建立模型( 3)使用源數(shù)據(jù)進(jìn)行校驗(yàn)( 4)再次進(jìn)行循環(huán)分析模型圖 125 數(shù)據(jù)挖掘的循環(huán) 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM 評(píng)價(jià)抽樣率和抽樣方法是否合適,關(guān)鍵在于抽樣得到的樣本是否能夠反映源數(shù)據(jù)集合的特征,圖 1- 26所示一種常見的評(píng)價(jià)方法:通過比較樣本集合間的數(shù)值特征來評(píng)價(jià)本集合和元數(shù)據(jù)之間的相似性。由抽樣帶來的模型誤差可以在模型建立之后再次使用源數(shù)據(jù)對(duì)模型進(jìn)行校驗(yàn)和調(diào)整,這樣可以大大縮短模型建立的時(shí)間,提高模型的精確度。粒度的第二種形式是指抽樣率,即以一定的抽樣率對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行抽樣后得到一個(gè)樣本數(shù)據(jù)庫(kù),數(shù)據(jù)挖掘?qū)⒃谶@個(gè)樣本數(shù)據(jù)庫(kù)上進(jìn)行,如圖 2- 20。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM3個(gè)月內(nèi)的客戶呼叫細(xì)節(jié)數(shù)據(jù) 3個(gè)月以前的客戶呼叫細(xì)節(jié)數(shù)據(jù)高速磁盤低速的磁帶設(shè)備5年內(nèi)按月綜合的呼叫數(shù)據(jù) 10年內(nèi)按年綜合的呼叫數(shù)據(jù) 圖 123 不同的數(shù)據(jù)采用不同的存儲(chǔ)介質(zhì) 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM⑵ 針對(duì)數(shù)據(jù)挖掘 —— 統(tǒng)計(jì)中的抽樣樣本空間( 數(shù)據(jù)挖掘常常會(huì)使用非常負(fù)責(zé)的算法(如神經(jīng)元網(wǎng)絡(luò)),其計(jì)算的復(fù)雜度較高,如果我們將數(shù)據(jù)倉(cāng)庫(kù)中存放的巨量數(shù)據(jù)直接運(yùn)算,則計(jì)算時(shí)間和空間復(fù)雜度將太高,以致于系統(tǒng)難以承受。 例如,我們將近三個(gè)月的呼叫細(xì)節(jié)數(shù)據(jù)和按月綜合的數(shù)據(jù)、按年綜合的數(shù)據(jù)放在高速磁盤上,而將以往的細(xì)節(jié)數(shù)據(jù)放在低俗磁帶上,如圖 123所示。如果為了回答許多細(xì)節(jié)問題,而使系統(tǒng)的數(shù)據(jù)量極度膨脹,從而降低系統(tǒng)的運(yùn)營(yíng)效率,就背離了系統(tǒng)建設(shè)的初衷,這也是我們?cè)跀?shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)組織方式中說明的,對(duì)細(xì)節(jié)數(shù)據(jù)和綜合數(shù)據(jù)采用不同綜合策略的原因。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM8X630X58X4客戶呼叫記錄表客戶呼叫記錄按月匯總表 客戶標(biāo)識(shí)號(hào)客戶呼叫時(shí)間客戶呼叫地點(diǎn)客戶呼叫號(hào)碼呼叫時(shí)長(zhǎng)呼叫費(fèi)率客戶標(biāo)識(shí)號(hào)月份呼叫總時(shí)長(zhǎng)呼叫總次數(shù)圖 120 按 “ 月 ” 統(tǒng)計(jì)的客戶呼叫數(shù)據(jù)和按每次呼叫記載的客戶呼叫數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM細(xì)節(jié)數(shù)據(jù) 綜合數(shù)據(jù)綜合數(shù)據(jù)能夠回答的問題:王五這個(gè)月打了幾個(gè)電話?王五這個(gè)月的通話總時(shí)長(zhǎng)是多少?細(xì)節(jié)數(shù)據(jù)回答的問題:王五這個(gè)月 3號(hào)在北京打了幾個(gè)電話?王五這個(gè)月 3號(hào)給李明打過電話媽?通話時(shí)間是多少?圖 121 綜合數(shù)據(jù)和細(xì)節(jié)數(shù)據(jù)的用途不同 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM細(xì)節(jié)數(shù)據(jù) 綜合數(shù)據(jù)綜合數(shù)據(jù)回答綜合問題,只需在訪問很少的數(shù)據(jù)細(xì)節(jié)數(shù)據(jù)回答綜合問題需要訪問大量的記錄,進(jìn)行大量的計(jì)算。 圖 1- 20所示細(xì)節(jié)數(shù)據(jù)和綜合數(shù)據(jù)用途上的差異。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM當(dāng)前細(xì)節(jié)級(jí) 輕度綜合級(jí) 高度綜合級(jí)最近 3個(gè)月( 2023年 1月 2023年 3月)客戶呼叫詳細(xì)數(shù)據(jù)19952023年按月統(tǒng)計(jì)的客戶呼叫信息19952023年按季度統(tǒng)計(jì)的客戶呼叫信息19952023年按年統(tǒng)計(jì)的客戶呼叫信息2023年 1月以前的呼叫詳細(xì)數(shù)據(jù)2023/3數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的狀態(tài)最近 3個(gè)月( 2023年 2月 2023年 4月)客戶呼叫詳細(xì)數(shù)據(jù)19952023年按月統(tǒng)計(jì)的客戶呼叫信息19952023年按季度統(tǒng)計(jì)的客戶呼叫信息19952023年按年統(tǒng)計(jì)的客戶呼叫信息2023年 2月以前的呼叫詳細(xì)數(shù)據(jù)2023/4數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的狀態(tài)圖 119 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)組織示例 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM二、 數(shù)據(jù)的顆粒度 數(shù)據(jù)粒度越小 → 信息越細(xì)節(jié) → 數(shù)據(jù)粒度級(jí)別越低 → 數(shù)據(jù)量越大 數(shù)據(jù)粒度越大 → 綜合度越高 → 數(shù)據(jù)粒度級(jí)別越高 → 數(shù)據(jù)量越小數(shù)據(jù)粒度的兩種形式:⑴ 是對(duì)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的綜合程度的度量 如圖所示的例子,按照每 “月 ”統(tǒng)計(jì)的客戶呼叫數(shù)據(jù)和按照每次呼叫記載的客戶呼叫數(shù)據(jù),兩者的數(shù)據(jù)量相差極大。對(duì)于高度綜合的數(shù)據(jù),由于其數(shù)據(jù)量已經(jīng)很少,所以一般不考慮它們的導(dǎo)出問題。 在 2023/3時(shí),系統(tǒng)保留了從 2023/1~2023/3的呼叫詳細(xì)數(shù)據(jù),等到 2023/4月, 2023/1的細(xì)節(jié)數(shù)據(jù)被導(dǎo)出,保留的是從 2023/2~2023/4的呼叫詳細(xì)數(shù)據(jù)。由于客戶的呼叫數(shù)據(jù)的數(shù)據(jù)量很大,并且數(shù)據(jù)倉(cāng)庫(kù)的使用者常常只關(guān)心近期的細(xì)節(jié)數(shù)據(jù),因此我們可以在系統(tǒng)中只保留近三個(gè)月的呼叫數(shù)據(jù),而將 3個(gè)月之前的詳細(xì)數(shù)據(jù)到處到備份設(shè)備中。數(shù)據(jù)提取的周期實(shí)際上決定了動(dòng)畫間隔的時(shí)間,數(shù)據(jù)提取的時(shí)間短,則動(dòng)畫的速度快,圖 117示意了這個(gè)特點(diǎn)。數(shù)據(jù)倉(cāng)庫(kù)實(shí)際上就是記錄系統(tǒng)的各個(gè)瞬間,并通過各個(gè)瞬間連接起來形成動(dòng)畫。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM客戶號(hào): 100費(fèi)用(元): 200客戶號(hào): 100費(fèi)用(元): 250記錄號(hào): XXX時(shí)間: 3月 23日客戶號(hào): 100費(fèi)用(元): 200記錄號(hào): XXX時(shí)間: 3月 23日客戶號(hào): 100費(fèi)用(元): 200記錄號(hào): YYY時(shí)間: 3月 24日客戶號(hào): 100費(fèi)用(元): 250業(yè)務(wù)運(yùn)營(yíng)系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng) 數(shù)據(jù)倉(cāng)庫(kù)中增加一 個(gè)記錄3月 23日數(shù)據(jù)抽取3月 24日數(shù)據(jù)抽取數(shù)據(jù)更新圖 116 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)穩(wěn)定性 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM4 數(shù)據(jù)隨時(shí)間變化的特性 OLTP 的存入 = 修改 OLAP 的存入 = 增加(數(shù)據(jù)保存 大約 5—10 年) 數(shù)據(jù)倉(cāng)庫(kù) —— 記錄系統(tǒng)的各個(gè)瞬態(tài),并通過各個(gè)瞬態(tài)的連接形成動(dòng)畫。但是在數(shù)據(jù)倉(cāng)庫(kù)中(假定數(shù)據(jù)倉(cāng)庫(kù)每天進(jìn)行一次數(shù)據(jù)提?。?, 3月 23日的數(shù)據(jù)提取結(jié)果是在數(shù)據(jù)倉(cāng)庫(kù)中增加了記錄XXX,說明 100號(hào)顧客在 3月 23日的消費(fèi)金額為 200元,在執(zhí)行 3月 24日的數(shù)據(jù)提取工作后,原先記錄的 XXX并沒有發(fā)生任何的改變,而是在數(shù)據(jù)倉(cāng)庫(kù)中增加了一條新的紀(jì)錄 YYY,說明 100號(hào)顧客在 3月 24日的消費(fèi)金額為 250元。 我們?cè)趫D中演示了一個(gè)簡(jiǎn)單的例子。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM3 數(shù)據(jù)的穩(wěn)定性 OLTP 中的操作 —— 存入、查詢、修改、刪除 OLAP 中的操作 —— 存入、查詢 (注意:兩個(gè) 存入 的不同) 數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)一旦寫入,就不再變化了。靜態(tài)集成的最大缺點(diǎn)在于數(shù)據(jù)集成后數(shù)據(jù)源中的數(shù)據(jù)發(fā)生了變化,這些變化將不能反映給決策者,導(dǎo)致決策者使用的是過時(shí)的數(shù)據(jù)。 數(shù)據(jù)的集成性需要對(duì)數(shù)據(jù)進(jìn)行 ETL, 特別是轉(zhuǎn)化和清洗,其中,要注意的問題: ⑴ 數(shù)據(jù)格式 ⑵ 測(cè)量單位 ⑶ 數(shù)據(jù)代碼 ⑷ 數(shù)據(jù)名稱 數(shù)據(jù)的集成是動(dòng)態(tài)的,不是靜態(tài)的。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM計(jì)費(fèi)數(shù)據(jù)庫(kù)客戶服務(wù)數(shù)據(jù)庫(kù)市場(chǎng)信息數(shù)據(jù)庫(kù)帳務(wù)數(shù)據(jù)庫(kù)收益數(shù)據(jù) 客戶數(shù)據(jù) 市場(chǎng)數(shù)據(jù)圖 111 數(shù)據(jù)倉(cāng)庫(kù)面向主題的特性現(xiàn) 有 業(yè) 務(wù) 系 統(tǒng) 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM客戶標(biāo)識(shí)號(hào)客戶姓名客戶年齡客戶地址 . . . 客戶基本信息表 客戶呼叫記錄表客戶標(biāo)識(shí)號(hào)客戶呼叫時(shí)間客戶呼叫地點(diǎn)客戶呼叫號(hào)碼呼叫時(shí)長(zhǎng)呼叫費(fèi)率. . . . . .客戶話費(fèi)表客戶標(biāo)識(shí)表客戶本月總話費(fèi)本月月租費(fèi)本月通話費(fèi)本月短信費(fèi) . . .客戶標(biāo)識(shí)號(hào)客戶咨詢內(nèi)容咨詢答案 . . .客戶咨詢表圖 112 屬于相同主題域的數(shù)據(jù)集合使用相同的公共鍵碼連接 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM2 數(shù)據(jù)的集成性 OLTP 建表的數(shù)據(jù)在多個(gè)庫(kù)中抽取 → 蜘蛛網(wǎng)問題 OLAP 要求數(shù)據(jù)的一致性 → 集成的(李強(qiáng),李 強(qiáng)) 圖 28所示中,示例了一個(gè)數(shù)據(jù)集成的例子,某電信公司建立數(shù)據(jù)倉(cāng)庫(kù)時(shí)包括了客戶這個(gè)主題,公司的業(yè)務(wù)系統(tǒng)中,客戶的信息分散在各個(gè)業(yè)務(wù)數(shù)據(jù)庫(kù)中,需要從客戶基本信息表,客戶呼叫記錄表,客戶話費(fèi)表,客戶咨詢表等表中將數(shù)據(jù)提取并進(jìn)行集成。 (盡管數(shù)據(jù)仍以表方式存儲(chǔ),但數(shù)據(jù)組織和建模方法已不同) 需要數(shù)據(jù)庫(kù)設(shè)計(jì)、應(yīng)用開發(fā)、系統(tǒng)維護(hù)等方面進(jìn)行復(fù)雜的大量工作。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDM4 數(shù)據(jù)的一致性和完整性二、 數(shù)據(jù)倉(cāng)庫(kù)的功能和特性1 面向主題 主題: 用戶使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)所關(guān)心的重要方面。一個(gè)事務(wù)內(nèi)的所有語(yǔ)句是一個(gè)整體,要么全部執(zhí)行,要么全部不執(zhí)行。DWDM權(quán)威定義 , William Inmon 博士 90年代 初,給出: 數(shù)據(jù)倉(cāng)庫(kù): 通常是一個(gè)面向主題的、集成的、隨時(shí)間變化的、但信息本身是相對(duì)穩(wěn)定的數(shù)據(jù)集合,用于對(duì)管理決策過程的支持。 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織 數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的兩條技術(shù)路線 操作數(shù)據(jù)存儲(chǔ) ODS 外部數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)DWDMChar(20)User_nameVarchar(50)User_NameUser 表User_idUser_nameaddress…User_IDUser_NameAddressUser 維表圖 110 元數(shù)據(jù)內(nèi)容示例原始數(shù)據(jù)位置 數(shù)據(jù)清洗轉(zhuǎn)化 數(shù)據(jù)
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1