freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

數據倉庫原理設計教材(編輯修改稿)

2025-03-27 12:40 本頁面
 

【文章內容簡介】 每個存儲時間 來估計表的記錄數量。 以上方法估算的結果只能作為數據粒度選樣和軟硬件平臺選取的參考數據,它同實際系統的數據量可能會有較大的出入。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 二、 數據顆粒度的選擇 單一數據粒度的概念: 直接存儲細節(jié)數據并定期在細節(jié)數據基礎上進行數據綜合。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 二、 數據顆粒度的選擇 雙重粒度的概念: 對于細節(jié)數據只保留近期的數據在數據倉庫中,當保留周期到達時,將距離當前較遠的數據導出到磁盤上,從而為最新的數據騰出空間。這樣,數據倉庫只保留在細節(jié)數據保留周期之內的數據,對于這個周期之后的信息,數據倉庫只保留其綜合數據。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 二、 數據顆粒度的選擇 雙重粒度的概念(續(xù)): 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 二、 數據顆粒度的選擇 雙重粒度的概念(續(xù)): 單一粒度和雙重粒度的區(qū)別在于細節(jié)數據在數據倉庫的高速存儲設備中存儲的時間長短不同。 在使用雙重粒度時,一個重要的參數是細節(jié)數據的 保留周期 ,這個周期對于不同行業(yè)、不同需求可能有不同的答案。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 二、 數據顆粒度的選擇 粒度的選擇 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 二、 數據顆粒度的選擇 粒度層次劃分 無論是單一粒度還是雙重粒度,在數據倉庫中都存在多重綜合層次的數據。有幾個因素會影響粒度層次的劃分。 ( 1)要接受的分析類型 ( 2)可接受的最低粒度 ( 3)能存儲數據的存儲容量 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 三、 表的分割 在確定粒度之后,需要考慮的是表的分割策略,常用的分割策略是按照時間進行如圖所示。比如商品供應關系問題可以采用雙重粒度,保留近 6個月的細節(jié)數據。綜合數據可以按照年進行分割。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 三、 表的分割 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 四、 增加時間字段 在數據粒度/分割策略確定之后,我們可以將表按照數據粒度 /分割策略的需求定義新表,并為各個表增加合適的時間字段;比如在上圖中的細節(jié)數據,我們使用的時間字段是“供貨日期”,按月綜合數據使用的時間字段是“供貨月份”。時間字段實際上體現了數據粒度的信息。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 五、 去除純操作型數據 在將業(yè)務系統中的數據抽取到細節(jié)數據表或者綜合數據表時,需要去除純操作型數據。純操作型數據就是與分析毫無關系的數據,這些數據字段通常是為了方便業(yè)務系統的運營而設立的,它們對于面向分析的數據倉庫系統沒有實際的意義。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分 通過增加合適的時間字段、去除純操作型數據,我們的模型更進了一步。但是在實際的系統中,一張表的字段數目常常很多。如果直接存放字段數目很大的表,可能存在下列的問題: (1)從數據的存儲角度上看,表中有的字段更新較為頻繁,因而對于這些數據字段數據倉庫需要經常進行數據追加工作。而表中的其他字段的更新操作很少,對于這些字段,數據追加的工作較少。如果將變化很快的字段同變化很慢(很少 )的字段放在一張表中,則將浪費大量的存儲空間。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分(續(xù)) (2)從數據的訪問角度看,表中的部分字段是經常被訪問的,而其他的字段訪問較少。如果將所有字段放在一張表中,就使得表的體積增大,不能將經常需要使用的部分放在內存中,這樣將影響訪問的效率。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分(續(xù)) 基于這樣的原因,我們需要對表中的內容進行合理的劃分。劃分的方法可以按照數據的變化情況進行、也可以按照業(yè)務規(guī)則進行。 (1)按照數據的穩(wěn)定性對表進行劃分。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分 (2)按照業(yè)務規(guī)則進行表劃分 .Inmon在 《 Building the Data Warehouse》 中提出了 DIS( data item set)的設計方法,這種方法是將數據按照業(yè)務規(guī)則對共有數據和專有數據進行劃分。 DIS模型由初始數據、二次數據、連接數據以及不同數據“類型”組成 . 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分 例: 如圖所示的是一個商品交易的 DIS模型。將交易分成現金、信用卡、支票以及是否大客戶等類型。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分 對于業(yè)務系統中記載的: “ 345號顧客 非大客戶 時間: 2023/ l/ l 14: 03 購買商品: 1 付款方式:小量 現金” “ 368號顧客 大客戶 時間: 200l/ l/ 2 15: 53購買商品: 1 付款方式:批量 支票” 兩條記錄,映射在 DIS模型中,將生成 6條記錄。 (1)初始數據表中的兩條記錄用于記載僅出現一次的信息,比如 交易號、商品號、顧客號、支付類型、是否批量 等信息。 (2)在現金表中出現一條記錄記載 345號顧客的購買行為;在小量表中出現一條記錄記載 345號顧客的購買行為。在支票表中出現一條記錄記載 368號顧客的購買行為;在批量表中出現一條記錄記載 368號顧客的購買行為 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 六、 合理的表劃分 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 七、 定義關系模式 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 八、 增加導出字段 導出數據本身是冗余的,但是生成導出數據可以方便數據以后的使用。下圖給出了供應關系按月綜合表增加導出數據的例子。在按月綜合表中,增加了“平均價格”、“供貨總價值”、“供應總數量”等導出字段。 數據倉庫模型設計 第一章 數據倉庫原理 數據倉庫的邏輯模型設計 九、 記錄系統的定義 記錄系統的定義就是指明數據倉庫中關系表各個字段來源于哪個業(yè)務數據庫的哪張表的哪個字
點擊復制文檔內容
醫(yī)療健康相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1