freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

《數(shù)據(jù)倉庫設(shè)計》ppt課件-文庫吧

2025-03-07 08:37 本頁面


【正文】 ? 數(shù)據(jù)抽?。?Extraction)、轉(zhuǎn)換( Transformation)、集成、裝載( Load)和刷新( Refresh)工具:格式、凈化和匯總 ? 數(shù)據(jù)建模工具( Modeling Tools) ? 元數(shù)據(jù)倉儲( Metadata Repository) ? 數(shù)據(jù)倉庫監(jiān)控( Monitoring)和管理( Administration)工具: 維護(hù)數(shù)據(jù)倉庫中的數(shù)據(jù),備份、恢復(fù)數(shù)據(jù)以及管理數(shù)據(jù)的安全權(quán)限問題。 ? 數(shù)據(jù)倉庫及數(shù)據(jù)集市的目標(biāo)數(shù)據(jù)庫( Target DataBase) ? OLAP服務(wù)器 ? 前端數(shù)據(jù)訪問和分析工具 轉(zhuǎn)換器 ? 轉(zhuǎn)換器的功能: ? 數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換和數(shù)據(jù)類型轉(zhuǎn)換 ? 非結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換 創(chuàng)建數(shù)據(jù)準(zhǔn)備區(qū) N 開始 讀源數(shù)據(jù) 檢查數(shù)據(jù)準(zhǔn)備區(qū) ? 執(zhí)行 DTS包 更改元數(shù)據(jù)(時間,數(shù)據(jù)狀態(tài)) 結(jié)束 成功 連接源數(shù)據(jù)庫 創(chuàng)建 DTS包 Y 數(shù)據(jù)準(zhǔn)備區(qū) ? 從源數(shù)據(jù)中提取數(shù)據(jù),轉(zhuǎn)換成數(shù)據(jù)倉庫所要求的格式后存儲在數(shù)據(jù)倉庫的一個稱為數(shù)據(jù)準(zhǔn)備區(qū)的緩沖區(qū)中。在該區(qū)域中,可以暫時存儲原始數(shù)據(jù),然后由集成器對數(shù)據(jù)進(jìn)行清理、集成后再裝載到數(shù)據(jù)倉庫中。 源數(shù)據(jù) 數(shù)據(jù)準(zhǔn)備區(qū) 數(shù)據(jù)倉庫 集成器 ? 數(shù)據(jù)凈化(有效值和范圍檢驗) ? 維表與事實表的引用完整性檢驗:當(dāng)維表和事實數(shù)據(jù)表之間的引用完整性破壞時,這類查詢可能會導(dǎo)致檢索數(shù)據(jù)不準(zhǔn)確或不同查詢之間數(shù)據(jù)的不一致性錯誤。 ? 統(tǒng)一數(shù)據(jù)編碼 ? 日期格式轉(zhuǎn)換 ? 測量單位的轉(zhuǎn)換 監(jiān)控器捕捉數(shù)據(jù)變化的途徑 ? 時標(biāo)方法:在記錄中插入新的時標(biāo)或加上更新時的時標(biāo),然后根據(jù)時標(biāo)判斷哪些數(shù)據(jù)是變化的,并把變化的數(shù)據(jù)追加到數(shù)據(jù)倉庫中去。 ? DELTA文件:該文件是由應(yīng)用產(chǎn)生的,并記錄了應(yīng)用所改變的所有內(nèi)容。利用 DELTA文件記錄數(shù)據(jù)的變化,不需要掃描整個數(shù)據(jù)庫,所以效率較高,但生成的 DELTA文件的應(yīng)用并不普遍。 ? 映象文件:在上次提取數(shù)據(jù)庫數(shù)據(jù)到數(shù)據(jù)倉庫之后及本次提取數(shù)據(jù)庫數(shù)據(jù)之前,對數(shù)據(jù)庫分別作一次快照,然后通過比較兩幅快照的不同來確定要追加的數(shù)據(jù)。這種方法需要占用大量的系統(tǒng)資源,對系統(tǒng)的性能影響比較大。 ? 日志文件:由于日志文件是數(shù)據(jù)庫的固有機(jī)制,所以它對系統(tǒng)性能的影響比較小,另外它還有 DELTA文件的優(yōu)點,提取數(shù)據(jù)只局限于日志文件而不用掃描整個數(shù)據(jù)庫。日志文件是最可行的一種方法。 ?倉庫數(shù)據(jù)庫乎總是一個關(guān)系數(shù)據(jù)庫系統(tǒng); ?OLAP服務(wù)器用于多維分析; ?客戶層,包括查詢和報告工具、分析工具和 /或數(shù)據(jù)挖掘工具。 三層結(jié)構(gòu)的數(shù)據(jù)倉庫( 1) 三層結(jié)構(gòu)的數(shù)據(jù)倉庫( 2) ? 客戶端: ? 可視化的用戶界面 ? 客戶端通信組件 ? 應(yīng)用服務(wù)器端: ? 服務(wù)器端通信組件 ? 調(diào)度組件 ? 安全組件 ? 元數(shù)據(jù)管理器 ? 轉(zhuǎn)換器 ? 集成器 ? 數(shù)據(jù)庫服務(wù)器端 ? 源數(shù)據(jù) ? 元數(shù)據(jù)庫 ? 數(shù)據(jù)準(zhǔn)備區(qū) ? 數(shù)據(jù)倉庫 數(shù)據(jù)倉庫中的數(shù)據(jù)組織 高度綜合級 輕度綜合級 當(dāng)前綜合級 早期細(xì)節(jié)級 多級數(shù)據(jù) 從事務(wù)型處理環(huán)境中提取的源數(shù)據(jù)經(jīng)過綜合后,首先進(jìn)入當(dāng)前細(xì)節(jié)級,并根據(jù)需要進(jìn)行進(jìn)一步的綜合進(jìn)入輕度綜合級或高度綜合級,老化的數(shù)據(jù)將進(jìn)入早期細(xì)節(jié)級。 粒度 ? 粒度影響數(shù)據(jù)倉庫中的數(shù)據(jù)量和查詢的種類; ? 聚合是構(gòu)成維內(nèi)不同層次的數(shù)據(jù)集,使用戶能夠在維度內(nèi)的不同層次上觀察數(shù)據(jù)。 元數(shù)據(jù) ? 要有效的管理數(shù)據(jù)倉庫,必須設(shè)計一個描述能力強(qiáng)、內(nèi)容完善的元數(shù)據(jù)。 ? 元數(shù)據(jù)描述了數(shù)據(jù)倉庫中源數(shù)據(jù)和目標(biāo)數(shù)據(jù)本身的信息,定義了從源數(shù)據(jù)到目標(biāo)數(shù)據(jù)的轉(zhuǎn)換過程。 元數(shù)據(jù)可用文件存在元數(shù)據(jù)庫中。 元數(shù)據(jù)的種類 ? 轉(zhuǎn)換元數(shù)據(jù):為了從事務(wù)處理型環(huán)境向數(shù)據(jù)倉庫中轉(zhuǎn)換而建立的元數(shù)據(jù),它包含了所有源數(shù)據(jù)的信息、事務(wù)描述、數(shù)據(jù)結(jié)構(gòu)的定義、提取數(shù)據(jù)和傳送數(shù)據(jù)的算法、綜合數(shù)據(jù)和凈化數(shù)據(jù)的規(guī)則、數(shù)據(jù)訪問和傳送的記錄等。 ? DSS元數(shù)據(jù):在數(shù)據(jù)倉庫中用來與終端用戶的多維商業(yè)模型 /前端工具之間建立映射,常用來開發(fā)更先進(jìn)的決策支持工具。 元數(shù)據(jù)的內(nèi)容 ? 與數(shù)據(jù)庫的數(shù)據(jù)字典中相似的內(nèi)容 ? 數(shù)據(jù)倉庫的主題描述 ? 外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的描述 ? 記錄系統(tǒng)定義 ? 邏輯模型的定義 ? 數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫的轉(zhuǎn)換規(guī)則 ? 數(shù)據(jù)的提取歷史 ? 粒度的定義 ? 數(shù)據(jù)分割的定義 ? 廣義索引 ? 有關(guān)存儲路徑和結(jié)構(gòu)的描述 ? 關(guān)于源數(shù)據(jù)的元數(shù)據(jù) ? 關(guān)于數(shù)據(jù)倉庫映射的元數(shù)據(jù) ? 關(guān)于系統(tǒng)安全的元數(shù)據(jù)。 ? 與設(shè)計時采用的具體技術(shù)以及具體應(yīng)用環(huán)境有關(guān)的內(nèi)容 ?與傳統(tǒng)數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)字典中相似的內(nèi)容。 ?數(shù)據(jù)倉庫的主題描述。 ?外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的描述。 ?記錄系統(tǒng)定義。 ?邏輯模型的定義。 ?數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫的轉(zhuǎn)換規(guī)則。 ?數(shù)據(jù)的提取歷史。 ?粒度的定義。 ?數(shù)據(jù)分割的定義。 ?廣義索引。 ?有關(guān)存儲路徑和結(jié)構(gòu)的描述 數(shù)據(jù)倉庫的虛擬存儲方式 ? 數(shù)據(jù)倉庫中的數(shù)據(jù)仍然存儲在源數(shù)據(jù)庫中,只是根據(jù)用戶的多維分析需求而形成多維視圖,臨時在源數(shù)據(jù)庫中找出并提取所需要的數(shù)據(jù),完成多維分析。 ? 優(yōu)點:比較簡單、花費少、使用靈活 ? 缺點:要求源數(shù)據(jù)庫的組織比較規(guī)范、數(shù)據(jù)完備并沒有冗余,同時又比較接近多維數(shù)據(jù)模型時,而一般數(shù)據(jù)庫難以滿足這些要求,在實際應(yīng)用中難以有效建立。 數(shù)據(jù)倉庫的數(shù)據(jù)組織形式( 1) ? 簡單堆積文件 :每天從操作型數(shù)據(jù)庫中提取加工后的數(shù)據(jù)逐日積累的存儲起來。存儲的數(shù)據(jù)細(xì)節(jié)化程度很高,可以應(yīng)付多種細(xì)節(jié)查詢,但分析時查詢的效率較低。 操作型數(shù)據(jù) 每日事務(wù)處理 每日綜合 2月 1日 2月 2日 2月 3日 。 3月 1日 3月 2日 3月 3日 。 1月 1日 1月 2日 1月 3日 。 ? 輪轉(zhuǎn)綜合文件: 數(shù)據(jù)存儲單位被分為日、周、月、年等幾個級別,逐級綜合。 每日事務(wù)處理 每日綜合 操作型數(shù)據(jù) 第 1天 第 2天 第 3天 … 第 7天 第 1周 第 2周 第 3周 … 第 5周 第 1月 第 2月 第 3月 … 第 12月 第 1年 第 2年 第 3年 … 第 n年 數(shù)據(jù)倉庫的數(shù)據(jù)組織形式( 2) ? 簡單直接文件 : 類似于簡單堆積文件,但它是間隔一定時間的數(shù)據(jù)庫快照,比如每隔一星期或一個月作一次。 ? 連續(xù)文件:通過兩個比較簡單直接文件的不同而生成的。 1月份彩電銷售 海爾 68 長虹 100 東芝 20 熊貓 10 …… …… 2月份彩電銷售 海爾 150 長虹 90 東芝 40 熊貓 30 …… …… 海爾 1月份至今 218 長虹 1月份至今 190 東芝 1月份至今 60 熊貓 1月份至今 40 …… …… …… 數(shù)據(jù)倉庫的數(shù)據(jù)組織形式( 3) 數(shù)據(jù)倉庫建模 Data Warehouse Modeling 星型圖模型 物 理 數(shù) 據(jù) 模型 概念模型 邏輯模型 物理模型 面向用戶的需求 細(xì) 化層次 更詳細(xì)的 技術(shù)細(xì)節(jié) 數(shù)據(jù)倉庫的數(shù)據(jù)模型 信息包圖 信息包圖(概念模型) ? 信息包圖:數(shù)據(jù)倉庫的數(shù)據(jù)模型的最高層。由于大多數(shù)商務(wù)數(shù)據(jù)是多維的,但傳統(tǒng)的數(shù)據(jù)模型表示三維以上的數(shù)據(jù)有一定困難。這種模型集中在用戶對信息包的需要,信息包提供了分析人員思維模式的可視化表示。 ? 工作: ? 確定系統(tǒng)邊界:決策類型、需要的信息、原始信息 ? 確定主題域及其內(nèi)容:主題域的公共鍵碼、聯(lián)系、屬性組 ? 確定維度:如時間維、銷售位置維、產(chǎn)品維、組別維等 ? 確定類別:相應(yīng)維的詳細(xì)類別 ? 確定指標(biāo)和事實:用于進(jìn)行分析的數(shù)值化信息 銷售分析的信息包圖 日期 銷售地點 銷售產(chǎn)品 年齡組別 性別 年 (10) 國家 (15) 產(chǎn)品類 (6) 年齡組
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1