freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第2章數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)存儲(chǔ)與處理(留存版)

  

【正文】 ince country location Sales Fact Table time_key item_key branch_key location_key units_sold dollars_sold avg_sales Measures item_key item_name brand type supplier_type item branch_key branch_name branch_type branch 44 ?雪花模式實(shí)例 time_key day day_of_the_week month quarter year time location_key street city_key location Sales Fact Table time_key item_key branch_key location_key units_sold dollars_sold avg_sales Measures item_key item_name brand type supplier_key item branch_key branch_name branch_type branch supplier_key supplier_type supplier city_key city state_or_province country city location維表包含屬性集:{location_key,street,city,province_or_state,country} 例如: Vancouver和 Victoria都是加拿大不列顛哥倫比亞省的城市,此時(shí) location維表中這些城市實(shí)體的該屬性有冗余。 連接索引舉例: 40 多維數(shù)據(jù)模型 導(dǎo)出數(shù)據(jù)的特征: 。 ?????※ 最?。畲笠?guī)范化 :對(duì)原始數(shù)據(jù)進(jìn)行線性變換,使得數(shù)據(jù)落在 new_ maxA,new_minA區(qū)間內(nèi)。 ?兩種類(lèi)型的數(shù)據(jù)轉(zhuǎn)換 ?記錄級(jí) 選擇、連接、規(guī)范化和聚集 ?字段級(jí) 單字段和多字段 單字段轉(zhuǎn)換的基本方法:算法和查找表 注意:連接的復(fù)雜性。 8 數(shù)據(jù)倉(cāng)庫(kù)中的元數(shù)據(jù) 元數(shù)據(jù)就是定義數(shù)據(jù)的數(shù)據(jù),也就是說(shuō)明數(shù)據(jù)倉(cāng)庫(kù)對(duì)象的數(shù)據(jù) .可以分成技術(shù)元數(shù)據(jù)與業(yè)務(wù)元數(shù)據(jù)。 ?缺點(diǎn):復(fù)雜的信息過(guò)濾和集成處理,競(jìng)爭(zhēng)資源 ?數(shù)據(jù)倉(cāng)庫(kù) 更新驅(qū)動(dòng) ?將來(lái)自多個(gè)異種源的信息預(yù)先集成,并存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,供直接查詢(xún)和分析 ?高性能 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù) ETL過(guò)程 12 傳統(tǒng)的異種數(shù)據(jù)庫(kù)集成 : 數(shù)據(jù)倉(cāng)庫(kù) : 更新驅(qū)動(dòng) ....... 查詢(xún) 轉(zhuǎn)換/集成 子結(jié)果/子查詢(xún) 異種數(shù)據(jù)庫(kù) ....... 查詢(xún) 查詢(xún) 數(shù)據(jù)歸集 異種數(shù)據(jù)庫(kù) 13 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù) ETL過(guò)程 ETL概念 數(shù)據(jù) ETL是用來(lái)實(shí)現(xiàn)異構(gòu)數(shù)據(jù)源的數(shù)據(jù)集成,即完成數(shù)據(jù)的如下工作: ?抓取 /抽?。?Capture/Extract) ?清洗( Scrub or data cleansing) ?轉(zhuǎn)換( Transform) ?裝載與索引( Load and Index) 等數(shù)據(jù)集成工作 14 數(shù)據(jù)具有的特點(diǎn): ? 詳細(xì)的 ?歷史的 ?規(guī)范化的 ETL的目標(biāo) ETL過(guò)程的目標(biāo):為決策支持應(yīng)用提供一個(gè)單一的、權(quán)威的數(shù)據(jù)源。 如:工資、基本工資、加班工資 29 Σ[( AA平 )( BB平 ) ] RA,B = ( n1) σA σB ?如果 RA ,B 〉 0,則 A和 B是正相關(guān)的;該值越大,則 A涵蓋 B的可能性越大。 ※ 小數(shù)定標(biāo)規(guī)范化:通過(guò)移動(dòng)屬性 A的小數(shù)點(diǎn)位置進(jìn)行規(guī)范化。 EDW、 ODS 選擇、格式化、聚集 數(shù)據(jù)集市 調(diào)和數(shù)據(jù) 導(dǎo)出數(shù)據(jù) 導(dǎo)出數(shù)據(jù)層的存儲(chǔ)方式: 1. 存儲(chǔ)在多維數(shù)據(jù)庫(kù)中,即按照多維數(shù)組方式存儲(chǔ),對(duì)應(yīng) MOLAP。 以關(guān)系數(shù)據(jù)庫(kù)為核心 , 以關(guān)系型結(jié)構(gòu)進(jìn)行多維數(shù)據(jù)的表示和存儲(chǔ) 。 ?雪花模式 ( Snowflake schema) 星型模式的變種 , 其中某些維表是規(guī)范化的 , 因而把數(shù)據(jù)進(jìn)一步分解到附加表中 , 模式圖形成類(lèi)似于雪花的形狀 。 例如: R(RID,A)和 S(B,SID)在屬性 A和 B上連接 , 其連接索引為 (RID,SID)。 32 數(shù)據(jù)變換 —— 規(guī)范化 maxA,minA :屬性 A的最大與最小值 new_ maxA,new_minA:屬性 A變換后區(qū)間的最大與最小值 AAAAAA minnewminnewmaxnewminmaxminvv _)__(39。 27 ( Transform) ?定義: 將數(shù)據(jù)從源操作型業(yè)務(wù)系統(tǒng)的格式轉(zhuǎn)換到企業(yè)數(shù)據(jù)倉(cāng) 庫(kù)的數(shù)據(jù)格式。如下表。 ?可以理解的 ?即時(shí)的 ? 質(zhì)量可控制的 15 ETL的目標(biāo) 操作性數(shù)據(jù)的特點(diǎn): ? 即時(shí)的,而非歷史的 ? 規(guī)范程度不一,依賴(lài)于數(shù)據(jù)來(lái)源 ? 限制在特定的應(yīng)用范圍 ? 質(zhì)量較差,例如不一致等 16 ETL過(guò)程描述 操 作 型系 統(tǒng)E D W或O D S抽 取 / 抓 取清 洗轉(zhuǎn) 換加 載 與 索 引拒 絕 數(shù) 據(jù) 的 信 息有 關(guān) 拒 絕 數(shù) 據(jù) 的 信 息集 結(jié) 地( S t a g i n g A r e
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1