freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫概念一覽-資料下載頁

2025-08-05 07:38本頁面
  

【正文】 據(jù)單元進(jìn)行的分析,通常不涉及數(shù)據(jù)更新。三.什么叫OLAP?用途是什么? 聯(lián)機(jī)分析處理,OnLine Analysis Processing 即從數(shù)據(jù)倉庫中抽取詳細(xì)數(shù)據(jù)的一個(gè)子集并經(jīng)過必要的聚集,存儲到OLAP存儲器中供前端分析工具讀取。OLAP系統(tǒng)按照數(shù)據(jù)存儲格式可以分為關(guān)系OLAP(RelationalOLAP,簡稱ROLAP)、多維OLAP(MultidimensionalOLAP,簡稱MOLAP)和混合型OLAP(HybridOLAP,簡稱HOLAP)三種類型。ROLAP將分析要用的多維數(shù)據(jù)存儲在關(guān)系數(shù)據(jù)庫中,并根據(jù)應(yīng)用的需要有選擇的定義一批實(shí)視圖也存儲在關(guān)系數(shù)據(jù)庫中MOLAP將OLAP分析所要用到的多維數(shù)據(jù)物理上存儲為多維數(shù)組的形式,形成“立方體”的結(jié)構(gòu)。HOLAP能把MOLAP和ROLAP兩種結(jié)構(gòu)的優(yōu)點(diǎn)有機(jī)的結(jié)合起來,能滿足用戶各種復(fù)雜的分析請求。OLTP與OLAP的區(qū)別 OLTP OLAP用戶 操作人員 決策人員功能 日常操作 分析決策DB設(shè)計(jì) 面積應(yīng)用 面向主題數(shù)據(jù) 當(dāng)前的,最新的,細(xì)節(jié)的,二維的 歷史的,概括的,多維集成的,統(tǒng)一的存取及規(guī)模 讀取少 大規(guī)模讀事實(shí)表 事實(shí)表是包含大量數(shù)據(jù)值的一種結(jié)構(gòu)。事實(shí)數(shù)據(jù)表可能代表某次銀行交易,包含一個(gè)顧客的來訪次數(shù),并且這些數(shù)字信息可以匯總,以提供給有關(guān)單位作為歷史的數(shù)據(jù)。每個(gè)數(shù)據(jù)倉庫都包含一個(gè)或者多個(gè)事實(shí)數(shù)據(jù)表。事實(shí)數(shù)據(jù)表只能包含數(shù)字度量字段和使事實(shí)表與維度表中對應(yīng)項(xiàng)的相關(guān)索引字段.,該索引包含作為外鍵的所有相關(guān)性維度表的主鍵。事實(shí)數(shù)據(jù)表中的“度量值”有兩中:一種是可以累計(jì)的度量值,另一種是非累計(jì)的度量值。用戶可以通過累計(jì)度量值獲得匯總信息。維度表用來描述事實(shí)表的某個(gè)重要方面,維度表中包含事實(shí)表中事實(shí)記錄的特性:有些特性提供描述性信息,有些特性指定如何匯總事實(shí)數(shù)據(jù)表數(shù)據(jù),以便為分析者提供有用的信息,維度表包含幫助匯總數(shù)據(jù)的特性的層次結(jié)構(gòu)緩慢變化維:在實(shí)際情況下,維度的屬性并不是靜態(tài)的,它會隨著時(shí)間的流失發(fā)生緩慢的變化。處理方法: 1新信息直接覆蓋舊信息,2,保存多條記錄,并添加字段加以區(qū)分(用y,n。0,1,2或用時(shí)間來區(qū)別新舊記錄),退化維般來說事實(shí)表中的外鍵都對應(yīng)一個(gè)維表,維的信息主要存放在維表中。但是退化維僅僅是事實(shí)表中的一列,這個(gè)維的相關(guān)信息都在這一列中,沒有維表與之相關(guān)聯(lián)。比如:發(fā)票號,序列號等等。那么退化維有什么作用呢?退化維具有普通維的各種操作,比如:上卷,切片,切塊等(上卷匯總,下鉆明細(xì);切片,切塊:對二維數(shù)據(jù)進(jìn)行切片,三維數(shù)據(jù)進(jìn)行切塊,可得到所需要的數(shù)據(jù))如果存在退化維,那么在ETL的過程將會變得容易。它可以讓group by等操作變得更快粒度:(granularity)是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級別,細(xì)化程度越高,粒度就越小。鉆取:首先從某一個(gè)匯總數(shù)據(jù)出發(fā),查看組成該數(shù)據(jù)的各個(gè)成員數(shù)據(jù)。KPI(Key Performance Indication)關(guān)鍵業(yè)績指標(biāo)用來衡量業(yè)績好壞比如銷售這個(gè)主題,銷售增長率、銷售凈利潤就是一個(gè)KPIE T Lextract/transformation/load尋找數(shù)據(jù),整合數(shù)據(jù),并將它們裝入數(shù)據(jù)倉庫的過程。ETL是將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)經(jīng)過抽取、清洗轉(zhuǎn)換之后加載到數(shù)據(jù)倉庫的過程,目的是將企業(yè)中的分散、零亂、標(biāo)準(zhǔn)不統(tǒng)一的數(shù)據(jù)整合到一起,為企業(yè)的決策提供分析的依據(jù)。工作流 抽取224。清洗,轉(zhuǎn)換224。加載 數(shù)據(jù)流 業(yè)務(wù)系統(tǒng)224。ODS224。數(shù)據(jù)倉庫方法有三種:,例如datastage,informatic,OWB,DTS,SISS. 2,利用存儲過程. 3,前兩種工具結(jié)合.抽取前的調(diào)研準(zhǔn)備工作:,各個(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫服務(wù)器運(yùn)行什么DBMS. ,手工數(shù)據(jù)量有多大。抽取中的數(shù)據(jù)處理方法:![if !supportLists]1.![endif]業(yè)務(wù)系統(tǒng)服務(wù)器與DW的DBMS相同時(shí),在DW數(shù)據(jù)倉庫服務(wù)器與原業(yè)條系統(tǒng)之間建立直接的鏈接關(guān)系就可以寫select語句直接訪問.![if !supportLists]2.![endif]業(yè)務(wù)系統(tǒng)服務(wù)器與DW的DBMS不同時(shí),對不能建立直接鏈接的話,在導(dǎo)入ODS中,或通過程序接口來完成.![if !supportLists]3.![endif]對于文件類型數(shù)據(jù)源(.)利用數(shù)據(jù)庫工程將這個(gè)數(shù)據(jù)導(dǎo)入指定的數(shù)據(jù)庫,如(oracle的SQL*LOADER,db2的import)如何實(shí)現(xiàn)增量抽取業(yè)務(wù)系統(tǒng)會記錄業(yè)務(wù)發(fā)生的時(shí)間,我們可以用來做增量的標(biāo)志,每次抽取之前首先判斷ODS中記錄最大的時(shí)間,然后根據(jù)這個(gè)時(shí)間去業(yè)務(wù)系統(tǒng)取大于這個(gè)時(shí)間所有的記錄。清洗數(shù)據(jù)清洗的任務(wù)是過濾那些不符合要求的數(shù)據(jù),將過濾的結(jié)果交給業(yè)務(wù)主管部門,確認(rèn)是否過濾掉還是由業(yè)務(wù)單位修正之后再進(jìn)行抽取。清洗的數(shù)據(jù)種類: 1,不完整數(shù)據(jù),2,錯(cuò)誤數(shù)據(jù),3重復(fù)的數(shù)據(jù).轉(zhuǎn)換:編碼轉(zhuǎn)換(m,f。男女)。字段轉(zhuǎn)換(balance,bal)。度量單位的轉(zhuǎn)換(cm,m)。業(yè)務(wù)系統(tǒng)數(shù)據(jù)存儲非常明細(xì)的數(shù)據(jù),而數(shù)據(jù)倉庫中數(shù)據(jù)是用分析的,不需要非常明細(xì),會將業(yè)務(wù)系統(tǒng)數(shù)據(jù)按照數(shù)據(jù)倉庫粒度進(jìn)行聚合.,不同的數(shù)據(jù)指標(biāo),在ETL過程,將這些數(shù)據(jù)計(jì)算好之后存儲在數(shù)據(jù)倉庫中,供分析使用(比如KPI)用過什么ETL工具(informatica,ssis,owb,datastage),以及該工具簡單講述特點(diǎn)?!ataStage是一套專門對多種操作數(shù)據(jù)源的數(shù)據(jù)抽取、轉(zhuǎn)換和維護(hù)過程進(jìn)行簡化和自動(dòng)化,并將其輸入數(shù)據(jù)集市或數(shù)據(jù)倉庫目標(biāo)數(shù)據(jù)庫的集成工具。它有四個(gè)組件:Administrator:用來管理project和環(huán)境變量。Manager:用于job,表定義,的引導(dǎo),引出。Designer:用來設(shè)計(jì)job。Direct:用運(yùn)查看job運(yùn)行日志。星形模型與雪花模型的區(qū)別?,發(fā)散出來的是維度表,每一個(gè)維度表用一個(gè)PKFK連接到事實(shí)表,維度表之間彼此并不關(guān)聯(lián)。一個(gè)事實(shí)表又包括一些度量值和維度。,也就是說,維度表數(shù)據(jù)已經(jīng)被分組成一個(gè)個(gè)的表而不是使用一個(gè)大表。例如產(chǎn)品表被分成了產(chǎn)品大類和產(chǎn)品小類兩個(gè)表。盡管這樣做可以節(jié)省了空間,但是卻增加了維度表的數(shù)量和關(guān)聯(lián)的外鍵的個(gè)數(shù)。這就導(dǎo)致了更復(fù)雜的查詢并降低了數(shù)據(jù)庫的效率維度建模(dimensional modeling):是數(shù)據(jù)倉庫建設(shè)中的一種數(shù)據(jù)建模方法。按照事實(shí)表,維表來構(gòu)建數(shù)據(jù)倉庫,數(shù)據(jù)集市。這種方法最被人廣泛知曉的名字就是星型模式(Starschema)。什么叫查找表,為什么使用替代鍵?(其實(shí)目的和上面一樣,從基礎(chǔ)表到緩慢維度表的過程中的一種實(shí)現(xiàn)途徑)替代鍵(alternate key)可以是數(shù)據(jù)表內(nèi)不作為主鍵的其他任何列,只要該鍵對該數(shù)據(jù)表唯一即可。換句話說,在唯一列內(nèi)不允許出現(xiàn)數(shù)據(jù)重復(fù)的現(xiàn)象。數(shù)據(jù)倉庫項(xiàng)目最重要或需要注意的是什么,以及如何處理?數(shù)據(jù)質(zhì)量,主要是數(shù)據(jù)源數(shù)據(jù)質(zhì)量分析,數(shù)據(jù)清洗轉(zhuǎn)換,當(dāng)然也可以定量分析數(shù)據(jù)倉庫有兩個(gè)重要目的,一是數(shù)據(jù)集成,二是服務(wù)BI數(shù)據(jù)準(zhǔn)確性是數(shù)據(jù)倉庫的基本要求,而效率是項(xiàng)目事實(shí)的前提,數(shù)據(jù)質(zhì)量、運(yùn)行效率和擴(kuò)展性是數(shù)據(jù)倉庫項(xiàng)目設(shè)計(jì)、實(shí)施高明與否的三大標(biāo)志。代理鍵:在關(guān)系型數(shù)據(jù)庫設(shè)計(jì)中,是在當(dāng)資料表中的候選鍵都不適合當(dāng)主鍵時(shí),例如資料太長,或是意義層面太多,就會用一個(gè)attribute來當(dāng)代理主鍵,此主鍵可能是用流水號,來代替可辨識唯一值的主鍵在數(shù)據(jù)倉庫領(lǐng)域有一個(gè)概念叫Surrogate key,中文一般翻譯為“代理關(guān)鍵字”。代理關(guān)鍵字一般是指維度表中使用順序分配的整數(shù)值作為主鍵,也稱為“代理鍵”。代理關(guān)鍵字用于維度表和事實(shí)表的連接。可以避免通過主鍵的值就可以了解一些業(yè)務(wù)信息
點(diǎn)擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1