freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

第6章-數據倉庫技術簡介(專業(yè)版)

2024-09-22 00:24上一頁面

下一頁面
  

【正文】 統計 數據倉庫建設 目標數據的組織和管理 目標數據的工作主要包括:根據建立數據倉庫和用戶信息的需要,按照確定的主題、粒度和指標范圍組織和分割數據;建立數據視圖、索引或數據模型,優(yōu)化系統配置,提高查詢和分析處理性能。 ⑷、數據源復雜,數據庫多 由于我國統計系統規(guī)模龐大、關系復雜、層次多, 各基層數據填報單位各自開發(fā)滿足自身需要的數據庫,難以形成數據的綜合分析與利用。第二,數據倉庫的設計不必要構造一個系統來滿足用戶的各種業(yè)務需要(有時要求甚至是相互矛盾的),企業(yè)級系統專門用于處理企業(yè)級策略。 選擇數據分析和數據展示軟件。數據挖掘強調的不僅僅是驗證人們對數據特性的假設,而且它更要主動地尋找并發(fā)現蘊藏在數據之中的規(guī)律,是人工智能中的一支,它主要使用數學工具和算法對海量數據進行挖掘和處理,發(fā)現隱藏在數據背后的事物之間的關系和發(fā)展規(guī)律,從而達到對未來趨勢進行預測、指導人們進行決策的目的。 最后,創(chuàng)建數據立方體,可以想象將維度數據放在坐標軸上,度量數據位于幾個坐標決定的點,這樣就形成一個數據立方體。 數據倉庫相關技術 3 數 據存 儲與 管理技 術 數據倉庫的真正關鍵是數據的存儲和管理。 ? 通常用于為單位的職能部門提供信息。 數據倉庫體系結構 數 據存 儲與 管理 層 :是整 個數 據 倉庫 系 統 的核心,含 數 據 倉庫 和 數 據 監(jiān) 控 與 管理系 統兩個內 容。數據變換工具為數據庫和數據倉庫之間架起了一座橋梁,使源數據得到了增值和統一,最大限度地滿足了數據倉庫高層次決策分析的需要。元 數 據是“ 關 于 數 據的 數 據”,如 傳統數 據 庫 中的 數 據字典就是一 種 元 數 據。 數據倉庫的產生 聯機分析處理就是從數據庫中獲取信息、利用信息。 集成的數據 數據倉庫的集成特性是指在數據進入數據倉庫之前,必須經過數據加工和集成,這是建立數據倉庫的關鍵步驟,首先要統一原始數據中的矛盾之處,還要將原始數據結構做一個從面向應用向面向主題的轉變。在各大數據庫廠商紛紛宣布產品支持數據倉庫并提出一整套用以建立和使用數據倉庫的產品時,業(yè)界掀起了數據倉庫熱。 面向主題的數據組織方式就是完整、統一地刻畫各個分析對象所涉及的企業(yè)的各項數據以及數據之間的聯系。最初的數據管理形式主要是文件系統,少量的以數據片段之間增加一些關聯和語義而構成層次型或網狀數據庫,但數據的訪問必須依賴于特定的程序,數據的存取方式是固定的、死板的。 數據倉庫與數據庫的關系 傳統數據庫系統承擔了企業(yè)的日常事務處理工作,但難于實現對數據分析處理要求,數據倉庫在企業(yè)的信息環(huán)境中承擔實現對數據分析處理要求,兩者在組織信息系統發(fā)揮著不同的作用。 數據倉庫的體系結構 數 據 變換 工具 為了優(yōu)化數據倉庫的分析性能,源數據必須經過變換以最適宜的方式進入數據倉庫。 ⑵、數據獲?。簲祿}庫如何高效管理數據是區(qū)別與面向操作數據庫的主要標準。 標準數據倉庫 ? 是企業(yè)最常使用的數據倉庫,它依據管理決策的需求而將數據加以整理分析,再將其轉換到數據倉庫之中。 數據抽取可以定時進行,但多個抽取操作執(zhí)行的時間、相互的順序、成敗對數據倉庫中信息的有效性則至關重要。前者為觀察的對象,后者為觀察的視角。 ? OLAP數據較之 OLTP數據要多一步數據多維化或綜合處理的操作。 從操作型數據庫中抽取、凈化、和轉換數據到數據倉庫。 數據倉庫的建立 3 數 據 倉庫 系 統開發(fā) 方法 傳統的軟件開發(fā)方法是生命周期法 雖然生命周期法是一個經典的軟件開發(fā)方法,但它對于數據倉庫系統,特別是基于數據倉庫的決策支持系統并不合適。 ⑵、數據格式多 統計業(yè)務部門相對獨立, 統計數據來源于各專業(yè),數據處理以完成專業(yè)的任務為主。 數據倉庫系統中的元數據來自于歷年存儲在不同地點、不同系統中的數據庫,因此數據的抽取、清洗、集成要充分考慮源數據庫環(huán)境和平臺。 需要有一種軟件系統在后臺大型服務器或小型機上集中統一存儲管理來自不同專業(yè)的不同時期的數據信息,前臺軟件快速靈活解決隨機動態(tài)的統計分析查詢要求。 建設統計數據倉庫必然涉及:體系結構的規(guī)劃和設計、源數據的抽取和裝載、目標數據的組織和管理、統計分析預測、統計信息查詢等。 數據倉庫的建立 3 數 據 倉庫 系 統開發(fā) 方法 傳統的軟件開發(fā)方法是生命周期法 雖然生命周期法是一個經典的軟件開發(fā)方法,但它對于數據倉庫系統,特別是基于數據倉庫的決策支持系統并不合適。 支持平面文件、索引文件、和 legacyDBMS。 數據倉庫的建立 1 設計 思路 第一,數據倉庫可能要用到很多類型的數據源,歷史數據可能很“老”,數據庫可能變得非常大。每個維度表都有一個且只有一個列作為主碼,該主碼連接到事實數據表中的一個列上。數據倉庫的數據量比傳統事務處理大得多,且隨時間的推移而累積。 數據集市 數據集市除具有數據倉庫的基本特征之外,還具有如下特點: (1)規(guī)模小,靈活,可以按照多種方式組織。 元數據庫 (metadatarepository)用于存儲數據模型和元數據,元數據描述了數據倉庫中的源數據和目標數據本身的信息,并定義了源數據到目標數據的轉換過程。屬性維和時間維是數據倉庫反映現實世界動態(tài)變化的基礎,他們的數據組織方式是整個數據倉庫技術的關鍵。 粒度:粒度是 數 據 倉庫 的 數 據 單 位中保存 數 據的 細 化或 綜合程度的 級別 。聯機分析和事務處理對系統的要求不同,同一個數據庫在理論上都難以做到兩全。 數據倉庫每個主題所對應的源數據在原分散數據庫中有許多重復或不一致的地方,因而必須對數據進行統一,消除不一致和錯誤的地方,以保證數據的質量。對我國許多企業(yè)而言,在建立或發(fā)展自己的信息系統常常困擾于這樣的問題:為什么要在原有的數據庫上建立數據倉庫?數據倉庫能否代替?zhèn)鹘y的數據庫?怎樣建立數據倉庫?等等。 數 據 倉庫 是 進 行 聯 機分析 處 理和 數 據 挖 掘的基 礎 , 它從數 據分析的角度 將聯 機事 務 中的 數 據 經過清 理、 轉換并加 載 到 數 據 倉庫 中, 這 些 數 據在 數 據 倉庫 中被合理的 組織 和 維護 ,以 滿 足聯 機分析 處 理和 數 據 挖 掘的要求。數據倉庫的建立并不是要取代數據庫,它要建立在一個較全面和完善的信息應用的基礎上,用于支持高層決策分析,而事務處理數據庫在企業(yè)的信息環(huán)境中承擔的是日常操作性的任務。數據倉庫的概念一經出現,就首先被用于金融、電信、保險等主要傳統數據處理密集型行業(yè)。 源 數 據 源數據指分布在不同的應用系統中,存儲在不同的平臺和不同的數據庫中的大量的數據信息,是數據倉庫系統的基礎,是整個系統的數據源泉。這使得決策查詢更容易、更有效。 ?數據集市。 數據的抽取是數據進入倉庫的入口。OLAP最基本的概念其實只有三個:多維分析、數據鉆取、立方體運算。 ? 轉軸 :改變維的方向,將一個三維立方體轉變?yōu)橐幌盗卸S平面。 建立數據模型和數據倉庫的物理設計。 能在抽取的過程中計算生成衍生字段。統計行業(yè)
點擊復制文檔內容
高考資料相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1