freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

edw數(shù)據(jù)倉庫項目方案(完整版)

2025-06-19 03:35上一頁面

下一頁面
  

【正文】 ......................................................5 執(zhí)行架構(gòu)設(shè)計原則 ..................................................................5 執(zhí)行架構(gòu)框架 .........................................................................6 EDW 邏輯架構(gòu) ..............................................................................13 邏輯架構(gòu)框架 ......................................................................13 數(shù)據(jù)處理流程 ......................................................................19 EDW 運(yùn)維架構(gòu) ..............................................................................20 運(yùn)維架構(gòu)概述 ......................................................................20 運(yùn)維架構(gòu)的邏輯框架 ...........................................................21 EDW 數(shù)據(jù)架構(gòu) ..............................................................................26 數(shù)據(jù)架構(gòu)設(shè)計原則 ...............................................................26 數(shù)據(jù)架構(gòu)分層設(shè)計 ...............................................................28 EDW 應(yīng)用架構(gòu) ..............................................................................30 應(yīng)用架構(gòu)設(shè)計原則 ...............................................................30 數(shù)據(jù)服務(wù) .............................................................................31 應(yīng)用服務(wù) .............................................................................32第二章 ETL 體系建設(shè) ...........................................................................333 / 47 ETL 架構(gòu)概述 ..............................................................................33 ETL 設(shè)計方案 ..............................................................................35 ETL 關(guān)鍵設(shè)計環(huán)節(jié) .......................................................................35 接口層設(shè)計策略 ..................................................................35 Staging Area 設(shè)計策略 .......................................................35 數(shù)據(jù)加載策略 ......................................................................36 增量 ETL 設(shè)計策略 ...............................................................36 異常處理 .............................................................................38 作業(yè)調(diào)度和監(jiān)控 ..................................................................39 元數(shù)據(jù)管理 .........................................................................39 ETL 模塊設(shè)計 .......................................................................39 ETL 流程設(shè)計 .......................................................................42 動態(tài)資源分配 ....................................................................44 數(shù)據(jù)接口設(shè)計 ....................................................................454 / 47第一章 系統(tǒng)總體架構(gòu) 總體架構(gòu)設(shè)計概述 總體架構(gòu)的設(shè)計框架XX 銀行 EDW 項目的總體架構(gòu)分為基礎(chǔ)技術(shù)架構(gòu)、應(yīng)用架構(gòu)和數(shù)據(jù)架構(gòu)三個核心部分。運(yùn)維架構(gòu)通過相應(yīng)的流程和工具實現(xiàn)對邏輯架構(gòu)、功能組件架構(gòu)、執(zhí)行架構(gòu)、數(shù)據(jù)架構(gòu)以及應(yīng)用架構(gòu)的運(yùn)維和管理。? 多級/自動的增量 ETL 加載機(jī)制,有效提高 ETL 并發(fā)度、加載效率,降低錯誤處理的復(fù)雜性。 執(zhí)行架構(gòu)設(shè)計原則在 EDW 項目實施的過程中,系統(tǒng)執(zhí)行架構(gòu)的建設(shè)應(yīng)遵循以下技術(shù)原則:? 開放性原則:EDW 項目的生產(chǎn)環(huán)境的建設(shè)應(yīng)基于業(yè)界開放標(biāo)準(zhǔn),對系統(tǒng)中使用的網(wǎng)絡(luò)協(xié)議、硬件接口、數(shù)據(jù)接口等應(yīng)進(jìn)行統(tǒng)一規(guī)劃,EDW 系統(tǒng)應(yīng)支持主流的應(yīng)用軟件包及其部署的各種硬件平臺。在以下的內(nèi)容中將對執(zhí)行架構(gòu)中的功能框架以及框架之間的關(guān)系進(jìn)行詳細(xì)描述,具體內(nèi)容包括:8 / 47? 數(shù)據(jù)源:包括 XX 銀行的多個業(yè)務(wù)系統(tǒng),主要有核心系統(tǒng)、個貸系統(tǒng)、信貸系統(tǒng)、國際業(yè)務(wù)系統(tǒng)、財務(wù)系統(tǒng)和各類渠道系統(tǒng)等。數(shù)據(jù)落地區(qū)的數(shù)據(jù)存儲格式原則上是與數(shù)據(jù)源的存儲格式保持一致 數(shù)據(jù) ETL 架構(gòu)ETL 是數(shù)據(jù)的抽取、轉(zhuǎn)換、加載的全部過程,它是數(shù)據(jù)從數(shù)據(jù)落地區(qū)到 ETL服務(wù)器以及從 ETL 服務(wù)器到 EDW 的數(shù)據(jù)遷移過程以及數(shù)據(jù)從 EDW 向數(shù)據(jù)集市的數(shù)據(jù)遷移過程中必須使用的過程和方法, ETL 系統(tǒng)應(yīng)包括以下三個主要功能:? 數(shù)據(jù)抽取:從數(shù)據(jù)落地區(qū)系統(tǒng)抽取 EDW 中需要的數(shù)據(jù);? 數(shù)據(jù)轉(zhuǎn)換:將從源數(shù)據(jù)系統(tǒng)獲取的數(shù)據(jù)轉(zhuǎn)換成 EDW 要求的形式,同時按照業(yè)務(wù)需求對數(shù)據(jù)進(jìn)行轉(zhuǎn)換;? 數(shù)據(jù)加載:將助轉(zhuǎn)換后的數(shù)據(jù)裝載到 EDW 的物理模型中; 數(shù)據(jù)準(zhǔn)備區(qū)數(shù)據(jù)準(zhǔn)備區(qū)是數(shù)據(jù)存儲的臨時存儲區(qū)域,數(shù)據(jù)在其中只作暫時性保存,數(shù)據(jù)經(jīng)轉(zhuǎn)換后導(dǎo)入到 EDW 的物理模型中。數(shù)據(jù)存儲區(qū)中的數(shù)據(jù)模型對標(biāo)準(zhǔn)層數(shù)據(jù)、基礎(chǔ)整合數(shù)據(jù)、匯總數(shù)據(jù)和面向應(yīng)用的集市數(shù)據(jù)按數(shù)據(jù)層次進(jìn)行管理,每個數(shù)據(jù)層有自己的數(shù)據(jù)管理重點。通過數(shù)據(jù)集市可以保障 EDW 的高可用性、可擴(kuò)展性和高性能。 元數(shù)據(jù)管理元數(shù)據(jù)管理是對數(shù)據(jù)信息的收集和發(fā)布的集成管理,數(shù)據(jù)信息包括:數(shù)據(jù)的業(yè)務(wù)含義和技術(shù)特性。? 一致性:數(shù)據(jù)和程序只能在授權(quán)模式下進(jìn)行修改。整個系統(tǒng)的網(wǎng)絡(luò)環(huán)境應(yīng)得到實時監(jiān)控,對入侵進(jìn)行檢測和處理,并在發(fā)生入侵時通知系統(tǒng)管理員。 源數(shù)據(jù)層【功能與作用】總行的各個業(yè)務(wù)系統(tǒng)為整個 EDW 系統(tǒng)提供原始數(shù)據(jù)支持,首先作為 ETL 層的數(shù)據(jù)抽取源。ETL 調(diào)度管里最基本的可執(zhí)行元素是單元,每個單元是完成某一特定功能的程序,相關(guān)單元組合在一起構(gòu)成了可以調(diào)度的最小組件——任務(wù)。作為專門為數(shù)據(jù)倉庫系統(tǒng)設(shè)計的流程調(diào)度管理具有如下特點:? 任務(wù)執(zhí)行代理可分布在多臺服務(wù)器上。詳細(xì)內(nèi)容參見“EDW 數(shù)據(jù)架構(gòu)” 數(shù)據(jù)集市層【功能與作用】數(shù)據(jù)集市是一組特定的、針對某個主題域、部門或用戶分類的數(shù)據(jù)集合。 訪問控制層【功能與作用】訪問控制層主要包括 WEB、認(rèn)證、安全、門戶四方面的服務(wù)。這類用戶會使用 B/S 和 C/S 兩種客戶端訪問 EDW 系統(tǒng)。這類用戶只會使用 B/S 客戶端訪問 EDW 系統(tǒng)。清楚地區(qū)分?jǐn)?shù)據(jù)庫中的數(shù)據(jù)和元數(shù)據(jù)是很重要的,所謂元數(shù)據(jù),是指關(guān)于數(shù)據(jù)的數(shù)據(jù),即用來描述數(shù)據(jù)的類型、來源、定義、存儲位置,使得可以正確地使用數(shù)據(jù)倉庫。ETL Server 可通過 ds job,FTP,NFS 等方式從數(shù)據(jù)落地區(qū)獲取數(shù)據(jù),將處理后的結(jié)果放在數(shù)據(jù)準(zhǔn)備區(qū)域。各個組件的主要功能如下:? 系統(tǒng)監(jiān)控管理組件:監(jiān)控網(wǎng)絡(luò)/系統(tǒng)性能、運(yùn)行,以及診斷和報告故障。? 性能容量規(guī)劃組件:性能及容量規(guī)劃從環(huán)境中的不同元素收集利用數(shù)據(jù),并規(guī)劃硬件和軟件能力需求。應(yīng)監(jiān)控所有的關(guān)鍵數(shù)據(jù)庫/數(shù)據(jù)倉庫性能比例,以保證高可用性和性能。24 / 47? 變更管理允許對技術(shù)架構(gòu)組件進(jìn)行變更的控制管理。當(dāng)發(fā)生故障或失敗時,該切換發(fā)生在主系統(tǒng)和備份系統(tǒng)之間。 EDW 數(shù)據(jù)架構(gòu) 數(shù)據(jù)架構(gòu)設(shè)計原則? 統(tǒng)一規(guī)范對各源系統(tǒng)數(shù)據(jù)按主題進(jìn)行統(tǒng)一整合;分行特色也按統(tǒng)一規(guī)范進(jìn)行補(bǔ)充建設(shè)。? 存儲空間合理性原則數(shù)據(jù)模型需要處理海量數(shù)據(jù)。? 標(biāo)準(zhǔn)化全量層? 基礎(chǔ)數(shù)據(jù)層數(shù)據(jù)模型基礎(chǔ)數(shù)據(jù)模型用于整合、存儲全行各業(yè)務(wù)系統(tǒng)的基礎(chǔ)業(yè)務(wù)數(shù)據(jù)。加工匯總數(shù)據(jù)層下的匯總需求由“應(yīng)用需要”來確定。EDW 系統(tǒng)的應(yīng)用架構(gòu)應(yīng)該能夠作為需求檢查列表,檢驗當(dāng)前用戶需求是否被涵蓋,而不會發(fā)生遺漏。33 / 47 應(yīng)用服務(wù)基于數(shù)據(jù)分析功能和交易功能分離原則,為保證交易系統(tǒng)運(yùn)行效率和數(shù)據(jù)分析功能日益增加的需求,新系統(tǒng)設(shè)計時,應(yīng)該將數(shù)據(jù)分析功能和交易功能分離到不同系統(tǒng)中,或者至少為將來分離做好技術(shù)準(zhǔn)備。ETL 轉(zhuǎn)換清洗通過連接、合并、分割,按照清洗規(guī)則對數(shù)據(jù)緩沖區(qū)、數(shù)據(jù)存儲區(qū)的數(shù)據(jù)進(jìn)行加工、匯總,最終裝載入數(shù)據(jù)存儲區(qū)。? ETL3:屬于ETL轉(zhuǎn)換。本模式提供EDW允許的相應(yīng)時間段的歷史數(shù)據(jù)支持。Staging Area 的作用與實現(xiàn):1. 減少對數(shù)據(jù)源的查詢壓力,有助于數(shù)據(jù)整合。歷史數(shù)據(jù)加載指在第一次加載數(shù)據(jù)到數(shù)據(jù)倉庫中,此時數(shù)據(jù)倉庫中不存在歷史數(shù)據(jù)。2. 自增長的序列號源系統(tǒng)設(shè)置了自增長的序列號作為唯一主鍵。缺點是必須對業(yè)務(wù)數(shù)據(jù)庫進(jìn)行改動,客戶不一定能接受。 作業(yè)調(diào)度和監(jiān)控根據(jù)作業(yè)依賴關(guān)系的元數(shù)據(jù)進(jìn)行 ETL 作業(yè)的調(diào)度,并對執(zhí)行過程進(jìn)行監(jiān)控。? ETL 域:ETL 架構(gòu)中基本的計算資源組合,是一個計算機(jī)群,由 JCI統(tǒng)一管理和控制,一個 ETL 域由一個 ETL Server 和多個 ETL 41 / 47Client 組成。總行有一個或多個總行的 ETL 域,分行有本分行的 ETL 域。42 / 47ETL CLIENT 主要負(fù)責(zé) ETL SERVER 分配的作業(yè)模塊的具體執(zhí)行,是作業(yè)的具體執(zhí)行者。管理類數(shù)據(jù)庫存放的是作業(yè)運(yùn)行控制相關(guān)的數(shù)據(jù)信息,如系統(tǒng)配置參數(shù)或作業(yè)配置信息、狀態(tài)信息和運(yùn)行日志信息等。5. ETL SERVER 在得到 JOB 運(yùn)行的結(jié)點個數(shù)和能夠運(yùn)行該 JOB 的結(jié)點列表后,根據(jù)本域的管理類數(shù)據(jù)庫中結(jié)點的使用情況表,按照一定的策略對能夠運(yùn)行該 JOB 的結(jié)點列表進(jìn)行排序,選出最優(yōu)的若干個 ETL CLIENT??蛻舳伺c服務(wù)端采用 C/S 通信模式,通過 TCP 協(xié)議傳送信息,這樣做的好處是:? 避免工作節(jié)點直接訪問管理庫,訪問管理庫的工作統(tǒng)一ETL Server來完成,從而提高了應(yīng)用部署的適應(yīng)能力;46 / 47? ETL Server可以據(jù)此檢測所有工作節(jié)點是否存在故障;客戶端負(fù)責(zé)采集信息發(fā)送到服務(wù)端,服務(wù)端接收信息,并寫到數(shù)據(jù)庫。服務(wù)端與客戶端作為daemon 進(jìn)程,要求能夠長時間運(yùn)行。然后根據(jù)運(yùn)行配置文件,將 JOB 分配給各個 ETL CLIENT 執(zhí)行。無論是總行還是分行,數(shù)據(jù)庫都是由管理類數(shù)據(jù)庫和業(yè)務(wù)類數(shù)據(jù)庫組成。它可以根據(jù)本域上的作業(yè)情況增減 ETL CLIENT。對于不同的域,它們的處理任務(wù)也是不一樣的。 ? 物理作業(yè):具體負(fù)責(zé)數(shù)據(jù)加工的程序執(zhí)行單元,各類存儲過程或者作業(yè)腳本(SHELL 腳本、用 C/C++/PROC 等開發(fā)的可執(zhí)行程序) 。作業(yè)的監(jiān)控需要包括以下功能:監(jiān)控作業(yè)的當(dāng)前執(zhí)行情況;查詢作業(yè)歷史執(zhí)行情況。ETL 管理調(diào)度利用作業(yè)調(diào)度控制可以處理各種異常錯誤情況。4. 整表比較對于沒有時間戳的增量數(shù)據(jù),數(shù)據(jù)量不大時,例如編碼表,可以采用使用數(shù)據(jù)庫的 SQL 操作語句(NOT IN,NOT Exists)的方法。我們認(rèn)為只需要建立一套增量加載的 ETL 同樣處理歷史數(shù)據(jù)加載和日常數(shù)據(jù)加載,而不再開發(fā)另一套全量加載 ETL 程序處理歷史數(shù)據(jù)加載。2. 應(yīng)用于增量處理可以減少處理的記錄數(shù)量,使增量處理更加容易,例如應(yīng)用于
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1