freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目建設方案-文庫吧資料

2025-05-21 00:09本頁面
  

【正文】 分析 供應商分析 門店分析 員工分析業(yè)務分析師、數(shù)據(jù)挖掘分析師(數(shù)據(jù)挖掘算法,數(shù)據(jù))、IT專家、用戶 GBICC數(shù)據(jù)挖掘過程模型商業(yè)目標定義、數(shù)據(jù)源識別、數(shù)據(jù)手機、數(shù)據(jù)質(zhì)量審核(數(shù)據(jù)合法性、合理性)、數(shù)據(jù)選擇、數(shù)據(jù)轉換、建模(利用工具軟件)、結果評估、結果應用、模型監(jiān)控 7 數(shù)據(jù)挖掘算法 數(shù)據(jù)挖掘功能、算法及典型應用(重要) 分類216。 缺失值的處理216。 屬性(變量)的轉換216。 使用更多數(shù)據(jù)的成本與效益分析216。 數(shù)據(jù)結構216。 數(shù)據(jù)挖掘的目標216。 數(shù)據(jù)樣本足夠大,大到能夠代表整體216。征信機構數(shù)據(jù) 行為數(shù)據(jù) 交易數(shù)據(jù) 調(diào)查數(shù)據(jù) 普查數(shù)據(jù)人口統(tǒng)計數(shù)據(jù) 應用數(shù)據(jù) 歷史數(shù)據(jù) 通訊信息 統(tǒng)計機構數(shù)據(jù)216。根據(jù)統(tǒng)計和非統(tǒng)計方法之間的不同把數(shù)據(jù)挖掘分為兩種類型:假設驅(qū)動和發(fā)現(xiàn)驅(qū)動的數(shù)據(jù)挖掘。但是,在過去的10多年里,非統(tǒng)計的方法已經(jīng)出現(xiàn)并普遍成為一種衡量人們非統(tǒng)計的、平均行為的有效方式。 使用所獲得信息幫助制訂重要商業(yè)決策數(shù)據(jù)挖掘的目的是從數(shù)據(jù)庫和數(shù)據(jù)倉庫中提取有價值的信息并將其用于商業(yè)決策,人們普遍能接受上述的觀點,但是在提取信息的方法上觀點卻可能明顯不同。 發(fā)現(xiàn)過去未知、隱藏的信息216。216。 環(huán)境狀態(tài):設備是否正常、軟件環(huán)境是否正常、辦公環(huán)境是否正常216。 質(zhì)量狀態(tài):質(zhì)量控制的狀態(tài)、整體質(zhì)量狀態(tài)216。 風險狀態(tài):風險發(fā)生的可能性,發(fā)生后對項目造成影響的程度。 進度狀態(tài):是否按照計劃執(zhí)行,進度速度是否適當216。 數(shù)據(jù)倉庫應用包含:需求、模型設計、ETL、前端應用、非結構化、Portal等216。216。項目的管理執(zhí)行指標包括管理和執(zhí)行兩大部分,其中管理是指:管理能力體現(xiàn)項目管理方面的能力,以靜態(tài)能力為主,強調(diào)對關鍵的活動進行了管理;執(zhí)行是指:對各種計劃、管理辦法等的執(zhí)行能力。216。216。 確立相關會議制度。 制定項目計劃。項目總體管理質(zhì)量控制的目標是在數(shù)據(jù)倉庫周期中管理者通過一些列的管理活動,在一定的時間和預算范圍內(nèi),有效地利用人力、資源、技術和工具,使數(shù)據(jù)倉庫系統(tǒng)按照預期的計劃和質(zhì)量要求如期完成。4. 質(zhì)量狀態(tài):質(zhì)量控制的狀態(tài)、整體質(zhì)量狀態(tài)5. 溝通狀態(tài):項目組內(nèi)溝通是否疲勞,工作效率是否低下6. 環(huán)境狀態(tài):設備是否正常、軟件環(huán)境是否正常、辦公環(huán)境是否正常項目管理是一整套體系,特別是像數(shù)據(jù)倉庫建設這樣的大型項目。在數(shù)據(jù)倉庫項目實施過程中切實的加強的各類風險控制和問題跟蹤,切實的化解了風險、解決了問題并保證了項目整體的質(zhì)量通過建立項目狀態(tài)指標,對項目管理各個方面根據(jù)本數(shù)據(jù)倉庫項目的實際情況定義不同的權重,以求真實的反映出各個時間點的項目狀態(tài)1. 進度狀態(tài):是否按照計劃執(zhí)行,進度速度是否適當。審查:對項目的所有階段性成果,或者里程碑式的成果,包括整個項目的技術路線、技術策略、技術方法、項目管理的方法與策略等項目有關的情況做出評估意見。定位有3個:監(jiān)督、審查和控制。 系統(tǒng)運行維護定義2. 經(jīng)過五個步驟的建設,元數(shù)據(jù)系統(tǒng)將包括:元數(shù)據(jù)應用模塊、元數(shù)據(jù)管理模塊、元數(shù)據(jù)展現(xiàn)模塊、系統(tǒng)管理模塊、系統(tǒng)運行維護模塊共五大模塊。 元數(shù)據(jù)應用實現(xiàn)216。 元數(shù)據(jù)需求定義216。4. 根據(jù)元數(shù)據(jù)的內(nèi)容,用戶的應用需求可分為技術需求和業(yè)務需求兩個部分,分別面向技術用戶、業(yè)務用戶以及數(shù)據(jù)管理用戶。3. 元數(shù)據(jù)管理系統(tǒng),從根本上講,是將分散在數(shù)據(jù)倉庫各個環(huán)節(jié)的、獨立的元數(shù)據(jù)統(tǒng)一存儲在元數(shù)據(jù)存儲庫中,并將各個元數(shù)據(jù)有機的聯(lián)系在一起,因此,元數(shù)據(jù)管理系統(tǒng)的基本任務是實現(xiàn)數(shù)據(jù)信息的管理即元數(shù)據(jù)的管理。技術元數(shù)據(jù)是為企業(yè)技術用戶和IT員工提供支持的元數(shù)據(jù),而業(yè)務元數(shù)據(jù)是為企業(yè)業(yè)務用戶提供支持的元數(shù)據(jù)。對本項目而言,元數(shù)據(jù)通過定義數(shù)據(jù)倉庫的內(nèi)容,幫助用戶找到進行分析所需的相關信息。元數(shù)據(jù)管理將以數(shù)據(jù)倉庫數(shù)據(jù)環(huán)境為核心,完成對相關業(yè)務元數(shù)據(jù)及技術元數(shù)據(jù)的集成及應用,提供數(shù)據(jù)路徑、數(shù)據(jù)歸屬信息,并對業(yè)務術語、文檔進行集中管理,通過變更報告、影響分析以及業(yè)務術語管理等應用,保證數(shù)據(jù)的完整性,控制數(shù)據(jù)質(zhì)量,減少業(yè)務術語的歧義,建立業(yè)務人員之間、技術人員之間、以及業(yè)務人員與技術人員之間的溝通平臺。這樣在實施的時候就可以做到脈絡清晰、有的放矢。所謂事前控制是指在工作計劃階段或計劃前,對所要開展的工作進行充分的咨詢評估。元數(shù)據(jù)管理將以數(shù)據(jù)倉庫數(shù)據(jù)環(huán)境為核心,完成對相關業(yè)務元數(shù)據(jù)及技術元數(shù)據(jù)的集成及應用,提供數(shù)據(jù)路徑、數(shù)據(jù)歸屬信息,并對業(yè)務術語、文檔進行集中管理,通過變更報告、影響分析以及業(yè)務術語管理等應用,保證數(shù)據(jù)的完整性,控制數(shù)據(jù)質(zhì)量,減少業(yè)務術語的歧義,建立業(yè)務人員之間、技術人員之間、以及業(yè)務人員與技術人員之間的溝通平臺。通過元數(shù)據(jù)管理,使分散的數(shù)據(jù)信息成為一個統(tǒng)一的整體。216。 元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),是指與業(yè)務和技術過程以及企業(yè)數(shù)據(jù)使用相關的所有數(shù)據(jù)及包含的知識信息。216。 ETCL工具廠商:Informatica、Datastage、OWB、微軟DTS、Beeload、Kettle216。 性能優(yōu)化方案及結果評審 5. 元數(shù)據(jù)管理與系統(tǒng)維護216。 OLAP開發(fā)評審216。 質(zhì)量控制方法OLAP質(zhì)量控制方法主要是對以下四個過程進行評審:216。 保證為最終用戶提供共享多維信息的快速分析和及時數(shù)據(jù)庫查詢,確保OLAP數(shù)據(jù)模型設計合理,具有良好的擴展能力;216。216。 源數(shù)據(jù)分析 OLAP與前端的質(zhì)量控制數(shù)據(jù)倉庫和聯(lián)機分析處理是決策支持系統(tǒng)的有機組成部分。 操作系統(tǒng)平臺、網(wǎng)絡狀況以及數(shù)據(jù)源數(shù)據(jù)的更新周期與方式等。 數(shù)據(jù)源的確認216。 構建和測試日常加載的程序和處理流程。 數(shù)據(jù)抽取、轉換和加載策略設計;216。3. 評審邏輯模型設計階段所提交的交付文檔,主要包括:數(shù)據(jù)源數(shù)據(jù)的映射表,ETL系統(tǒng)設計說明書,ETL子系統(tǒng)測試報告,ETL流程設計說明書,ETL調(diào)整維護說明書,ETL故障錯誤恢復恢復說明書,ETL數(shù)據(jù)質(zhì)量控制策略及流程,ETL回溯設計說明書,數(shù)據(jù)裝載工作報告,數(shù)據(jù)裝載狀態(tài)報告,ETL子系統(tǒng)測試報告,ETL用戶手冊,ETL系統(tǒng)備份恢復,ETL程序和源代碼 ETL的主要任務包括216。 ETL的質(zhì)量控制的方法1. 依據(jù)數(shù)據(jù)源狀態(tài)報告、需求分析說明書、數(shù)據(jù)倉庫邏輯模型及說明文檔、數(shù)據(jù)倉庫物理模型及說明文檔對ETL過程中的關鍵點進行跟蹤。在實際的項目實施過程中,源數(shù)據(jù)有時不經(jīng)過清洗就直接轉換加載進入數(shù)據(jù)倉庫,這樣的數(shù)據(jù)整合就變成了數(shù)據(jù)抽取、數(shù)據(jù)轉換和數(shù)據(jù)加載,簡稱ETL。 創(chuàng)建單元測試計劃,以測試安全訪問控制機制是否正確數(shù)據(jù)倉庫中的數(shù)據(jù)是以面向主題的方式組織的,而業(yè)務數(shù)據(jù)庫中的數(shù)據(jù)一般是圍繞著一個或幾個業(yè)務處理流程來組織的,因此,將數(shù)據(jù)從業(yè)務數(shù)據(jù)庫中抽取并加載到數(shù)據(jù)倉庫就不是簡單的復制過程,而需要十分復雜的數(shù)據(jù)處理,即數(shù)據(jù)整合。 設計數(shù)據(jù)安全機制,根據(jù)設計說明書設計數(shù)據(jù)倉庫安全性模型216。 建立單元測試計劃,以測試作業(yè)調(diào)度過程是否正確216。 設計錯誤恢復過程,在作業(yè)調(diào)度過程中發(fā)生的錯誤和恢復或者重啟的過程216。設計備份與恢復過程中錯誤恢復過程、計劃216。即設計怎樣確定在數(shù)據(jù)歸檔過程中發(fā)生的錯誤,以及恢復或者重啟的過程。1. 設計數(shù)據(jù)歸檔轉儲過程。將關于ETL過程的元數(shù)據(jù)登記到元數(shù)據(jù)中心庫中,便于進行管理。若ETL過程出錯,則數(shù)據(jù)倉庫中可能已經(jīng)存在部分不完整的數(shù)據(jù),需要將這些數(shù)據(jù)刪除,然后再查找錯誤的原因,重新執(zhí)行ETL程序等。3. 數(shù)據(jù)ETL過程中的錯誤恢復過程設計。2. 數(shù)據(jù)更新ETL過程設計。ETL過程實際上由三個子過程構成:數(shù)據(jù)抽取、數(shù)據(jù)轉換和數(shù)據(jù)加載。 …… 當事人主題域細節(jié)模型局部展示 地域主題域細節(jié)模型局部展示 渠道主題域細節(jié)模型局部展示 財務主題域細節(jié)模型局部展示 4. ETCL策略和前端應用 ETL設計數(shù)據(jù)倉庫處理過程的設計是數(shù)據(jù)倉庫設計的核心。 在維表中增加一個字段,記錄已更改的記錄舊的取值,這樣也可以保留歷史紀錄,但是只能保留前一個修改歷史。 覆蓋歷史記錄,直接更新維度字段的值216。 對于漸變維的處理是否能最好地滿足業(yè)務需求216。 數(shù)據(jù)粒度的確定是否合理216。 業(yè)務邏輯單元的劃分是否合理216。 數(shù)據(jù)與需求映像關系是否有明確說明216。 跟蹤檢查以下關鍵點216。 邏輯模型設計質(zhì)量控制的方法1. 依據(jù)數(shù)據(jù)源狀態(tài)報告和需求分析說明書對邏輯模型設計過程中的關鍵點進行跟蹤檢查2. 以“檢查單”的形式對跟蹤檢查過程中發(fā)現(xiàn)的問題進行分析,并提出解決方案建議。主要評審主題域是否可以正確反映用戶的決策分析需求。邏輯模型的最終設計成果應該包含每個主題邏輯定義,且將相關內(nèi)容記錄在數(shù)據(jù)倉庫的元數(shù)據(jù)中,其中包括粒度劃分、數(shù)據(jù)分割各類、表劃分和數(shù)據(jù)來源等。利用關系模型不僅可以創(chuàng)建星型模型與雪花模型中指標實體的關系模式,而且還可創(chuàng)建星型模型與雪花模型維度實體和詳細類別實體的關系模式。數(shù)據(jù)倉庫的邏輯模型應該與數(shù)據(jù)倉庫物理實現(xiàn)時所使用的數(shù)據(jù)庫匹配。當然這不是一個簡單的復制過程,而是需要進行一定的整理,例如刪除多余的字段、統(tǒng)一鍵值等等。) 多樣性原則一般來說,DDS應該是多維的,即DDS中所有數(shù)據(jù)都使用多維模型來構建。 常用性原則常用性原則是指DDS中的數(shù)據(jù)內(nèi)容以常用為原則,即只有常用的數(shù)據(jù)才被納入DDS,對于那些非常用的數(shù)據(jù),則由ODS直接提供數(shù)據(jù)支持。也就是說,DDS中的數(shù)據(jù)不僅可以為當前定義的應用服務,還可以為將來需要建立的應用服務。 關系型數(shù)據(jù)庫和OLAP邏輯模型設計、調(diào)整、驗證216。 設計和完善事實、度量和維度216。多維建模過程遵循以下步驟:216。與傳統(tǒng)的頻率合成器相比,DDS具有低成本、低功耗、高分辨率和快速轉換時間等優(yōu)點,廣泛使用在電信與電子儀器領域,是實現(xiàn)設備全數(shù)字化的一個關鍵技術。 基于邏輯模型建立物理模型216。 梳理數(shù)據(jù),作為DDS模型設計的基礎216。實體關系模型用來存儲企業(yè)集成的交易詳細數(shù)據(jù),是多維模型的數(shù)據(jù)來源和今后應用擴展的基礎多維模型主要是面向多維分析應用而建立的數(shù)據(jù)模型。一個清晰的數(shù)據(jù)倉庫模型可以簡化前端用戶的任務。 數(shù)據(jù)倉庫的分析類型決定了模型的類型和模型的內(nèi)容,因為提問、報告及多維分析需要聚集、清晰的元數(shù)據(jù)結構。 數(shù)據(jù)模型清晰地描述了系統(tǒng)完整的數(shù)據(jù)流程,是應用程序作用于系統(tǒng)的中介,通過數(shù)據(jù)模型改進系統(tǒng),可以提高系統(tǒng)的協(xié)調(diào)性與合理性,可以產(chǎn)生更好的系統(tǒng)設計。 數(shù)據(jù)往往是共享的,分布的用戶訪問集中的數(shù)據(jù),要求數(shù)據(jù)結構不變或相對穩(wěn)定,好的數(shù)據(jù)模型設計可以保持共享數(shù)據(jù)的一致性和用戶訪問的有效性。 保障數(shù)據(jù)模型的設計質(zhì)量216。一般的,邏輯數(shù)據(jù)模型是數(shù)據(jù)倉庫數(shù)據(jù)模型的起點與核心3. 由于數(shù)據(jù)倉庫工程建設的龐大性與復雜性,一般的最佳實踐建議基于既有的商用邏輯數(shù)據(jù)模型通過一定的客戶化工作進行數(shù)據(jù)倉庫數(shù)據(jù)模型的建設。一般的,數(shù)據(jù)倉庫數(shù)據(jù)模型特指基礎數(shù)據(jù)層的數(shù)據(jù)模型。 多維分析的需求216。 報表的需求216。 需求的明確度216。 非功能性需求的可測量性216。 業(yè)務需求亮點選擇216。 業(yè)務方面的覆蓋性216。 從規(guī)避整個項目的業(yè)務風險和技術風險的角色進行規(guī)劃216。 建立需求變更控制216。 有效控制需求的完備性216。 明確非功能性需求216。 從業(yè)務角度出發(fā)引導和采集客戶需求216。并且另外使用文檔進行描述。 確定該系統(tǒng)目前采用的數(shù)據(jù)庫類型,以及數(shù)據(jù)庫目前管理部門是誰216。 確認該系統(tǒng)目前的運行狀態(tài)216。6. 在業(yè)務需求訪談的過程中按照以下方法工作:確認該部門現(xiàn)有的信息系統(tǒng)是否已經(jīng)全部在列表中,是否有新的系統(tǒng)沒在本次信息系統(tǒng)梳理的范圍內(nèi)(該系統(tǒng)有業(yè)務分析相關數(shù)據(jù)產(chǎn)生,可以作為數(shù)據(jù)倉庫數(shù)據(jù)源使用)。 定義需求變更管理流程216。4. 定義并跟蹤需求管理的方法和流程216。 各主題相互獨立,關聯(lián)度達到最低216。業(yè)務分析主題的確立有一下幾個原則:216。1.
點擊復制文檔內(nèi)容
公司管理相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1