freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

2數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘項(xiàng)目建設(shè)-講義(留存版)

  

【正文】 定216。216。 收集培訓(xùn)需求確認(rèn)或確定相關(guān)組的成員,并確認(rèn)相關(guān)的培訓(xùn)需求。7. 針對(duì)信息系統(tǒng),進(jìn)行以下內(nèi)容的調(diào)查:216。 明確需求規(guī)劃指導(dǎo)思想216。2. 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型同樣存在概念模型、邏輯模型、物理模型及語(yǔ)義模型等不同層次。 建立企業(yè)級(jí)邏輯模型216。但考慮到SSE(指令集)的實(shí)際情況,如果存在一些數(shù)據(jù)需求,它們既符合常用性原則(即它們比較常用),又不適合用多維模型來(lái)構(gòu)建,那么我們將直接把這些數(shù)據(jù)從ODS復(fù)制到DDS中。 本階段需要對(duì)需求分析報(bào)告中列出的每一條需求逐一進(jìn)行分析,得出需求在實(shí)現(xiàn)過(guò)程中需要用到的數(shù)據(jù),然后將這些數(shù)據(jù)的內(nèi)容根據(jù)多維模型的要求分成事實(shí)、維度、度量三大類信息并記錄下來(lái)216。根據(jù)規(guī)劃的結(jié)果選擇相應(yīng)的更新策略,設(shè)計(jì)數(shù)據(jù)更新程序。 設(shè)計(jì)數(shù)據(jù)安全機(jī)制,根據(jù)設(shè)計(jì)說(shuō)明書設(shè)計(jì)數(shù)據(jù)216。 明確本系統(tǒng)的數(shù)據(jù)獲取來(lái)源,包括數(shù)據(jù)源的數(shù)據(jù)存儲(chǔ)格式、數(shù)據(jù)庫(kù)類型216。 OLAP工具廠商:Cognos(Powerplay)、Hyperion (Essbase)、微軟(Analysis Service)以及MicroStrategy幾大廠商的產(chǎn)品。()1. 元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),是指與業(yè)務(wù)和技術(shù)過(guò)程以及企業(yè)數(shù)據(jù)使用相關(guān)的所有數(shù)據(jù)及包含的知識(shí)信息。1. 監(jiān)督:指追蹤項(xiàng)目進(jìn)展情況和狀態(tài)。 確定項(xiàng)目管理的執(zhí)行指標(biāo)。 數(shù)據(jù)量大216。 現(xiàn)有數(shù)據(jù)源216。 時(shí)效性*了解客戶自身的喜好 客戶關(guān)系的核心是通過(guò)多方面的數(shù)據(jù)了解客戶,以轉(zhuǎn)變?yōu)橐钥蛻魹橹行男偷钠髽I(yè)216。 與客戶人員一起理解所有屬性的細(xì)則216。 在挽留手段、挽留成本等資源有限的情況下,最大的限度的挽留到那些真正有意向流失的客戶216。216。216。 始終按協(xié)議付款的賬戶數(shù)216。 渠道偏好(委托方式及時(shí)間)216。 理清業(yè)務(wù)流程,看業(yè)務(wù)人員注意的是哪些變量216。 提供高且快的投資回報(bào)(需要排列項(xiàng)目主次)216。 幫助客戶多想想如何用(多向前想一步) 成功的關(guān)鍵216。 管好是個(gè)步驟的每個(gè)步驟216。 模型區(qū)分的能力:ROC曲線及AUC系數(shù)、累計(jì)準(zhǔn)確曲線及其準(zhǔn)確性比率(AR)、KS驗(yàn)證等。1. 變量初步篩選216。 發(fā)現(xiàn)有明顯特征的客戶群,為理財(cái)產(chǎn)品的設(shè)計(jì)提供依據(jù)216。 經(jīng)審批但未啟用的賬戶數(shù)216。 過(guò)去24個(gè)月進(jìn)行的交易占比以及非分期的余額總數(shù) 行為模型1. 對(duì)審批貸款后,根據(jù)信貸客戶的交易活動(dòng)信息、基本資料變動(dòng)信息(職業(yè)、收入等)對(duì)其行為進(jìn)行預(yù)測(cè),包括破產(chǎn)預(yù)測(cè)、晚付賬預(yù)測(cè)、欺詐預(yù)測(cè)等。216。 數(shù)據(jù)挖掘是一個(gè)輔助工具,并非傳統(tǒng)統(tǒng)計(jì)/業(yè)務(wù)研究方法及工具的替代品;216。 如何有效的提升收益216。 新產(chǎn)品開發(fā)216。 高質(zhì)量的數(shù)據(jù)216。 溝通狀態(tài):項(xiàng)目組內(nèi)溝通是否疲勞,工作效率是否低下216。在項(xiàng)目管理的整個(gè)過(guò)程中制定相關(guān)的會(huì)議制度,針對(duì)不同層次的問(wèn)題和風(fēng)險(xiǎn)實(shí)時(shí)、適度的舉行會(huì)議討論,保證項(xiàng)目各項(xiàng)工作的質(zhì)量。 系統(tǒng)管理定義216。通過(guò)這種分析評(píng)估對(duì)所要開展的工作進(jìn)行充分的對(duì)比和論證,把相關(guān)的實(shí)施路徑、關(guān)聯(lián)關(guān)系、技術(shù)難點(diǎn)、業(yè)務(wù)范圍都梳理清楚。 OLAP子系統(tǒng)測(cè)試過(guò)程及結(jié)果評(píng)審216。 構(gòu)建和測(cè)試初始加載的程序和處理流程;216。 設(shè)計(jì)作業(yè)調(diào)度過(guò)程,即確定數(shù)據(jù)倉(cāng)庫(kù)中的過(guò)程的時(shí)序,建立一個(gè)次序,并且計(jì)算出工作的環(huán)境,建立調(diào)度策略和標(biāo)準(zhǔn)文檔216。它涉及到數(shù)據(jù)倉(cāng)庫(kù)初始裝載、更新、維護(hù)、歸檔、轉(zhuǎn)儲(chǔ)以及應(yīng)用接口等諸多方面根據(jù)模型設(shè)計(jì)的結(jié)果,設(shè)計(jì)ETL程序1. 數(shù)據(jù)初始ETL過(guò)程設(shè)計(jì)。3. 評(píng)審邏輯模型設(shè)計(jì)階段所提交的交付文檔,主要包括:主題域分析報(bào)告,數(shù)據(jù)粒度劃分模型,數(shù)據(jù)分割策略,指標(biāo)實(shí)體,維實(shí)體與詳細(xì)類別實(shí)體的關(guān)系模式和數(shù)據(jù)抽取模型。因此,我們?cè)贒DS的設(shè)計(jì)過(guò)程中,必須要兼顧各種不同類型的應(yīng)用,例如,有很多數(shù)據(jù)可以同時(shí)面向OLAP和查詢。 模型的類型企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型通常有兩類:實(shí)體關(guān)系模型和多維模型。 統(tǒng)計(jì)分析的需求216。 有效控制需求的范圍216。 選擇需求管理工具216。216。 確定數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu),詳細(xì)說(shuō)明支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的操作型系統(tǒng)的配置。 需求分析的方法 詳細(xì)需求的收集需求分析的第二步是收集詳細(xì)需求。 系統(tǒng)架構(gòu)管理216。 可行性、實(shí)現(xiàn)的復(fù)雜程度216。數(shù)據(jù)倉(cāng)庫(kù)按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)和部門級(jí)數(shù)據(jù)倉(cāng)庫(kù)(通常稱為數(shù)據(jù)集市)。 盈利性排在前10%的客戶的特征是什么?216。顯而易見的是,對(duì)不準(zhǔn)確,甚至不正確的數(shù)據(jù)進(jìn)行分析得出的結(jié)果將不能用于知道企業(yè)領(lǐng)導(dǎo)者做出科學(xué)的決策操作型數(shù)據(jù)庫(kù)中的數(shù)據(jù)通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要發(fā)生變化。 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)是指面向主題的、集成的、穩(wěn)定的同時(shí)又是隨時(shí)間變化的大量的數(shù)據(jù)集合。在綜合使用一些應(yīng)用軟件下,用戶獲得想要的信息,最終為經(jīng)營(yíng)管理的決策提供有力的幫助216。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)領(lǐng)導(dǎo)者決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢和分析,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)操作主要是數(shù)據(jù)查詢和分析,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之后,一般情況下將會(huì)被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢操作和分析,修改和刪除操作一般不多,通常只需要定期的加載、刷新。 盈利性最差的10%客戶的特征是什么?216。數(shù)據(jù)集市可能是企業(yè)及數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)組成部分。 周期的長(zhǎng)度216。 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的選用216。采訪用戶是獲得需求的最慣用的方法。該信息需要包括下列有關(guān)的軟硬件因素:OLTP系統(tǒng)名稱與類型、平臺(tái)(包括硬件與操作系統(tǒng))、網(wǎng)絡(luò)通信協(xié)議、可用的存儲(chǔ)空間。 用戶確認(rèn)數(shù)據(jù)庫(kù)質(zhì)量問(wèn)題報(bào)告,用戶確認(rèn)數(shù)據(jù)質(zhì)量報(bào)告及建議的處理方法。 定義需求變更管理流程216。 建立需求變更控制216。一般的,數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型特指基礎(chǔ)數(shù)據(jù)層的數(shù)據(jù)模型。 梳理數(shù)據(jù),作為DDS模型設(shè)計(jì)的基礎(chǔ)216。) 多樣性原則一般來(lái)說(shuō),DDS應(yīng)該是多維的,即DDS中所有數(shù)據(jù)都使用多維模型來(lái)構(gòu)建。 數(shù)據(jù)與需求映像關(guān)系是否有明確說(shuō)明216。2. 數(shù)據(jù)更新ETL過(guò)程設(shè)計(jì)。 建立單元測(cè)試計(jì)劃,以測(cè)試作業(yè)調(diào)度過(guò)程是否正確216。 數(shù)據(jù)源的確認(rèn)216。 ETCL工具廠商:Informatica、Datastage、OWB、微軟DTS、Beeload、Kettle216。元數(shù)據(jù)管理將以數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)環(huán)境為核心,完成對(duì)相關(guān)業(yè)務(wù)元數(shù)據(jù)及技術(shù)元數(shù)據(jù)的集成及應(yīng)用,提供數(shù)據(jù)路徑、數(shù)據(jù)歸屬信息,并對(duì)業(yè)務(wù)術(shù)語(yǔ)、文檔進(jìn)行集中管理,通過(guò)變更報(bào)告、影響分析以及業(yè)務(wù)術(shù)語(yǔ)管理等應(yīng)用,保證數(shù)據(jù)的完整性,控制數(shù)據(jù)質(zhì)量,減少業(yè)務(wù)術(shù)語(yǔ)的歧義,建立業(yè)務(wù)人員之間、技術(shù)人員之間、以及業(yè)務(wù)人員與技術(shù)人員之間的溝通平臺(tái)。定位有3個(gè):監(jiān)督、審查和控制。216。216。 數(shù)據(jù)結(jié)構(gòu)216。 銷售與市場(chǎng)216。 與客戶零售部門以及研發(fā)部門人員進(jìn)行訪談,以確認(rèn)數(shù)據(jù)源216。 降低每月客戶的平均流失率216。 常用于信用卡申請(qǐng)的過(guò)濾,過(guò)濾掉那些發(fā)卡單位不愿考慮的客戶。 基于破產(chǎn)的人數(shù)的不斷增加,僅信用卡一項(xiàng)年損失額就超過(guò)百億美元,構(gòu)建破產(chǎn)模型、晚付賬模型,及早對(duì)個(gè)人的破產(chǎn)、晚付賬可能性進(jìn)行預(yù)測(cè)使損失最小化,這對(duì)銀行來(lái)說(shuō)是至關(guān)重要的。 按協(xié)議付款的循環(huán)銀行賬戶數(shù)216。 股票行業(yè)偏好;216。 利用LOGISTIC的STEPWISE選擇對(duì)預(yù)測(cè)最有用的一組變量3. 變量選擇要注意216。 模型準(zhǔn)確性:二項(xiàng)檢驗(yàn)、卡方檢驗(yàn)4. 基準(zhǔn)測(cè)試 BI成功的標(biāo)準(zhǔn)216。 職業(yè)紀(jì)律要求(不可亂試)216。 放置了多少壞賬216。例如,對(duì)變量“申請(qǐng)者信用歷史時(shí)間”進(jìn)行分箱操作,該變量的取值可以為一個(gè)數(shù)值(月份),也可以是字符變量,那么對(duì)這一變量的分箱可以有如下形式: 10 結(jié)果檢驗(yàn)和項(xiàng)目管理 模型準(zhǔn)確性判斷建模過(guò)程中:左右比較,前后比較投產(chǎn)前:樣本對(duì)比測(cè)試使用后:模型驗(yàn)證 模型驗(yàn)證商業(yè)銀行應(yīng)同時(shí)采用定量和定性的驗(yàn)證方法1. 定性驗(yàn)證:側(cè)重于通過(guò)專家評(píng)估的方法,評(píng)估計(jì)量模型和支持體系相關(guān)治理結(jié)構(gòu)、正常、流程、控制、文檔管理、模型結(jié)果運(yùn)用等情況。 數(shù)據(jù)的存貯質(zhì)量:數(shù)據(jù)的存貯質(zhì)量是指數(shù)被安全的存貯在適當(dāng)?shù)慕橘|(zhì)上;216。 計(jì)算信用風(fēng)險(xiǎn)的IRB法是新協(xié)議最主要的創(chuàng)新和核心;216。 所有開設(shè)賬戶的有效信用項(xiàng);216。 最近拖欠的時(shí)間216。 根據(jù)申請(qǐng)貸款個(gè)人的基本資料和貸款金額、用途、還款來(lái)源及期限等,對(duì)貸款申請(qǐng)進(jìn)行初步審核。 關(guān)注企業(yè)的最底線,而非時(shí)髦的新工具216。 這種對(duì)客戶喜好的分析能夠指導(dǎo)市場(chǎng)營(yíng)銷,使?fàn)I銷活動(dòng)得到有效的響應(yīng)和最高的收益。 邏輯回歸/正態(tài)回歸216。征信機(jī)構(gòu)數(shù)據(jù) 行為數(shù)據(jù) 交易數(shù)據(jù) 調(diào)查數(shù)據(jù) 普查數(shù)據(jù)人口統(tǒng)計(jì)數(shù)據(jù) 應(yīng)用數(shù)據(jù) 歷史數(shù)據(jù) 通訊信息 統(tǒng)計(jì)機(jī)構(gòu)數(shù)據(jù)216。 風(fēng)險(xiǎn)狀態(tài):風(fēng)險(xiǎn)發(fā)生的可能性,發(fā)生后對(duì)項(xiàng)目造成影響的程度。 制定項(xiàng)目計(jì)劃。 元數(shù)據(jù)需求定義216。元數(shù)據(jù)管理將以數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)環(huán)境為核心,完成對(duì)相關(guān)業(yè)務(wù)元數(shù)據(jù)及技術(shù)元數(shù)據(jù)的集成及應(yīng)用,提供數(shù)據(jù)路徑、數(shù)據(jù)歸屬信息,并對(duì)業(yè)務(wù)術(shù)語(yǔ)、文檔進(jìn)行集中管理,通過(guò)變更報(bào)告、影響分析以及業(yè)務(wù)術(shù)語(yǔ)管理等應(yīng)用,保證數(shù)據(jù)的完整性,控制數(shù)據(jù)質(zhì)量,減少業(yè)務(wù)術(shù)語(yǔ)的歧義,建立業(yè)務(wù)人員之間、技術(shù)人員之間、以及業(yè)務(wù)人員與技術(shù)人員之間的溝通平臺(tái)。 質(zhì)量控制方法OLAP質(zhì)量控制方法主要是對(duì)以下四個(gè)過(guò)程進(jìn)行評(píng)審:216。3. 評(píng)審邏輯模型設(shè)計(jì)階段所提交的交付文檔,主要包括:數(shù)據(jù)源數(shù)據(jù)的映射表,ETL系統(tǒng)設(shè)計(jì)說(shuō)明書,ETL子系統(tǒng)測(cè)試報(bào)告,ETL流程設(shè)計(jì)說(shuō)明書,ETL調(diào)整維護(hù)說(shuō)明書,ETL故障錯(cuò)誤恢復(fù)恢復(fù)說(shuō)明書,ETL數(shù)據(jù)質(zhì)量控制策略及流程,ETL回溯設(shè)計(jì)說(shuō)明書,數(shù)據(jù)裝載工作報(bào)告,數(shù)據(jù)裝載狀態(tài)報(bào)告,ETL子系統(tǒng)測(cè)試報(bào)告,ETL用戶手冊(cè),ETL系統(tǒng)備份恢復(fù),ETL程序和源代碼 ETL的主要任務(wù)包括216。即設(shè)計(jì)怎樣確定在數(shù)據(jù)歸檔過(guò)程中發(fā)生的錯(cuò)誤,以及恢復(fù)或者重啟的過(guò)程。 在維表中增加一個(gè)字段,記錄已更改的記錄舊的取值,這樣也可以保留歷史紀(jì)錄,但是只能保留前一個(gè)修改歷史。主要評(píng)審主題域是否可以正確反映用戶的決策分析需求。 關(guān)系型數(shù)據(jù)庫(kù)和OLAP邏輯模型設(shè)計(jì)、調(diào)整、驗(yàn)證216。 數(shù)據(jù)倉(cāng)庫(kù)的分析類型決定了模型的類型和模型的內(nèi)容,因?yàn)樘釂?wèn)、報(bào)告及多維分析需要聚集、清晰的元數(shù)據(jù)結(jié)構(gòu)。 需求的明確度216。 從業(yè)務(wù)角度出發(fā)引導(dǎo)和采集客戶需求216。業(yè)務(wù)分析主題的確立有一下幾個(gè)原則:216。主要的質(zhì)量問(wèn)題包括正確性、完整性、及時(shí)性和唯一性。是需要一個(gè)單一的數(shù)據(jù)倉(cāng)庫(kù),還是需要數(shù)據(jù)倉(cāng)庫(kù)加上依賴型的數(shù)據(jù)集市,或者僅需要一個(gè)單一的數(shù)據(jù)集市。如性能、可靠性、可用性、安全性、接口需求與設(shè)計(jì)約束等216。 業(yè)務(wù)需求的確立;216。 以性能為導(dǎo)向?qū)?shù)據(jù)的不同層次進(jìn)行鉆取4. 數(shù)據(jù)挖掘:工具驅(qū)動(dòng)216。3. 數(shù)據(jù)存儲(chǔ)層:是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)的核心。 制定更好的決策:216。在邏輯意義上,它是對(duì)應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對(duì)象,是針對(duì)某一決策問(wèn)題而設(shè)置的面向主題的數(shù)據(jù)組織方式,就是在較高層次上對(duì)分析對(duì)象數(shù)據(jù)的一個(gè)完整、統(tǒng)一、一致的描述,能完整及統(tǒng)一地描述出各個(gè)分析對(duì)象所設(shè)計(jì)的相關(guān)企業(yè)的分項(xiàng)數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系 數(shù)據(jù)倉(cāng)庫(kù)是集成的全面而正確的數(shù)據(jù)是進(jìn)行有效分析和決策的首要前提。這種方法發(fā)源于日本,是指計(jì)劃plan,做do,檢查check,和行動(dòng)action:隨著信息化的高速發(fā)展,各行各業(yè),各組織單位積累了大量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)存在于各單位的數(shù)據(jù)庫(kù),各種報(bào)表、文檔中,真可謂是數(shù)據(jù)的海洋。 關(guān)于數(shù)據(jù)倉(cāng)庫(kù)中的質(zhì)量管理問(wèn)題的研究,目前有幾個(gè)主要的切入點(diǎn):(1) 從數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)入手,簡(jiǎn)歷適合全方位質(zhì)量控制的體系結(jié)構(gòu)(2) 遵從生命周期觀點(diǎn),全過(guò)程控制數(shù)據(jù)倉(cāng)庫(kù)建設(shè)質(zhì)量(3) 按照數(shù)據(jù)倉(cāng)庫(kù)兇的工作機(jī)制和部件構(gòu)成來(lái)制定質(zhì)量控制標(biāo)準(zhǔn)數(shù)據(jù)倉(cāng)庫(kù)質(zhì)量從本質(zhì)上說(shuō)是總體數(shù)據(jù)質(zhì)量的問(wèn)題。 深化客戶關(guān)系216。外部信息包括各類法律法規(guī)、市場(chǎng)信息和競(jìng)爭(zhēng)對(duì)手的信息等等。 歷史細(xì)節(jié)數(shù)據(jù)216。數(shù)據(jù)倉(cāng)庫(kù)管理以數(shù)據(jù)倉(cāng)庫(kù)的生命周期分為規(guī)劃、開發(fā)、運(yùn)行和維護(hù)三個(gè)階段。 備份與恢復(fù)的維護(hù)看系統(tǒng)結(jié)構(gòu)商業(yè)智能系統(tǒng)邏輯架
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1