freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項(xiàng)目建設(shè)-講義(存儲版)

2025-09-03 18:27上一頁面

下一頁面
  

【正文】 術(shù)語管理等應(yīng)用,保證數(shù)據(jù)的完整性,控制數(shù)據(jù)質(zhì)量,減少業(yè)務(wù)術(shù)語的歧義,建立業(yè)務(wù)人員之間、技術(shù)人員之間、以及業(yè)務(wù)人員與技術(shù)人員之間的溝通平臺。對本項(xiàng)目而言,元數(shù)據(jù)通過定義數(shù)據(jù)倉庫的內(nèi)容,幫助用戶找到進(jìn)行分析所需的相關(guān)信息。 元數(shù)據(jù)需求定義216。審查:對項(xiàng)目的所有階段性成果,或者里程碑式的成果,包括整個項(xiàng)目的技術(shù)路線、技術(shù)策略、技術(shù)方法、項(xiàng)目管理的方法與策略等項(xiàng)目有關(guān)的情況做出評估意見。 制定項(xiàng)目計(jì)劃。項(xiàng)目的管理執(zhí)行指標(biāo)包括管理和執(zhí)行兩大部分,其中管理是指:管理能力體現(xiàn)項(xiàng)目管理方面的能力,以靜態(tài)能力為主,強(qiáng)調(diào)對關(guān)鍵的活動進(jìn)行了管理;執(zhí)行是指:對各種計(jì)劃、管理辦法等的執(zhí)行能力。 風(fēng)險狀態(tài):風(fēng)險發(fā)生的可能性,發(fā)生后對項(xiàng)目造成影響的程度。 發(fā)現(xiàn)過去未知、隱藏的信息216。征信機(jī)構(gòu)數(shù)據(jù) 行為數(shù)據(jù) 交易數(shù)據(jù) 調(diào)查數(shù)據(jù) 普查數(shù)據(jù)人口統(tǒng)計(jì)數(shù)據(jù) 應(yīng)用數(shù)據(jù) 歷史數(shù)據(jù) 通訊信息 統(tǒng)計(jì)機(jī)構(gòu)數(shù)據(jù)216。 使用更多數(shù)據(jù)的成本與效益分析216。 邏輯回歸/正態(tài)回歸216。 聚焦于每個個體客戶的需求(客戶級別而非賬戶級別)216。 這種對客戶喜好的分析能夠指導(dǎo)市場營銷,使?fàn)I銷活動得到有效的響應(yīng)和最高的收益。 識別在該挖掘主題中需要用到的主要變量216。 關(guān)注企業(yè)的最底線,而非時髦的新工具216。 可以從當(dāng)前資產(chǎn)、歷史資產(chǎn)峰值(潛力資產(chǎn))、傭金等方面考慮,最大可能的挽留那些價值高、流失率高的客戶2. 數(shù)據(jù)處理及訓(xùn)練模型(1)數(shù)據(jù)的轉(zhuǎn)換匯總和平均:如三個月客戶存入資金總次數(shù)、存入資金總額度、日均資產(chǎn)等變化率:月變化率:(本月值上月值)/上月值波動度:由于正??蛻舻慕灰仔袨橐泊嬖谝欢ǖ牟▌?,變化率不能很好的區(qū)分出是正常的波動還是異常的波動。 根據(jù)申請貸款個人的基本資料和貸款金額、用途、還款來源及期限等,對貸款申請進(jìn)行初步審核。 根據(jù)經(jīng)驗(yàn),構(gòu)建預(yù)審模型中包括10多個重要變量,舉例如下:178。 最近拖欠的時間216。 受欺詐行為的影響,全球銀行業(yè)每年損失有數(shù)以億美元。 所有開設(shè)賬戶的有效信用項(xiàng);216。 最老賬戶的設(shè)立時間以及最近一次設(shè)立銀行循環(huán)賬戶的時間 催收模型216。 計(jì)算信用風(fēng)險的IRB法是新協(xié)議最主要的創(chuàng)新和核心;216。 持倉和風(fēng)險偏好,及根據(jù)活躍度和貢獻(xiàn)度等指標(biāo)的客戶分群 偏好分析模型建立流程1. 樣本抽樣隨機(jī)選取XXX個有效客戶(10%)2. 根據(jù)分析的角度選擇候選分析指標(biāo)(1)客戶不同產(chǎn)品、不同股票行業(yè)和價格持倉市值占比如:客戶A股持倉市值占比、權(quán)證交易占總交易量的比、采掘業(yè)持倉市值占比和高價股票持倉市值占比(2)各種委托方式交易次數(shù)和各時間段交易次數(shù)占總交易次數(shù)比的指標(biāo)(3)傭金、資產(chǎn)、買入股票次數(shù)、市值率等指標(biāo) 數(shù)據(jù)處理及訓(xùn)練模型1. 數(shù)據(jù)的轉(zhuǎn)換如對資產(chǎn)求對數(shù)(LOG)2. 數(shù)據(jù)的標(biāo)準(zhǔn)化 數(shù)據(jù)處理及訓(xùn)練模型1. 模型結(jié)果分析并根據(jù)結(jié)果調(diào)整模型業(yè)務(wù)解釋的合理性、可應(yīng)用性等角度去描述群體和調(diào)整模型,直至得到理想的模型2. 模型的平穩(wěn)性驗(yàn)證 偏好模型應(yīng)用模式1. 偏好模型針對客戶(有效客戶)216。 數(shù)據(jù)的存貯質(zhì)量:數(shù)據(jù)的存貯質(zhì)量是指數(shù)被安全的存貯在適當(dāng)?shù)慕橘|(zhì)上;216。 通常重要的變量8~10個即可216。例如,對變量“申請者信用歷史時間”進(jìn)行分箱操作,該變量的取值可以為一個數(shù)值(月份),也可以是字符變量,那么對這一變量的分箱可以有如下形式: 10 結(jié)果檢驗(yàn)和項(xiàng)目管理 模型準(zhǔn)確性判斷建模過程中:左右比較,前后比較投產(chǎn)前:樣本對比測試使用后:模型驗(yàn)證 模型驗(yàn)證商業(yè)銀行應(yīng)同時采用定量和定性的驗(yàn)證方法1. 定性驗(yàn)證:側(cè)重于通過專家評估的方法,評估計(jì)量模型和支持體系相關(guān)治理結(jié)構(gòu)、正常、流程、控制、文檔管理、模型結(jié)果運(yùn)用等情況。 企業(yè)范圍內(nèi)被用戶接納和采用(指系統(tǒng)和分析結(jié)果)216。 放置了多少壞賬216。 都應(yīng)該成功:價值體現(xiàn)216。 職業(yè)紀(jì)律要求(不可亂試)216。 給別人帶來了多少利潤216。 模型準(zhǔn)確性:二項(xiàng)檢驗(yàn)、卡方檢驗(yàn)4. 基準(zhǔn)測試 BI成功的標(biāo)準(zhǔn)216。分箱操作適用于各種類型的變量,如離散變量、連續(xù)變量或者混合型變量。 利用LOGISTIC的STEPWISE選擇對預(yù)測最有用的一組變量3. 變量選擇要注意216。 數(shù)據(jù)的自治性:數(shù)據(jù)并不是孤立存在的,數(shù)據(jù)之間往往存在各種約束,這種約束描述了數(shù)據(jù)的關(guān)聯(lián)關(guān)系,數(shù)據(jù)必須滿足這些關(guān)聯(lián)關(guān)系2. 數(shù)據(jù)的過程質(zhì)量216。 股票行業(yè)偏好;216。 信用風(fēng)險是銀行面臨的主要風(fēng)險;216。 按協(xié)議付款的循環(huán)銀行賬戶數(shù)216。 賬戶設(shè)立時長;過去24個月中所開的賬戶是否過多;216。 基于破產(chǎn)的人數(shù)的不斷增加,僅信用卡一項(xiàng)年損失額就超過百億美元,構(gòu)建破產(chǎn)模型、晚付賬模型,及早對個人的破產(chǎn)、晚付賬可能性進(jìn)行預(yù)測使損失最小化,這對銀行來說是至關(guān)重要的。 信用最差評分216。 常用于信用卡申請的過濾,過濾掉那些發(fā)卡單位不愿考慮的客戶。決策支持系統(tǒng)風(fēng)險管理部分包括:風(fēng)險評級;風(fēng)險預(yù)警;風(fēng)險調(diào)整后的定價管理;組合風(fēng)險管理;動態(tài)風(fēng)險準(zhǔn)備金管理;授權(quán)授信管理 方法二:信用評分:根據(jù)業(yè)務(wù)需要開發(fā)各種不同的信用評分模型,將模型提供給商業(yè)銀行、貸款機(jī)構(gòu)、電信公司、保險公司以及信用管理局等需要信用評分的公司。 降低每月客戶的平均流失率216。以客戶收益級別客戶關(guān)系管理的主要依據(jù);以賬戶收益級別為產(chǎn)品管理的主要依據(jù)(5) 考慮更多人口統(tǒng)計(jì)變量,如教育程度、職業(yè)類型、家庭大小、是否用用汽車和電腦等信息。 與客戶零售部門以及研發(fā)部門人員進(jìn)行訪談,以確認(rèn)數(shù)據(jù)源216。 下面各級逐漸揭示了越來越多的客戶消費(fèi)行為的細(xì)節(jié)216。 銷售與市場216。 指標(biāo)性的一些變量的處理2. 缺失值經(jīng)常具有預(yù)估能力并且信息需要被計(jì)算,例如利用標(biāo)記物3. 數(shù)學(xué)的轉(zhuǎn)換目標(biāo)模型 篩分模型 承保模型 行為模型 拖欠模型 破產(chǎn)模型 交叉銷售模型 客戶分割 損失預(yù)測模型 流失模型 收益能力分析 基于風(fēng)險的價格分析欺詐探測 洗黑錢探測 新產(chǎn)品開發(fā)目標(biāo)模型 交叉銷售模型 客戶分割 損失預(yù)測模型 流失模型/挽留模型收益能力分析 基于風(fēng)險的定價分析/制定利率 分析探測 索賠分析/索賠估算預(yù)測實(shí)際估算值 新產(chǎn)品開發(fā) 預(yù)算 資產(chǎn)負(fù)債管理市場操縱的探測 內(nèi)部交易的探測 關(guān)聯(lián)交易賬號的探測 市場趨勢分析機(jī)構(gòu)投資者的交易模式分析 投資者產(chǎn)出分析 批量交易分析 指數(shù)基金分析基金與其他金融產(chǎn)品的關(guān)聯(lián)性分析 上市公司財(cái)務(wù)數(shù)據(jù)與股票價格關(guān)系分析海外市場與國內(nèi)股票市場相關(guān)性分析 重大事件對市場的影響成員財(cái)務(wù)風(fēng)險分析 成員交易風(fēng)險分析 高風(fēng)險上市公司分析—主要應(yīng)用客戶流失分析(Logistic回歸或決策樹)客戶細(xì)分(聚類算法)重入網(wǎng)用戶識別(消費(fèi)指紋結(jié)合IMEI)交叉銷售(關(guān)聯(lián)規(guī)則、聚類、決策樹等)客戶細(xì)分—應(yīng)用案例—應(yīng)用主題客戶分析 商品分析 銷售分析 營銷分析 供應(yīng)商分析 門店分析 員工分析業(yè)務(wù)分析師、數(shù)據(jù)挖掘分析師(數(shù)據(jù)挖掘算法,數(shù)據(jù))、IT專家、用戶 GBICC數(shù)據(jù)挖掘過程模型商業(yè)目標(biāo)定義、數(shù)據(jù)源識別、數(shù)據(jù)手機(jī)、數(shù)據(jù)質(zhì)量審核(數(shù)據(jù)合法性、合理性)、數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、建模(利用工具軟件)、結(jié)果評估、結(jié)果應(yīng)用、模型監(jiān)控 7 數(shù)據(jù)挖掘算法 數(shù)據(jù)挖掘功能、算法及典型應(yīng)用(重要) 分類216。 數(shù)據(jù)結(jié)構(gòu)216。根據(jù)統(tǒng)計(jì)和非統(tǒng)計(jì)方法之間的不同把數(shù)據(jù)挖掘分為兩種類型:假設(shè)驅(qū)動和發(fā)現(xiàn)驅(qū)動的數(shù)據(jù)挖掘。216。 進(jìn)度狀態(tài):是否按照計(jì)劃執(zhí)行,進(jìn)度速度是否適當(dāng)216。216。項(xiàng)目總體管理質(zhì)量控制的目標(biāo)是在數(shù)據(jù)倉庫周期中管理者通過一些列的管理活動,在一定的時間和預(yù)算范圍內(nèi),有效地利用人力、資源、技術(shù)和工具,使數(shù)據(jù)倉庫系統(tǒng)按照預(yù)期的計(jì)劃和質(zhì)量要求如期完成。定位有3個:監(jiān)督、審查和控制。4. 根據(jù)元數(shù)據(jù)的內(nèi)容,用戶的應(yīng)用需求可分為技術(shù)需求和業(yè)務(wù)需求兩個部分,分別面向技術(shù)用戶、業(yè)務(wù)用戶以及數(shù)據(jù)管理用戶。元數(shù)據(jù)管理將以數(shù)據(jù)倉庫數(shù)據(jù)環(huán)境為核心,完成對相關(guān)業(yè)務(wù)元數(shù)據(jù)及技術(shù)元數(shù)據(jù)的集成及應(yīng)用,提供數(shù)據(jù)路徑、數(shù)據(jù)歸屬信息,并對業(yè)務(wù)術(shù)語、文檔進(jìn)行集中管理,通過變更報告、影響分析以及業(yè)務(wù)術(shù)語管理等應(yīng)用,保證數(shù)據(jù)的完整性,控制數(shù)據(jù)質(zhì)量,減少業(yè)務(wù)術(shù)語的歧義,建立業(yè)務(wù)人員之間、技術(shù)人員之間、以及業(yè)務(wù)人員與技術(shù)人員之間的溝通平臺。通過元數(shù)據(jù)管理,使分散的數(shù)據(jù)信息成為一個統(tǒng)一的整體。 ETCL工具廠商:Informatica、Datastage、OWB、微軟DTS、Beeload、Kettle216。 保證為最終用戶提供共享多維信息的快速分析和及時數(shù)據(jù)庫查詢,確保OLAP數(shù)據(jù)模型設(shè)計(jì)合理,具有良好的擴(kuò)展能力;216。 數(shù)據(jù)源的確認(rèn)216。 ETL的質(zhì)量控制的方法1. 依據(jù)數(shù)據(jù)源狀態(tài)報告、需求分析說明書、數(shù)據(jù)倉庫邏輯模型及說明文檔、數(shù)據(jù)倉庫物理模型及說明文檔對ETL過程中的關(guān)鍵點(diǎn)進(jìn)行跟蹤。 建立單元測試計(jì)劃,以測試作業(yè)調(diào)度過程是否正確216。1. 設(shè)計(jì)數(shù)據(jù)歸檔轉(zhuǎn)儲過程。2. 數(shù)據(jù)更新ETL過程設(shè)計(jì)。 覆蓋歷史記錄,直接更新維度字段的值216。 數(shù)據(jù)與需求映像關(guān)系是否有明確說明216。邏輯模型的最終設(shè)計(jì)成果應(yīng)該包含每個主題邏輯定義,且將相關(guān)內(nèi)容記錄在數(shù)據(jù)倉庫的元數(shù)據(jù)中,其中包括粒度劃分、數(shù)據(jù)分割各類、表劃分和數(shù)據(jù)來源等。) 多樣性原則一般來說,DDS應(yīng)該是多維的,即DDS中所有數(shù)據(jù)都使用多維模型來構(gòu)建。 設(shè)計(jì)和完善事實(shí)、度量和維度216。 梳理數(shù)據(jù),作為DDS模型設(shè)計(jì)的基礎(chǔ)216。 數(shù)據(jù)模型清晰地描述了系統(tǒng)完整的數(shù)據(jù)流程,是應(yīng)用程序作用于系統(tǒng)的中介,通過數(shù)據(jù)模型改進(jìn)系統(tǒng),可以提高系統(tǒng)的協(xié)調(diào)性與合理性,可以產(chǎn)生更好的系統(tǒng)設(shè)計(jì)。一般的,數(shù)據(jù)倉庫數(shù)據(jù)模型特指基礎(chǔ)數(shù)據(jù)層的數(shù)據(jù)模型。 非功能性需求的可測量性216。 建立需求變更控制216。并且另外使用文檔進(jìn)行描述。 定義需求變更管理流程216。1. 定義并跟蹤業(yè)務(wù)需求和系統(tǒng)需求開發(fā)的方法和流程216。 用戶確認(rèn)數(shù)據(jù)庫質(zhì)量問題報告,用戶確認(rèn)數(shù)據(jù)質(zhì)量報告及建議的處理方法。 評價用于構(gòu)造指定主題的數(shù)據(jù)質(zhì)量。該信息需要包括下列有關(guān)的軟硬件因素:OLTP系統(tǒng)名稱與類型、平臺(包括硬件與操作系統(tǒng))、網(wǎng)絡(luò)通信協(xié)議、可用的存儲空間。 性能需求,包括容量、響應(yīng)時間和刷新等需求 基本維模型的建立216。采訪用戶是獲得需求的最慣用的方法。 功能需求:用來說明系統(tǒng)將做什么216。 數(shù)據(jù)倉庫技術(shù)的選用216。 在現(xiàn)有系統(tǒng)中的位置、與現(xiàn)有系統(tǒng)的依賴關(guān)系;216。 周期的長度216。 獨(dú)立的standalone3. 多維分析216。數(shù)據(jù)集市可能是企業(yè)及數(shù)據(jù)倉庫的一個組成部分。通過ETL調(diào)度管理、ETL日志管理、ETL出錯管理來控制管理數(shù)據(jù)加載的整個過程。 盈利性最差的10%客戶的特征是什么?216。 提升運(yùn)營效率216。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)領(lǐng)導(dǎo)者決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢和分析,一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)操作主要是數(shù)據(jù)查詢和分析,一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之后,一般情況下將會被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作和分析,修改和刪除操作一般不多,通常只需要定期的加載、刷新。而不是一種可以購買的產(chǎn)品。在綜合使用一些應(yīng)用軟件下,用戶獲得想要的信息,最終為經(jīng)營管理的決策提供有力的幫助216。數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項(xiàng)目建設(shè)1. 數(shù)據(jù)倉庫知識簡介軟件質(zhì)量控制的主要目的是為了獲得更高的開發(fā)效率,避免返工,提高產(chǎn)品的市場競爭力,從而為客戶提高符合質(zhì)量需求的穩(wěn)定可靠的軟件產(chǎn)品,同時它也是控制方法的集合,包括軟件建模、度量、評審以及其他活動。 數(shù)據(jù)倉庫系統(tǒng)是指面向主題的、集成的、穩(wěn)定的同時又是隨時間變化的大量的數(shù)據(jù)集合。與其他數(shù)據(jù)庫應(yīng)用不同的是,數(shù)據(jù)倉庫更像是一種過程,是對分布在企業(yè)內(nèi)部各處的業(yè)務(wù)數(shù)據(jù)整合、加工和分析的過程。顯而易見的是,對不準(zhǔn)確,甚至不正確的數(shù)據(jù)進(jìn)行分析得出的結(jié)果
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1