【正文】
ight 169。 2022, SAS Institute Inc. All rights reserved. 定義所需數(shù)據(jù) ? 確定業(yè)務問題,找出您想預測的事物 ? 歷史數(shù)據(jù)必須包含您想預測的事物(目標變量) ? 其它的變量包括客戶的屬性,交易數(shù)據(jù)。 2022, SAS Institute Inc. All rights reserved. 信用周期 Collection ? 收集打分引擎 (Col Scoring Engine) Strategy 被移管的客戶 9/17 賣給債務代理公司 Writeoff 部分償還 全部償還 ?Recovery 損 失 ! ? 催帳單 ? ? 電話 ? …… Copyright 169。 2022, SAS Institute Inc. All rights reserved. 信用周期 Applying 客戶申請表 內(nèi)部信息 Strategy 接受 ? 信用額度 ? 利息 ? 其他條件 拒絕 ? 信用署數(shù)據(jù) ? 其他外部信息 ? 政策 /內(nèi)部規(guī)則 ? 申請打分引擎 ( App Scoring Engine) 信控人員 Copyright 169。 2022, SAS Institute Inc. All rights reserved. 信用風險的業(yè)務問題 ? 客戶從商業(yè)機構(gòu)獲得資金、產(chǎn)品或服務,承諾在未來某天或某段時間內(nèi)償還他所使用的資金、產(chǎn)品或服務,并支付一定的費用 ? 一個 “ 壞賬 ” 客戶帶來的損失相當于數(shù)百個 “ 好 ”客戶給您帶來的收益 ? 信用管理者要求提供對風險進行定量的度量,以及根據(jù)其風險大小決定采取何種最佳措施以減低將來的損失 Copyright 169。 2022, SAS Institute Inc. All rights reserved. 議程 ? 數(shù)據(jù)挖掘概述 ? SAS數(shù)據(jù)挖掘項目方法論及工具 EM簡介 ? Workshop Copyright 169。 2022, SAS Institute Inc. All rights reserved. 節(jié)點通用概貌 ? In/Out ? Data Properties(選擇,瀏覽 ) ? Data/Variables/Log/Output/Notes等 Tab ? 修改節(jié)點后的自動保存 ? 節(jié)點的下拉菜單 Copyright 169。 2022, SAS Institute Inc. All rights reserved. 節(jié)點簡介: Utilities類節(jié)點 SAS Code – 提供 SAS程序接口 。 2022, SAS Institute Inc. All rights reserved. 節(jié)點簡介: Assess類節(jié)點 Assessment – 對不同模型提供圖形化比較:“哪一個模型最好? ” Reporter – 自動生成 HTML格式報告 Copyright 169。 2022, SAS Institute Inc. All rights reserved. 節(jié)點簡介: Model類節(jié)點 Regression – 提供多元回歸、 邏輯 /概率回歸及自動選擇變量變量的功能 Decision Tree – 決策樹,支持 CHAID, CART, ID3/ Neural Network – 提供 MLP、 RBF等網(wǎng)絡結(jié)構(gòu),及多種調(diào)整方法 User Defined Model – 為 SAS程序編制的模型提供統(tǒng)一的模型評價界面 Ensemble – 提供模型整合的功能,如 Combine, Stratified, Baggingamp。 2022, SAS Institute Inc. All rights reserved. 節(jié)點簡介: Explore類節(jié)點 Distribution Explorer – 提供數(shù)據(jù)的多維分布圖,以了解變量的趨勢和特色 Multiplot – 提供所有變量的分布圖及對 KOV的關(guān)系圖 SAS/INSIGHT – 提供交互式直觀統(tǒng)計分析 Variable Selection – 提供選擇對 KOV重要的 KIVs的功能 Association – 提供關(guān)聯(lián)分析和序列分析 Link Analysis – 提供連接關(guān)系分析 Copyright 169。 Data Partition – 將數(shù)據(jù)劃分為訓練 (Train)、 檢驗 (Validation)、 測試(Test)數(shù)據(jù),以避免模型過擬合。 2022, SAS Institute Inc. All rights reserved. 節(jié)點簡介: Sampling類節(jié)點 Input Data – 確定數(shù)據(jù)源 。 2022, SAS Institute Inc. All rights reserved. SAS/EM 界面 Copyright 169。 ? SEMMA方法論引導,將數(shù)據(jù)挖掘功能模塊組成處理流程圖,可視化, 圖形化, 拖拽式 操作界面, 適用于業(yè)務和技術(shù)人員 ? 豐富的可視化數(shù)據(jù)探索節(jié)點 , 對數(shù)據(jù)進行細致分析 ? 提供多種數(shù)據(jù)預處理和變換工具,包括變量自動選擇等功能 ? 提供豐富的數(shù)據(jù)挖掘模型和靈活的算法: 決策樹,神經(jīng)元網(wǎng)絡,回歸,基于記憶的推理,兩階段模型, K均值聚類,自組織映射 及其他統(tǒng)計方法,以及模型組裝技術(shù) (Ensemble) ? 提供模型評估模塊和多種評估準則 ? 提供完整的數(shù)據(jù)挖掘模型代碼輸出和打分( Scoring) 功能 ? 報告工具可以將整個數(shù)據(jù)挖掘流程和結(jié)果生成 HTML格式的詳細的報告,與其它業(yè)務專家和數(shù)據(jù)挖掘?qū)<夜蚕?。 2022, SAS Institute Inc. All rights reserved. EM基本介紹 ? EM特色 ? EM界面 ? SEMMA方法論 ? 節(jié)點簡介 ? 節(jié)點通用概貌 Copyright 169。 2022, SAS Institute Inc. All rights reserved. SAS 數(shù)據(jù)挖掘項目方法論 ? 反復 挖掘 數(shù)據(jù) (SEMMA) 定義業(yè)務問題 ?考察業(yè)務情況 ?提出業(yè)務問題 ?考察數(shù)據(jù)可用性 ?制定業(yè)務計劃 ?選擇數(shù)據(jù)挖掘方法 探索 (E) 調(diào)整 (M) 建模 (M) 評估 (A) 抽樣 (S) 系統(tǒng)環(huán)境評估 ?評估系統(tǒng)環(huán)境 ?評估企業(yè)準備情況 ?評估 IT環(huán)境 ?選擇軟硬件環(huán)境 ?規(guī)劃實施體系結(jié)構(gòu) 數(shù)據(jù)準備 ?創(chuàng)建數(shù)據(jù)挖掘環(huán)境 ?檢查和校驗數(shù)據(jù) ?準備數(shù)據(jù) 模型實施 ?設計模型集成的體系結(jié)構(gòu) ?生成管理和業(yè)務報告 ?清理數(shù)據(jù)使其可用 ?把模型應用于生產(chǎn) 回顧與評價 ?回顧模型對企業(yè)生產(chǎn)的效果 ?回顧投資回報 ?回顧模型的性能 Copyright 169。 2022, SAS Institute Inc. All rights reserved. cluster4 cluster3 cluster1 cluster2 cluster5 ② 描述型 – 聚類 把具有相似行為的客戶分到一群 Qu