freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘商業(yè)案例分析及實現(xiàn)-資料下載頁

2025-05-01 22:48本頁面
  

【正文】 ,該客戶的“風(fēng)險”度也就越高。違約行為反應(yīng)在業(yè)務(wù)數(shù)據(jù)中就是客戶在貸款期限內(nèi)發(fā)生了逾期情況,而逾期情況又可以從逾期的時長,逾期金額的大小,以及在貸款期限內(nèi),截止到統(tǒng)計時間為止的逾期次數(shù)等多個方面進行考量。例如將“還款逾期超過60天”作為客戶發(fā)生違約的基本指標(biāo)。相應(yīng)的數(shù)據(jù)挖掘目標(biāo)就是:違約客戶的特征和預(yù)測;違約客戶的評分和分級。在本例中,我們將最大逾期時間不到30天并且有12期以上的交易記錄的定義為好客戶;最大逾期時間超過60天的為壞客戶。顯然,有些客戶并不能確定為好客戶,又不能確定為好客戶。如最大逾期時間在30天到60天之間的客戶。因此,在我們所選取的建模總體中,客戶實際被分為三類:好客戶、壞客戶和未確定客戶。(2) 數(shù)據(jù)理解數(shù)據(jù)主要來源于以下幾個方面: ? 貸款協(xié)議文件:客戶與銀行發(fā)生貸款業(yè)務(wù)關(guān)系時所簽立的協(xié)議; ? 貸款協(xié)議還款計劃表:報告當(dāng)期的貸款協(xié)議還款計劃和往期還款歷史記錄; ? 客戶信息文件:客戶基本信息,包含性別、年齡、婚姻狀況等信息; ? 客戶信息文件(個貸):客戶附加信息,包括財產(chǎn),工作,住址等信息。首先將各分行的原始數(shù)據(jù)進行追加,并從客戶歷史交易記錄中匯總出逾期信息。將客戶信息,協(xié)議信息和逾期信息進行合并,生成全行數(shù)據(jù)。下面所進行的數(shù)據(jù)理解和數(shù)據(jù)處理都是在這個數(shù)據(jù)樣本文件的基礎(chǔ)上進行。 :數(shù)據(jù)理解通過Clementine中的數(shù)據(jù)審核節(jié)點查看數(shù)據(jù)的分布圖(直方圖、條形圖)、數(shù)據(jù)的基本統(tǒng)計信息(最大值、最小值、平均值、標(biāo)準(zhǔn)差和偏度)和數(shù)據(jù)中有效數(shù)據(jù)所占的比例等。在數(shù)據(jù)審核節(jié)點中會自動對數(shù)據(jù)進行抽樣來提高分析的速度。 :使用Clementine數(shù)據(jù)審核節(jié)點查看數(shù)據(jù)的分布和基本統(tǒng)計信息(3)數(shù)據(jù)準(zhǔn)備根據(jù)商業(yè)理解,我們選擇住房貸款、選擇合同開始年份在2003之后、還款周期為按月還款以及國家代碼為中國的樣本。選擇好客戶和壞客戶樣本,并進行均衡,均衡后的好壞客戶占比基本相同,如圖: :客戶類型分布圖通過對數(shù)據(jù)質(zhì)量的檢驗發(fā)現(xiàn)撫養(yǎng)人口、勞動合同期限等字段由于缺失太多而無法清洗,考慮對這些字段進行剔除。而學(xué)歷、單位性質(zhì)、職位職稱等字段可以將缺失值作為一個新的屬性用在建模中。在數(shù)據(jù)準(zhǔn)備部分,根據(jù)業(yè)務(wù)經(jīng)驗,我們還派生了一些新的字段,例如:月總收入、月還款占總收入比例等。鑒于一些特征變量的分類過多,不利于建模處理,因此對這些集合變量考慮進行重新分類,對連續(xù)變量也可以進行離散化處理。如圖是對貸款金額的分組,可以看出第3組的貸款人相對較優(yōu),而第6的則比較差。 :貸款金額分組(3) 建立模型在本次建模中,主要使用Logistic回歸、從中挑選中最適合的模型用于評分和分級。不同的模型具有不同的優(yōu)點和缺點,可以將不同的模型結(jié)合起來,充分利用各個模型的優(yōu)點,從而得到一個更好的模型。首先,;然后將這兩個模型的評分結(jié)果作為解釋變量之一,再加上其余的特征變量,最后建立一個基于Logistic回歸的信用評分模型。,因此其信用評分結(jié)果中應(yīng)該綜合了解釋變量和因變量之間關(guān)系的更多信息,將這種信用評分結(jié)果作為解釋變量之一,應(yīng)該能夠提高模型的精確度。而最終用Logistic回歸建立模型,又保證了模型的穩(wěn)健性。通過神經(jīng)網(wǎng)絡(luò)敏感性分析可以看出:分行和按揭成數(shù)在模型中是最重要的,這兩個變量的分析結(jié)果要遠大于其他變量。分行最重要進一步說明每個分行客戶的特征差別很大,對全部分行統(tǒng)一建立模型必然會影響到模型的精確度。如果在各分行數(shù)據(jù)量足夠的情況下,推薦對每個分行建立一個模型。也可以考慮將客戶特征相似的分行劃分為一類,對每類分行建立一個模型。 :神經(jīng)網(wǎng)絡(luò)敏感性分析,按揭成數(shù)為第一個拆分的變量;對按揭成數(shù)為2的貸款人,還款方法為第二個拆分的變量 ;對按揭成數(shù)為3的貸款人,分行為第二個拆分的變量??梢钥粗齻€字段在模型中是最重要。 :我們通過主成分分析共生成5個因子,這5個因子包含了絕大部分特征信息。通過這5個因子建立模型在損失一小部分信息的基礎(chǔ)上解決了共線性問題。以5個因子作為輸入建立了Logistic回歸模型,結(jié)果為: :由主成分分析得到的因子:Logistic回歸模型以Logistic模型預(yù)測為好客戶的概率乘以1000作為模型的評分。模型的評分在01000之間,評分越高代表貸款人越優(yōu)。按照模型評分從低到高的順序?qū)①J款人等分為10級,每級都有相同比例的貸款人。還可以對等級進行重新分組,合并具有相似好客戶發(fā)生比的相鄰客戶等級。 :Logistic回歸模型給出的評分和等級(4) 模型評估一個好的數(shù)據(jù)挖掘模型,要經(jīng)過多方面的評估。在對模型進行評估時,既要參照評估標(biāo)準(zhǔn),同時也要考慮到商業(yè)目標(biāo)和商業(yè)成功的標(biāo)準(zhǔn)。在大多數(shù)的數(shù)據(jù)挖掘項目中,數(shù)據(jù)挖掘工程師要不止一次的應(yīng)用某個特定的技術(shù)或者是利用不同的可選擇的技術(shù)產(chǎn)生多種結(jié)果。因此在這一階段的任務(wù)中,也要根據(jù)評估標(biāo)準(zhǔn)比較所有不同的結(jié)果。精確度是用來評估模型的最簡單和最基礎(chǔ)的指標(biāo)。使用分析節(jié)點可以方便的對多個模型同時進行計算和比較。神經(jīng)網(wǎng)絡(luò)模型、%、%%。其中神經(jīng)網(wǎng)絡(luò)的預(yù)測精確度是最高的,但是會出現(xiàn)過度擬和的問題。Logistic回歸模型對壞客戶的預(yù)測是最好的,綜合了3個模型的優(yōu)點,既能保證精確度又能保證模型的穩(wěn)健性。 :神經(jīng)網(wǎng)絡(luò)、從3個模型的收益圖上可以看出。對于Logistic回歸模型來說,找出的20%的客戶中就可以發(fā)現(xiàn)35%的壞客戶,30%的客戶中就可以發(fā)現(xiàn)50%的壞客戶。 KS統(tǒng)計量是一個易于理解和計算的統(tǒng)計量,它是好客戶分布累計百分比與壞客戶分布累計百分比之差,也就是區(qū)分度的最大值。下圖是Logistic模型的KS曲線。,在4150之間,根據(jù)經(jīng)驗準(zhǔn)則,這是一個好的模型。 :神經(jīng)網(wǎng)絡(luò)、Logistic回歸的收益圖KS統(tǒng)計量是一個易于理解和計算的統(tǒng)計量,它是好客戶分布累計百分比與壞客戶分布累計百分比之差,也就是區(qū)分度的最大值。下圖是Logistic模型的KS曲線。,在4150之間,根據(jù)經(jīng)驗準(zhǔn)則,這是一個好的模型。 :Logistic回歸模型的KS曲線ROC曲線和Gini系數(shù)則是利用好、壞客戶分數(shù)分布的全部信息對評分模型區(qū)分好、壞客戶的能力進行評估。下圖中的紅線代表了ROC曲線,離對角線(藍線)越遠,對應(yīng)的評分模型也就越好。這說明ROC曲線和對角線之間的面積越大,評分模型的區(qū)分能力也就越強。 :Logistic回歸模型的ROC曲線 6. 客戶滿意度研究 為什么要進行客戶滿意度研究?客戶滿意(CS, Customer Satisfaction),是指客戶通過對一個產(chǎn)品或服務(wù)的感知效果/結(jié)果與其期望值相比較后,所形成的愉悅或失望的感覺狀態(tài)。客戶滿意度就是對客戶滿意水平的量化,客戶滿意度在國內(nèi)外越來越引起理論界和實業(yè)界人士的關(guān)注。但是面臨客戶多種多樣的要求,以及這些要求反映的龐雜的信息,令企業(yè)的努力往往成效并不顯著,而企業(yè)也存在資源有限的現(xiàn)實問題,不可能也不必要在所有方面令客戶滿意,如何做到用有限的資源有效提高客戶滿意度,這是“客戶滿意度研究”的任務(wù),“客戶滿意度研究”是實現(xiàn)客戶滿意的第一步。 客戶滿意度研究的應(yīng)用價值主要表現(xiàn)在以下幾個方面: 客戶滿意度研究能幫助企業(yè)把其有限的資源集中到客戶最看重的特性方面,從而達到建立和提升客戶忠誠并保留客戶 ;通過分析客戶的價值,把有限的資源優(yōu)先配給最有價值的客戶 ;通過客戶滿意度研究,還能預(yù)測客戶未來的需求,并調(diào)整客戶接觸鏈上的服務(wù)人員的評價、培訓(xùn)、選拔和補充工作; 通過對客戶滿意度的持續(xù)跟蹤研究,能動態(tài)揭示客戶滿意度的變化,評估滿意度改善措施的效果,制定最為有效的行動策略。 滿意度研究的目標(biāo)和內(nèi)容雖然達到客戶滿意度已成為許多公司和組織的主要營運目標(biāo),他們投入大量人力物力進行滿意度方面的調(diào)查,然而由于對滿意度指標(biāo)把握的不準(zhǔn)確和分析方法的貧乏,結(jié)果卻難以得到關(guān)于改進產(chǎn)品和服務(wù),提高客戶滿意度的有價值的結(jié)論。滿意度指標(biāo)確定和分析應(yīng)用已成為進行客戶滿意度調(diào)查的關(guān)鍵和難點。而要理清和把握滿意度調(diào)查的這兩個方面,有必要先明確客戶滿意度調(diào)研的目標(biāo)和分類。調(diào)查的核心是確定產(chǎn)品和服務(wù)在多大程度上滿足了客戶的欲望和需求。就其調(diào)研目標(biāo)來說,主要達到四個目標(biāo):;;,采取正確行動;。就調(diào)查的內(nèi)容來說,又可分為客戶感受調(diào)查和市場地位調(diào)查兩部分??蛻舾惺苷{(diào)查只針對公司自己的客戶,操作簡便。主要測量客戶對產(chǎn)品或服務(wù)的滿意程度,比較公司表現(xiàn)與客戶預(yù)期之間的差距,為基本措施的改善提供依據(jù)。市場地位調(diào)查涉及所有產(chǎn)品或服務(wù)的消費者,對公司形象的考察更有客觀性。不僅問及客戶對公司的看法,還問及他們對同行業(yè)競爭對手的看法。 滿意度研究方法一個普通的客戶滿意度研究,通常的程序包含五大步聚: :滿意度研究的大致步驟(1)客戶類型判定在進行客戶滿意度研究之前,首先要清晰研究需要針對的客戶??蛻魸M意度研究的客戶分類需考慮到:目前客戶、過去客戶、潛在客戶。 對于已經(jīng)建立了完善的客戶關(guān)系管理數(shù)據(jù)庫的企業(yè),可以從數(shù)據(jù)庫中根據(jù)客戶分類要求列出所有的客戶名單,根據(jù)抽樣方法從名單中選取被訪客戶,工業(yè)產(chǎn)品、電信、銀行、保險等的客戶滿意度研究通??梢杂么朔椒āτ跊]有建立或不太可能建立完善的客戶關(guān)系管理數(shù)據(jù)庫的企業(yè),則需要通過對目標(biāo)群體進行隨機抽樣的方法來選取被訪客戶,快速消費品通常需要采用此方法來進行。(2)確定影響客戶滿意度的關(guān)鍵評價指標(biāo)關(guān)鍵評價指標(biāo)的確定是客戶滿意度研究的重點,滿意度研究首先應(yīng)揭示出不同客戶滿意的評價指標(biāo)在重要性上的差異、客戶滿意的程度,而且應(yīng)找出滿意和不滿意的內(nèi)在原因,并能比較各個競爭對手和自身在不同指標(biāo)上的優(yōu)劣。探索主要評價指標(biāo)應(yīng)從兩個方向進行:一為企業(yè)內(nèi)部,二為客戶。通過對企業(yè)內(nèi)部員工/管理者的訪談,了解企業(yè)內(nèi)部員工/管理者對所提供的產(chǎn)品或服務(wù)的專業(yè)性認識,因此會比較系統(tǒng)和完整地提供建立客戶滿意度評價的體系和具體的指標(biāo)。但對客戶的訪談也是必不可少的,因為企業(yè)內(nèi)部員工/管理者對客戶滿意的理解與客戶的實際需求通常會存在著差距,因此必須從客戶的角度了解他們對滿意情況的評價準(zhǔn)則。在這一過程中,有一些統(tǒng)計分析技術(shù)可以幫助企業(yè)制定和篩選出最能有效體現(xiàn)客戶實際滿意度的評價指標(biāo)體系,下面是這一過程中經(jīng)常用到的一些分析技術(shù)。因子分析法。利用因子分析方法分析客戶的指標(biāo)重要性評價數(shù)據(jù),我們可以將不同指標(biāo)分為若干個因子,從每個因子中選擇一個指標(biāo)。通過比較各個指標(biāo)的負荷量和有效性可以幫助我們確定具體應(yīng)選擇的指標(biāo)。判別分析法。應(yīng)用判別分析方法,我們可以確定選出來的指標(biāo)能否很好地預(yù)測整體滿意或不滿意的程度。交替使用因子分析和判別分析,得到的滿意度指標(biāo)不僅在統(tǒng)計上是有效的,而且在邏輯上講也適用于測量客戶滿意度。結(jié)構(gòu)方程模型(SEM):關(guān)鍵評價指標(biāo)體系的建立,實際上也是研究假設(shè)的確立,此部分是客戶滿意度研究的關(guān)鍵。隨著滿意研究理論探索和數(shù)據(jù)驗證的不斷深入,結(jié)構(gòu)方程模型越來越成為滿意度研究領(lǐng)域的重要工具,不論是前期關(guān)鍵評價指標(biāo)體系的確定,還是后期滿意度分析。在實際應(yīng)用結(jié)構(gòu)方程模型確定評價指標(biāo)體系時,通常依據(jù)一定的客戶滿意度理論模型,然后對理論模型中的潛在變量逐級展開,直到形成一系列可以直接測量的指標(biāo),這些測量指標(biāo)便構(gòu)成了客戶滿意度評價指標(biāo)體系。(3)測量客戶對關(guān)鍵評價指標(biāo)的滿意度這部分主要通過定量研究進行,采用量級評分的方法進行測量。主要采用5級、7級或10級量表測量工具,對客戶進行大規(guī)模的問卷調(diào)查。 (4)確定關(guān)鍵評價指標(biāo)的相對重要性這一步分析的一個關(guān)鍵部分是用整體滿意程度作為因變量,用對關(guān)鍵評價指標(biāo)的滿意程度作為自變量進行結(jié)構(gòu)分析。進行關(guān)鍵評價指標(biāo)的滿意度及其相對重要性測量的方法形形色色。但是,整體歸結(jié)起來,可以大概劃分為以下幾種:1)簡單易行型直截了當(dāng)?shù)貑枺骸澳銓X品牌的產(chǎn)品/服務(wù)總體上滿意嗎?”這種方式效率高,容易回答,而且容易了解到消費者對競爭品牌的總體評價。但是由于這樣一個問題太過突兀和簡單,受訪者的回復(fù)在很多情況下不能代表其真實的意思。2)雙重評價型這種方式需要調(diào)查設(shè)計者找到一些影響滿意度的驅(qū)動要素,然后讓受訪者對被調(diào)查品牌在該驅(qū)動要素上的表現(xiàn)打分,同時還要對該驅(qū)動要素對其重要性程度進行打分。這樣設(shè)計,不僅僅可以了解客戶對某品牌產(chǎn)品/服務(wù)的滿意度高低,而且可以了解對相應(yīng)的滿意度驅(qū)動要素的評價。這種方法考慮到滿意度驅(qū)動要素,是一種進步。但是也存在幾個缺陷:a) 根據(jù)我們的經(jīng)驗,這種方式難以區(qū)分不同要素對消費者的真實重要程度。b) 用驅(qū)動要素對受訪者的重要性替代這一概念,這種“概念替換”經(jīng)常會誤導(dǎo)企業(yè)的資源配置。c) 這種方式需要受訪者對每個驅(qū)動要素的表現(xiàn)和重要性分別進行評估,需要占用受訪者較多的時間和精力,從而增加了調(diào)查成功的難度。本方法目前在企業(yè)自身實施的滿意度調(diào)查中應(yīng)用得比較廣泛,因為其應(yīng)用基本不需要太多的統(tǒng)計分析技術(shù),實施簡單。3)雙重評價改進型這種調(diào)查方式是在上一種方式的基礎(chǔ)上改進而得到的。具體方法是:假定全部要素的重要性合計為100,受訪者在對每個調(diào)查要素給予重要性權(quán)重的時候,需要使得權(quán)重和為100。這種方法可以部分彌補上面提到的a)類缺陷,但也無法解決上一方法中的缺陷b)和c)。4)采用線性回歸統(tǒng)計分析技術(shù)隨著市場調(diào)查分析技術(shù)的發(fā)展,統(tǒng)計工具在市場研究中應(yīng)用得越來越多。利用多元回歸分析技術(shù),可以計算出滿意度驅(qū)動要素對滿意度的影響大小。這種影響大小可以解釋為,當(dāng)滿意度驅(qū)動要素提升1分,滿意度在現(xiàn)有的基礎(chǔ)上可以提升多少分。當(dāng)滿意度的驅(qū)動要素非常少,而且這些要素相互之間的影響不強時,這種方法不失為一種簡單有效的方法。實際上,多元回歸分析在研究滿意度問題的時候會存在以下幾個問題:a) 無法同時檢驗客戶滿意度各構(gòu)成要素對客戶整體滿意度與客戶忠誠度兩個因變量的影響,模型中同時只能包含一個因變量。b) 實際生活中,影響消費者對某種產(chǎn)品/服務(wù)滿意
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1