【正文】
最后,對在百忙之中評審此論文的各位專家教授表示誠摯的謝意! 唐貝 2020 年 4 月 23 附錄一: Kmean 算法聚類結果 初始聚類中心 聚類 1 2 3 x1 x2 x3 x4 .00 .00 x5 迭代歷史記錄 a 迭代 聚類中心內的更改 1 2 3 1 2 .000 3 .000 .000 .000 a. 由于聚類中心內沒有改動或改動 較小而達到收斂。 另外,單純的聚類分析不能全面反映客戶在整個生命周期對于企業(yè)的價值,最好與時間序列分析等技術結合使用。 4 結束語 隨著改革開放的不斷深入,市場間的競爭不斷的激烈,銀行或者說一般企業(yè)為了不斷的提高自身競爭能力,獲得更大的效益面對如何更深刻地理解客戶,如何實現(xiàn)存量客戶的流失保有,如何挖掘增量潛在客戶,如何進行交叉銷售提升客戶價值,如何進行欺詐識別防范經營風險,如何推出適合客戶消費特點的產品及套餐等這一系列的問題時,數(shù)據(jù)挖 掘技術在解決這些問題方面就凸顯出其它方法無與倫比的優(yōu)勢。 ,對個案聚類和對變量的聚類結果如下: 對個案的解釋與 Kmean算法中聚類結果類似,即聚類后將客戶分為指定群,并確定該群的主要群體特性,此處不再贅述。 (上圖)圖 T 檢驗 Matrix Ttest 表 T檢驗結果 of Relative Matrix Ttest 單個樣本檢驗 檢驗值 = 0 差分的 95% 置信區(qū)間 t df Sig.(雙側 ) 均值差值 下限 上限 x1 .750 4 .495 .168800 .79374 x2 .960 4 .391 .202400 .78769 x3 4 .191 .286400 .79152 x4 .491 4 .649 .117800 .78343 x5 .125 4 .907 .032200 .74751 18 解釋與評估, 結果 轉換 對數(shù)據(jù)挖掘的結果進行解釋和評價 Kmean 算法得出的數(shù)據(jù)挖掘結果即,將 20 名客戶聚為三類,其中第一類包含 5 個客戶,相應客戶編號分別為 :1, 3, 12, 13, 20;第二類包含 7 個客戶,相應客戶編號分別為: 2, 4, 5, 10, 16, 17, 18;第三類包含 8個客戶,相應客戶編號分別為: 6, 7, 8, 9, 11, 14, 15, 19。 ,即客戶分群: 層次聚類法對 20 名客戶的聚類過程與 Kmean 算法類似: ( 1) 數(shù)據(jù)輸入,變量設置。 Kmean 算法的挖掘過程 本文的數(shù)據(jù)挖掘過程借助 SPSS Statistics 軟件進行,對 20 名客戶進行分類,取 K 值為 3,即將客戶分為三類。)。符合客戶細分的要求和特點。 數(shù)據(jù)預處理 對于選擇出的數(shù)據(jù),進行“清洗”工作,將數(shù)據(jù)轉變?yōu)椤案蓛簟睌?shù)據(jù)。 資產數(shù)據(jù)用于描述客戶在銀行的各項存款 (活期存款、通知存款、定期存單、定期一本通、存本取息、零存整取、定活二便等 )、投資 (記名國庫券 )等數(shù)據(jù)。 7 客戶分類指標的建立 商業(yè)銀行個人客戶常用的細分方法有: ( 1)按數(shù)據(jù)屬性分類 用于商業(yè)銀行個人客戶細分的數(shù)據(jù)包括客戶的基本屬性數(shù)據(jù)、銀行業(yè)務屬性數(shù)據(jù)、資信屬性數(shù)據(jù)等: A. 客戶的基本屬性數(shù)據(jù)。 分類和聚類等挖掘方法可以把大量的客戶分成不同的類(群體),適合于用來進行客戶細分。聚類分析能夠發(fā)現(xiàn)對特定產品感興趣的用戶群,神經網(wǎng)絡、回歸等方法能夠預測顧客購買該新產品的可能性。在行為分組完成后,還要進行客戶理解、客戶行為規(guī)律發(fā)現(xiàn)和客戶組之間的交叉分析。序列模式分析非常適于尋找事物的發(fā)生趨勢或重復性模式。既可以用此模型分析已有的數(shù)據(jù),也可以用它來預測未來的數(shù)據(jù)。 數(shù)據(jù)挖掘其實是一類深層次的數(shù)據(jù)分析方法。 對商業(yè)銀行來說,單純的滿足客戶需求,強調為所有客戶提供同樣優(yōu)質的服務,很可能是事倍功半,得不償失。 客戶細分沒有統(tǒng)一的模式,總的來說,客戶細分的方法主要包括基于客戶統(tǒng)計學特征的客戶細分、基于客戶行為的客戶細分、基于客戶生命周期的客戶細 分 4 和基于客戶價值相關指標的客戶細分。在一些高風險行業(yè),通過對客戶的類別及其消費特點,可以對客戶異常進行預警??蛻艏毞质沁M行客戶關系管理的重要前提和關鍵步驟。他們利用商業(yè)智能的卓越性能,了解每個客戶的行為特征、消費習慣、財務狀況及未來的需要,從而為客戶做出恰當和切合其需要的財務建議和安排,同時更有針對性和更有效地進行推廣工作(陳宏凱, 2020)。 數(shù)據(jù) 挖掘技術已經被廣泛應用在西方金融行業(yè)企業(yè)中,它可以成功預測銀行客戶需求。 數(shù) 據(jù) 挖掘的技術在我國的研究與應用并不是很廣泛深入。作為客戶關系管理的重要功能之一的客戶細分便提高商業(yè)銀行競爭方面凸顯其重要的戰(zhàn)略意義和作用。 面對這些亟待解決的問題,利用數(shù)據(jù)挖掘算法在客戶關系管理中對客戶進行細分無疑是很好的選擇。 Information System Abstract: With the development of our country’s economic and the reforming and opening up policy, the information technology and the financial sector develop faster than before,pan ies can get a large scale of customer information from customer relationship management. While how to make full use of these precious resources, divide customer into different clusters, keep and develop customers through these resources, the problem has been the key factor of winning succ ess of the intense petition of mercial banks. Face to these to be solved problems, date mining is a good choice for managers to make cust omer segmentation. It can do customer segmentation for banks quickly and give ideas to every cl uster with lower cost, higher benefit and more appropriate service. This article elaborated the origin of bank customer segmentation problems, reviewed the li terature, and used the date mining algorithms to make customer segmentation. It elaborated the use and importance of customer segmentation, introduced the date mining algorithms and ways of customer segmentation, selected population characteristics and behavior characteristics, using kmean algorithm and hierarchical clustering methods for date mining to do customer segmen IV tation, changed the results of customer clustering and variable clustering into useful tactics about customer segmentation and marketing, and give decision support for banks at last. Keywords: Customer Segmentation; Date Mining; Cluster Analysi 1 1 前言 問題的由來 隨著改革開放以來中國經濟的迅速發(fā)展和騰飛,信息技術快速興起的和金融行業(yè)的蓬勃發(fā)展,我國的金融行業(yè)特別是銀行業(yè)面臨著巨大的機遇和挑戰(zhàn)。通過聚類分析和決策樹分析能快速的為銀行進行客戶分類,并針對每一客戶群體實施具體的客戶關系管理策略和市場營銷策略。 2 我國商業(yè)銀行對客戶資源沒有細分,沒有相應的客戶定位,對所有客戶都一視同仁。 在商業(yè)智能的幫助下,花旗銀行可以按照客戶為銀行創(chuàng)造盈利的多少和盈利潛在可能性的大小將自己的客戶進行分類,進而根據(jù)不同客戶以往的消費習慣,預測其未來的消費傾向,并結合外部經濟、人口統(tǒng)計等相關數(shù)據(jù)預測未來的市場發(fā)展趨勢。 本文創(chuàng)新點: 利用 Kmean 算法和層次聚類分析方法,分別對客戶進行細分和客戶屬性進行聚類, 不僅能得到客戶的聚類結果,并且能得到客戶屬性特征的聚類結果,提出典型客戶特征,為客戶細分提供了更加有效的方法和結果,為客戶細分的客戶特征的選取提供了參考。通過與客戶的多種渠道的交互,可以高效、快速、準確地完成對客戶的反饋,同時可降低服務的成本; ( 2)對潛在客戶的挖掘。 Schiffman按照地理、人口、心理、社會文化、使用情境、利益以及混合細分變量進行歸納??蛻絷P系管理是一種旨在改善企業(yè)與客戶之間關系的新型運作機制,它實施于企業(yè)的市場營銷、銷售、服務與技術支持等與客戶有關的領域。 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘的概述 所謂數(shù)據(jù)挖掘,是從海量的數(shù)據(jù)中,抽取出潛在的、有價值的知識 (模型或規(guī)則 )的過程??梢赃@樣概括: (1)指從數(shù)據(jù)(大型數(shù)據(jù)庫或數(shù)據(jù)倉庫)中提取隱含的、未知的、非平凡的及有潛在應用價值的信息或模式的高級處理過程; (2)模式:即知識,它給出了數(shù)據(jù)特性或數(shù)據(jù)之間的關系,是對數(shù)據(jù)所包含的信息更抽象的描述; (3)是一個過程,它利用一種或多種計算機學習技術,從數(shù)據(jù)庫中的數(shù)據(jù)自動分析并提取知識,目的是確定數(shù)據(jù)的確趨勢和模式。 (Affinity grouping or Association Rules) 關聯(lián)規(guī)則是尋找數(shù)據(jù)庫中值的相關性,主要是尋找在同一個事件中出現(xiàn)的不同項的相關性,比如在一次購買活動中所買不同商品的相關性。 6 數(shù)據(jù)挖掘在客戶關系管理中的應用途徑 ( 1)客戶的獲取。商家與其客戶之間的商業(yè)關系是一種持續(xù)的不斷發(fā)展的關系,通過不斷地相互接觸和交流,客戶得到了更好更貼切的服務質量,商家則因為增加了銷售量而獲利。 ( 5)性能評估。 ( 3)數(shù)據(jù)轉換:將“干凈”數(shù)據(jù)轉換成數(shù)據(jù)挖掘算法所需要的格式。 基本經濟信息包括:健康狀況、供養(yǎng)人口、月收入、月供額、住宅狀況、住宅入住時間、現(xiàn)住房建筑面積、現(xiàn)住房性質、納稅號、社會保險號、深市股東代碼、滬市股東代碼、證券保證金帳號、持卡數(shù)量、擔保數(shù)量等。資信屬性數(shù)據(jù),主要是描述個人客戶的信用情況,不僅包括在本銀行的數(shù)據(jù),還包括在其他銀行以及社會其他地方的信用信息,如:本銀行的黑名單信息、中國人民銀行的黑名單信息、上海聯(lián)合征信系統(tǒng)的信息等。為達到客戶細分的目的,依據(jù)客戶細分的要求和特點,本文采用聚類分析的方法進行數(shù)據(jù)挖掘。對于已經給出的數(shù)據(jù),沒有先驗知識的前提下自動進行分類。絕大多數(shù)層次聚類方法屬于這一類。 ( 4)軟件輸出聚類結果的文檔。 過程與對個案分群一樣,只是在分群選擇為“變量”這一個選項上不同。 5 個變量平行比較, x1,x5 變量的聚類中心差異相對較小, x2,x3,x4,特別是 x3 變量的聚類中心差異較大,區(qū)別最為明顯。然后依次是“年齡”,“性別”,“信用”,“購買方式” 。所以面對具體的銀行客戶細分問題,還必須結合實際情況進行討論。 感謝一直以來關心我學習、研究和發(fā)展的所有老師、同學、朋友。初始中心間的最小距離為 。 感謝我的論文指導老師 ***老 師,在論文的寫作過程中,從論文的選題、開題、撰寫以及論文的修改斟酌方面始終給予我精心的指導,論文的研究工作才得以順利完成。 然而,我們也應當認識到聚類分析可以為客戶細分提供支持,但這種細分并不等同于商業(yè)領域的細分,因為純粹的使用方法可能還起不到很好推動企業(yè)的作用,還需要結合對特定行業(yè)深刻的商業(yè)理解。確定年收入為最典型的聚類變量,另外四個按典型程度遞減分別為:年齡,性別,信用,購買方式。 挖掘結果轉換 Kmean 算法最終聚類中心(表 6)和每個聚類中的案例數(shù) (表 4)的結果顯示,若把這 20 個客戶分成 3 類。 ( 3) 在系統(tǒng)聚類分析的選項框中,將 x1,x2,x3,x4,x5 拖入變量區(qū)域,”并將