【正文】
1:如果客戶參加了信用卡保險,那么他就會參加壽險促銷(置信度= 3/ 3= 100%,支持度= 3/ 15= 20%) 規(guī)則 2:如果一個男性客戶沒有參加信用卡保險,那么他也不會參加壽險 促銷(置信度= 4/ 5= 80%,支持度=5/ 15= 33%) 規(guī)則 3:如果一個女性客戶沒有參加信用卡保險,那么她可能會參加壽險促銷(置信度= 5/ 7= 71%,支持度=7/ 15= 47%) 規(guī)則 4:如果是一個女性客戶,那么她可能會參加壽險促銷(置信度= 6/ 8= 75%,支持度= 8/ 15= 53%) 信用卡保險 Yes( 5/ 2) No( 4/ 1) No Yes 性 別 F M Yes( 3/ 0) 規(guī)則的生成 ●現(xiàn)代方法 —— 關聯(lián)規(guī)則( Association Rules) 最近鄰方法 規(guī)則:如果一個客戶處于 ● 的狀況,那么他可能是一個逃款者 關聯(lián)規(guī)則可以使用傳統(tǒng)的方法生成,但適當提供的屬性很多時,因為每條規(guī)則的結果可能包含大量的前提條件,使用傳統(tǒng)方法會變得不切實際。 規(guī)則的生成 ●現(xiàn)代方法 —— 關聯(lián)規(guī)則( Association Rules) apriori方法 apriori方法步驟: -值支持度要求 apriori方法是通過生成條目集,按照一定的準則要求從中選擇規(guī)則的方法。 條目集是指符合一定支持度要求的“屬性-值”的組合 規(guī)則的生成 ●現(xiàn)代方法 —— 關聯(lián)規(guī)則( Association Rules) 雜志促銷 手表促銷 壽險促銷 信用卡保險 性別 Y N N N M Y Y Y N F N N N N M Y Y Y Y M Y N Y N F N N N N F Y N Y Y M N Y N N M Y N N N M Y Y Y N M apriori方法 :例 -值支持度要求(> 30%) 單項集合 條目數(shù) 雜志促銷= Y 7 手表促銷= Y 4 手表促銷= N 6 壽險促銷= Y 5 壽險促銷= N 5 信用卡保險= N 8 性別= M 6 性別= F 4 單項條目集合 規(guī)則的生成 ●現(xiàn)代方法 —— 關聯(lián)規(guī)則( Association Rules) 雜志促銷 手表促銷 壽險促銷 信用卡保險 性別 Y N N N M Y Y Y N F N N N N M Y Y Y Y M Y N Y N F N N N N F Y N Y Y M N Y N N M Y N N N M Y Y Y N M apriori方法 :例 雙項條目集合 雙項集合 條目數(shù) 雜志促銷= Y&手表促銷= N 4 雜志促銷= Y&壽險促銷= Y 5 雜志促銷= Y&信用卡保險= N 5 雜志促銷= Y&性別= M 4 手表促銷= N&壽險促銷= N 4 手表促銷= N&信用卡保險= N 5 手表促銷= N&性別= M 4 壽險促銷= N&信用卡保險= N 5 壽險促銷= N&性別= M 4 新英卡保險= N& 性別= M 4 信用卡保險= N&性別= F 4 規(guī)則的生成 ●現(xiàn)代方法 —— 關聯(lián)規(guī)則( Association Rules) 雜志促銷 手表促銷 壽險促銷 信用卡保險 性別 Y N N N M Y Y Y N F N N N N M Y Y Y Y M Y N Y N F N N N N F Y N Y Y M N Y N N M Y N N N M Y Y Y N M apriori方法 :例 確定最小置信度(如> 50%),利用雙項條目集合生成規(guī)則 規(guī)則 1:如果雜志促銷= Y,那么壽險促銷= Y( 5/ 7) 置信度= 5/ 7= 71%,支持度= 7/ 10= 70% 規(guī)則 2:如果壽險促銷= Y,那么雜志促銷= Y( 5/ 5) 置信度= 5/ 5= 100%,支持度= 5/ 10= 50% 規(guī)則的生成 —— 關聯(lián)規(guī)則( Association Rules) 市場籃子分析就是一種關聯(lián)規(guī)則的表現(xiàn) 時間序列分析是一種反映客戶行為在時間上的關聯(lián)性的關聯(lián)規(guī)則 規(guī)則的應用 —— 關聯(lián)規(guī)則( Association Rules) —— 以前件為目標 —— 歸納所有前件一樣的規(guī)則 —— 分析后件的營銷效果 —— 設計促銷方案(完善前件) —— 例 —— 收集所有前件為文具、復讀機的規(guī)則,分析這些商品打折是否促進其他高利潤商品的銷售,從而調整商品結構、設計促銷方案 規(guī)則的應用 —— 關聯(lián)規(guī)則( Association Rules) —— 以后件為目標 —— 歸納所有后件一樣的規(guī)則 —— 分析什么因素與后件有關或對后件有影響 —— 設計前件促成后件 —— 例 —— 收集到所有后件為西裝的規(guī)則,可以幫助我們了解西裝的銷售受哪些因素的影響或與哪些因素相關,從而可以考慮將這些因素集合在一起而產生促銷效果。 規(guī)則的應用 —— 關聯(lián)規(guī)則( Association Rules) 置信度低 置信度高 支持度高 支持度低 規(guī)則的置信度和支持度 規(guī)則很少是正確的,但可以經常使用 規(guī)則很少是正確的,而且很少被使用 規(guī)則多數(shù)情況下是正確,但很少被使用 規(guī)則多數(shù)情況下是正確的,而且可以經常使用 —— 以置信度或支持度為目標 案例: Bell Atlantic公司 ? Bell Atlantic的數(shù)據(jù)挖掘系統(tǒng)非常成功,不僅為他們的業(yè)務開展帶來很大的方便,而且節(jié)省了許多開支。 Bell Atlantic的電話服務目前已經覆蓋了美國 14個州,擁有商業(yè)電話、住家電話帳戶近億個。 ? Bell Atlantic 數(shù)據(jù)挖掘系統(tǒng)的首要任務就是盡快地追收拖欠的電話費,同時盡量減少收債部門的成本。 案例: Bell Atlantic公司 ? 軟件系統(tǒng)的選擇非常重要。經過反復挑選后, Bell Atlantic采用了 SAS統(tǒng)計軟件系統(tǒng)建立數(shù)據(jù)挖掘系統(tǒng),然后在 SAS環(huán)境中利用 SAS宏程序建立挖掘系統(tǒng)。 ? 然后是建立 SAS格式庫。許多數(shù)據(jù)需要格式化,比如年齡,可以從 20到 100歲,需要分成不同的組,這都需要利用模式來進行數(shù)據(jù)轉換。有的數(shù)據(jù)不是連續(xù)變量,比如婚姻狀況 (單身 /已婚 ),也需要進行一些變換才可以進行計算。日期也是需要模式化的,不同計算機系統(tǒng)記錄日期方法不同,需要把日期轉換成一致的方法。在金融保險行業(yè)日期這個變量非常重要,因為很多客戶的行為都記錄在日期里面了。電話公司里記帳、付款的日期也非常重要。