freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘在移動通信決策支持系統(tǒng)中的應用-資料下載頁

2025-06-22 14:17本頁面
  

【正文】 e a n s 聚類算法總結歸納不同客戶群的流失特征,最后針對不同客戶的流失特征,制定挽留計劃4 .1數(shù)據(jù)預處理 數(shù)據(jù)預處理是對生產(chǎn)系統(tǒng)的數(shù)據(jù)進行數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換,它是數(shù)據(jù)挖掘中花費時間 最長的過程,并需對行業(yè)領域知識有較深的理解。數(shù)據(jù)預處理可使用成熟 的 E T L 工具 , 如 P o w e r ma r t,也可使用開發(fā)工具定制開發(fā)預處理程序。E T L工具通常應用于企業(yè)數(shù)據(jù)倉庫的建立,這兩種方法實際上無太大區(qū)別,文章采用 C l e m e n t i n e 直接對數(shù)據(jù)進行抽取、 轉(zhuǎn)換、 裝載。形成的客戶屬性表通常都會包含以下信息: 用戶基本屬性信息, 即人口統(tǒng)計學數(shù)據(jù) ,如年齡 、性別等,以及其他數(shù)據(jù) ,如在網(wǎng)時長、付款方式、套餐等;通話行為數(shù)據(jù),即通話次數(shù)、通話計費、賬單數(shù)據(jù)。 同ETL工具處理后,8000條記錄產(chǎn)生了50個字段。 客戶流失預測模型的建立 通過關聯(lián)度分析之后,文章選取了13個與客戶流失有密切關系的字段作為預測的輸入字段。他們分別是:年齡、在網(wǎng)時間、本地通話時間、撥打異地移動電話費、撥打本地移動電話費、短信息費、本地白天通話時間、本地夜晚通話時間、短信此時、國內(nèi)話費、國際化肥、本地話費、用戶狀態(tài)。是用戶流失預測模型中的目標字段,取值1或者0,1代表離網(wǎng),0待變在網(wǎng)。其他字段作為預測字段,通過歸納分析他們的特征來預測用戶是否離網(wǎng)。模型評估是對建立的客戶離網(wǎng)預測模型進行評價并改進。對于離網(wǎng)模型的評估有多種指標,這里主要采用正確率指標,借助Clementine中的Analysis節(jié)點來對上述離網(wǎng)模型評估。預測正確率=正確預測個數(shù)/測試樣本數(shù)X100%。將在數(shù)據(jù)抽樣階段分離出的檢驗數(shù)據(jù)集輸入該客戶流失預測模型中,借助 Analysis 節(jié)點, 分析該模 型的準確率。 該 C 5. 0模型得出的檢驗結果的正確率高達 9 9 1 %, 具有很高的預測準確性。因此這里無需對該模型進行進一步的優(yōu)化。 參考文獻[1] Jiawei HAN Micheline Kamber. Data Mining Concepts and Techniques,Second 。2006[2]
點擊復制文檔內(nèi)容
醫(yī)療健康相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1