freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

cart算法對航空公司客戶流失的應(yīng)用(編輯修改稿)

2025-04-15 00:24 本頁面
 

【文章內(nèi)容簡介】 ,所以需要對數(shù)據(jù)進(jìn)行離散化()。 客戶流失分析一般是針對老客戶而言,這里定義飛行次數(shù)FIGHT_COUNT大于6次的客戶為老客戶。由于客戶類型MEMBER_TYPE是由第二年飛行次數(shù)以及第一年飛行次數(shù)的比例確定的,則第一年飛行次數(shù)等于0的記錄不滿足分母不為零的條件。發(fā)現(xiàn)數(shù)據(jù)中存在缺失值,原始數(shù)據(jù)中存在票價為空值,最小票價為0,最小票價折扣率為0,總飛行公里數(shù)大于0的情況。由于原始數(shù)據(jù)量很大,這類數(shù)據(jù)占比比較小,對于問題的分析影響很小,所以對這些記錄直接刪除,即刪除票價為空的記錄;刪除票價是0、平均折扣率是0、總公里數(shù)大于0的數(shù)據(jù)。經(jīng)過數(shù)據(jù)的簡單處理后,剩余數(shù)據(jù)是31,272條記錄。,選取客戶的關(guān)鍵屬性。即需要選取與MEMBER_TYPE相關(guān)性比較強(qiáng)的變量,計算不同的變量與MEMBER_TYPE的相關(guān)性。對原始數(shù)據(jù)集中數(shù)值型變量,通過雙變量Pearson相關(guān)性檢驗(yàn)來說明變量間的相關(guān)性。從44個屬性中選取相關(guān)性比較高的20個屬性(),如表4所示。其他屬性對MEMBER_TYPE的影響很小,可以忽略不計,因此直接剔除?!昂线m的”格式,以便適應(yīng)數(shù)據(jù)挖掘的需要。這里采用的是屬性構(gòu)造以及數(shù)據(jù)離散化,采用聚類算法的方式將除了客戶級別、客戶類型的其他屬性分成3類。,通過原始數(shù)據(jù)計算以下指標(biāo)。5)綜上,最終確定的數(shù)據(jù)屬性個數(shù)為12,第13列為標(biāo)簽列。,每個屬性(除了客戶級別)分成3類,其離散表如表5所示。,數(shù)據(jù)正負(fù)樣本比例并非一定是相同或等比的才是樣本平衡。這里最終得到的數(shù)據(jù)一共31272條記錄,標(biāo)記為0的數(shù)據(jù)未流失客戶為17396,標(biāo)記為1的數(shù)據(jù)準(zhǔn)流失客戶是7252,標(biāo)記為2的數(shù)據(jù)已流失客戶是6624,樣本比例大致是:∶1∶1,決策樹正負(fù)樣本比例最佳時1∶[9]接近數(shù)據(jù)樣本最佳比例,所以直接用數(shù)據(jù)進(jìn)行訓(xùn)練以及測試。 4模型的建立以及實(shí)現(xiàn) 混淆矩陣是表示真實(shí)屬性與識別結(jié)果類型之間關(guān)系
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1