freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

企業(yè)crm系統(tǒng)中決策樹算法的應(yīng)用-全文預(yù)覽

2025-07-19 11:51 上一頁面

下一頁面
  

【正文】 rmation gain。這種度量選擇具有最高信息增益的屬性作為當(dāng)前節(jié)點(diǎn)的分支屬性。決策樹的建立是決策樹分類的基礎(chǔ),以ID3算法為例說明建立決策樹的過程。首先觀察age屬性的每個(gè)樣本值的good、bad分布,分別計(jì)算每個(gè)分布的信息熵:當(dāng)age=30:s11=9 s21=2時(shí), I(s11,s21)= 當(dāng)age在 3150間:s12=8 s22=4時(shí),I(s12,s22)= 當(dāng)age=50:s13=1 s23=2時(shí),I(s13,s23)= 若按age劃分樣本,所需的信息熵為:E(age)== 類似的,可以得到:E(education)= =E(production)= =E(area)= 通過以上屬性,對(duì)當(dāng)前分支節(jié)點(diǎn)進(jìn)行相應(yīng)樣本集合劃分,從而獲得的信息增益分別為:Gain(age) = I(s1,s2) E(age) ==Gain(education) = I(s1,s2) E(education) ==Gain(production) = I(s1,s2) E(production) ==Gain(area) = I(s1,s2) E(area) ==Gain(equipment) = = educationHML從計(jì)算結(jié)果得到education屬性具有最高信息增益,因此education屬性成為決策樹根節(jié)點(diǎn)的測(cè)試屬性。4個(gè)屬性是客戶年齡段、文化程度、銷售地區(qū)、產(chǎn)品檔次,類別是銷售業(yè)績,分為好和差兩類。數(shù)據(jù)挖掘的成功在很大程度上取決于數(shù)據(jù)的數(shù)量和質(zhì)量。該算法從樹的根節(jié)點(diǎn)處的訓(xùn)練樣本開始,選擇一個(gè)屬性來區(qū)分樣本。 關(guān)鍵字:客戶關(guān)系管理;數(shù)據(jù)挖掘;分類算法決策樹分類是一種從無規(guī)則、無序的訓(xùn)練樣本集合中推理出決策樹表示形式的分類規(guī)則的方法。本文以某企業(yè)銷售業(yè)績?yōu)閷?duì)象,利用決策樹分類算法,得到支持決策,從而挖掘出理想客戶。ID3 算法是一種自頂向下的決策樹生成算法,是一種根據(jù)熵減理論選擇最優(yōu)的描述屬性的方法。這個(gè)算法遞歸地應(yīng)用于每個(gè)子節(jié)點(diǎn),直到一個(gè)節(jié)點(diǎn)上的所有樣本都分區(qū)到某個(gè)類中。在本文研究的企業(yè)數(shù)據(jù)中,是將客戶的年齡概化為“小于等于30”、“30到50之間”和“大于50”三個(gè)年齡段,分別代表青年、中年和老年客戶,將產(chǎn)品價(jià)格分為高、中、低三檔等,詳見表1,將企業(yè)CRM系統(tǒng)數(shù)據(jù)庫中銷售及客戶信息匯總為4個(gè)屬性2個(gè)類別。為了計(jì)算每個(gè)屬性的信息增益,先使用,所以初始信息熵為:I(s1,s2) = I(18,8)= 然后計(jì)算客戶年齡、文化程度、產(chǎn)品檔次和銷售區(qū)域4個(gè)屬性的熵。因?yàn)閍rea屬性的信息增益最大,所以把屬性area作為該分支的節(jié)點(diǎn),再向下分支, P2處理類似,最后得到的決策樹如下圖所示:productionhighlowgoodbad=303150goodageareaIⅡ3150=30badageproductionmediumhighbadgoode
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1