【正文】
目前,我國的網(wǎng)絡游戲業(yè)正處于蓬勃發(fā)展階段,綜合應用數(shù)據(jù)挖掘技術有利于運營商對玩家進行有效地客戶關系管理,并能夠幫助運營商在激烈的市場競爭中更好地盈利??偨Y(jié)數(shù)據(jù)挖掘技術及其應用是目前國際上的一個研究熱點,并在許多行業(yè)中得到了很好的應用。同時在挖掘地方數(shù)據(jù)時,可以控制概念提升,將“IP地址”范圍縮小到省,乃至市,以方便地方性質(zhì)客戶服務的決策。在知識基表歸納濃縮過程中,去掉冗余元組時,應將元組覆蓋度加到與其完全相同的覆蓋度上。經(jīng)過概念提升以后,宏元組被濃縮,可以被拆取轉(zhuǎn)換至多條規(guī)則,并增加一項“覆蓋度”來提供定量信息。比如:“周消費”中可以指定,小于50元為“低”,大于100元為“高”,50100元為“中”。概念提升后要注意清除冗余數(shù)據(jù)。比如“IP地址”,“常州”和“無錫”都屬于江蘇,那么都提升為江蘇,“浙江寧波”提升為“浙江”,減少差異數(shù)量。策略1:去掉沒有意義的屬性。現(xiàn)在我們通過對整個玩家數(shù)據(jù)庫進行粗糙集數(shù)據(jù)挖掘,以得到一些看不到的有效信息。事實上,神經(jīng)元預測值完全取決于聯(lián)結(jié)網(wǎng)絡的權值,輸出結(jié)果的正確率也取決于權值的判定。如圖():某玩家好友里有3名已被判斷為流失客戶,計算機根據(jù)函數(shù)公式得出判斷值(其實就是玩家好友流失程度),而通過大量歷史數(shù)據(jù)“學習”得出該項目權值(其實就是好友流失對玩家離開游戲的影響度)。利用神經(jīng)網(wǎng)絡型知識挖掘技術進行玩家流失預測我們可以利用神經(jīng)網(wǎng)絡挖掘技術來預測玩家流失的可能性。類別標記=“無效帳號”類別標記=“普通客戶”IFAND “高收入”=“N”類別標記=“潛在客戶”IF“高消費”=“N”AND 消費=“N” AND “長期在線”=“Y” THEN類別標記=“優(yōu)質(zhì)客戶”IF“高消費”=“N”AND 消費=“Y” AND “持續(xù)高消費”=“Y” THEN 由決策樹可以很容易地得到“IFTHEN”形式的分類規(guī)則:IF,S4,S2,S4,S2,S4,S2,S4,S2,S4,S2因此給定本分類所需信息增益為:由表()“類別標記”這一類別屬性,劃分為:優(yōu)質(zhì)客戶,消費客戶,潛在客戶,普通客戶和無效帳號5類。玩家消費情況(只有消費的玩家才會成為優(yōu)質(zhì)客戶)表()是對5種不同客戶(類別標記)及其判斷依據(jù)的解釋。玩家在線時間(長時間在線的玩家更容易成為優(yōu)質(zhì)客戶)3.玩家收入(高收入者更容易成為優(yōu)質(zhì)客戶)2.首先,我們要在游戲的玩家數(shù)據(jù)庫中找到我們需要的關鍵字,經(jīng)過篩選,以下三個關鍵字將被作為游戲玩家分類的依據(jù):1.用屬性劃分樣本集S后所得的信息增益值為式():熵值越小,子集劃分的純度越高。設Sij是子集Sj中類Ci的樣本數(shù)。},;其中,Sj包含S中這樣一些樣本,他們在A上具有值aj??梢钥闯?,系統(tǒng)總熵是屬于各個類的信息量的加權平均。設Si是類Ci中的樣本數(shù)。設S是s個數(shù)據(jù)樣本的集合。該屬性使得對結(jié)果劃分中的樣本分類所需的信息量最小,并反映劃分的最小隨機性或“不純性”。數(shù)據(jù)挖掘技術在網(wǎng)絡游戲CRM中的具體應用第一節(jié).利用決策樹歸納分類方法進行玩家分類一.信息增益的計算決策樹的核心問題是選擇最佳的劃分標準。線性回歸中,數(shù)據(jù)是用直線建模;多元回歸是線性回歸的擴展,涉及多個預測變量。對數(shù)據(jù)庫中的元組根據(jù)各個屬性不同的屬性值分成相應的子集,然后對條件屬性劃分的子集與結(jié)論屬性劃分的子集之間上下近似關系生成判定規(guī)則。然后對劃分后的每個組成部分確定其對某個概念的支持程度。可以通過模擬判斷,來不斷修正計算的“權值”來達到學習的目的,增加判斷的正確性。通常神經(jīng)網(wǎng)絡模型由三個層次組成:輸入層,中間層,輸出層。八.神經(jīng)網(wǎng)絡(Nerual Net)神經(jīng)網(wǎng)絡是指由大量神經(jīng)元互聯(lián)而成的網(wǎng)絡,類似于服務器互聯(lián)而成的因特網(wǎng)。它是以實例為基礎的歸納學習算法,通過對一組訓練數(shù)據(jù)的學習,構造出決策樹形式的只是表示,在決策樹的內(nèi)節(jié)點進行屬性值的比較并根據(jù)不同的屬性值判斷從該節(jié)點向下的分枝,從而在決策樹葉節(jié)點得到結(jié)論。樹的每個分支都是一個分類的問題,內(nèi)部節(jié)點表示在一個屬性上的測試,樹葉代表類或者分布。這種不完美但是可行的思想模式,可以使之運用到更廣的用戶群中。這種相異度是根據(jù)描述對象的屬性值來計算的,距離是經(jīng)常被采用的度量方法。五.聚集檢測將物理或者抽象對象的集合,分組成為由類似的對象組成的多個類的過程被成為聚類。主要思想是:根據(jù)適者生存的原則,形成由當前群體中最適合的規(guī)則組成新的群體,以及這些規(guī)則的后代。使用的三個問題是:尋找確定的歷史數(shù)據(jù);決定表示歷史數(shù)據(jù)的最有效方法;決定距離函數(shù)、聯(lián)合函數(shù)和鄰近的數(shù)量。關聯(lián)分析的目的是找出數(shù)據(jù)庫中隱含的關聯(lián)網(wǎng),有時并不知道數(shù)據(jù)庫中的關聯(lián)函數(shù),即使知道也是不確定的,因此關聯(lián)分析生成的規(guī)則帶有可信度。若兩個或者多個變量的取值之間存在某種規(guī)律性,就成為關聯(lián)。數(shù)據(jù)挖掘技術一.統(tǒng)計技術統(tǒng)計技術對數(shù)據(jù)集進行挖掘的主要思想是:統(tǒng)計的方法對給定的數(shù)據(jù)集合假定了一個分布或者概率的模型(比如一個正態(tài)分布),然后根據(jù)模型采用相應的方法進行挖掘。描述性挖掘任務刻畫數(shù)據(jù)庫中數(shù)據(jù)的一般特性。數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務中要尋找的模式類型。數(shù)據(jù)挖掘技術介紹第一節(jié) 這時就要分析客戶期望,找到客戶期望的下限,結(jié)合市場情況,來設定虛擬物品獎勵的發(fā)生幾率。比如:游戲中舉行個活動,發(fā)放多少虛擬物品作為獎勵,這需要經(jīng)過嚴格計算的。比如:線下活動及宣傳的地點安排,各種活動獎勵的物品內(nèi)容,點卡發(fā)放地點的比例安排,周邊產(chǎn)品的推出地點,客服中心的安排地點及針對方向等等。另外,由于網(wǎng)絡游戲虛擬物品現(xiàn)實價值越來越高,非法盜取帳號行為越發(fā)猖狂,因此玩家對帳號安全也越來越重視,注冊帳號時填寫真實資料的比例越來越高,這對玩家數(shù)據(jù)分析極為有利。所以監(jiān)視玩家數(shù)據(jù)動態(tài),比如上線時間變化,消費數(shù)量變化等,預測可能流失的玩家,及時做好與玩家的交流,有助于維護老客戶。三.客戶流失分析在競爭愈發(fā)激烈的游戲市場,即使是沒有任何消費的玩家也是運營商的一種資源,因為“優(yōu)質(zhì)客戶”是建立在比沒有消費的“普通客戶”更為“強大”的基礎上,才愿意投入資金玩游戲的,所以,只有大量的“普通客戶”的存在才能吸引“優(yōu)質(zhì)客戶”。2.建立自動反饋系統(tǒng)玩家的數(shù)量是龐大的,因此對客服所提出的問題也有大量是重復的,特別是新游戲,大量玩家的重復提問會導致本