【正文】
理前:如表 23 所示 表 23 原始數(shù)據(jù) Chart 23 the Origin Data 數(shù)據(jù)在 SQL Sever 中進(jìn)行處理以后:如表 24 所示 表 24 處理后的數(shù)據(jù) Chart 24 the Final Data 學(xué)院理學(xué)學(xué)士論文 第二章 系統(tǒng)的需求分析 13 (3)對(duì)決策樹(shù)數(shù)據(jù)的進(jìn)行預(yù)處理。 同上,我們?cè)?SQL Sever 里用的數(shù)據(jù)類(lèi)型還是 varchar,但為了方便對(duì)關(guān)聯(lián)規(guī)則算法實(shí)行,還要對(duì)所需要的商品進(jìn)行符號(hào)替換。 數(shù)據(jù)處理前:如 21 所示。 由于婚否屬性只有兩個(gè)不同值,所以該屬性保留,并且不對(duì)其進(jìn)行概化。如年齡,它的概化閥值設(shè)為 20,所以小于 30 歲的,我們?cè)O(shè)為young,30~50 的為 middle,大于 50 的為 senior。 首先, Excel 表的數(shù)據(jù)轉(zhuǎn)換到 SOL Sever 中要考慮到數(shù)據(jù)類(lèi)型的選擇問(wèn)題,應(yīng)盡量選擇占物理空間較小的數(shù)據(jù)類(lèi)型,如在區(qū)域范圍內(nèi)用 varchar 替代 CString 類(lèi)型,因?yàn)?varchar 可以靈活的分配所要的空間,對(duì)于大規(guī)模數(shù) 據(jù)集來(lái)說(shuō)將會(huì)大大減少系統(tǒng)開(kāi)銷(xiāo)。 (2)數(shù)據(jù)抽樣就是進(jìn)行數(shù)據(jù)記錄之間的相關(guān)性分析,用少量的記錄的線(xiàn)性組合來(lái)表示大量的記錄。它主要有兩個(gè)途徑:屬 性選擇和數(shù)據(jù)抽樣,分別針對(duì)數(shù)據(jù)庫(kù)中的屬性和記錄。 (Data Transformation) 數(shù)據(jù)變換主要是找到數(shù)據(jù)的特征表示,用維變換或轉(zhuǎn)換方式減少有效變量的數(shù)目或找到數(shù)據(jù)的不變式,包括規(guī)格化、歸納、切換、旋轉(zhuǎn)和投影等操作。 (Data Cleaning) 數(shù)據(jù)清洗要去除原數(shù)據(jù)集中的噪聲數(shù)據(jù)和無(wú)關(guān)數(shù)據(jù),處理遺漏數(shù)據(jù)和清洗臟數(shù)據(jù),去除空白數(shù)據(jù)域和知識(shí)背景上的白噪聲 ,考慮時(shí)間順序和數(shù)據(jù)變化等。 數(shù)據(jù)預(yù)處理應(yīng)該包括以下幾個(gè)方面的功能: (Data Integration) 學(xué)院理學(xué)學(xué)士論文 第二章 系統(tǒng)的需求分析 10 數(shù)據(jù)集成主要是將多文件或多數(shù)據(jù)庫(kù)運(yùn)行環(huán)境中的異構(gòu)數(shù)據(jù)進(jìn)行合并處理,解決語(yǔ)義的模型性。另外,海量的實(shí)際數(shù)據(jù)中無(wú)意義的數(shù)據(jù)很多,嚴(yán)重影響了數(shù)據(jù)挖掘算法的執(zhí)行效率,而且由于其中的噪聲干擾還會(huì)造成無(wú)效的歸納,所以這就要求我們必須進(jìn)行數(shù)據(jù)預(yù)處理這一步。 對(duì)于數(shù)據(jù)挖掘中的算法對(duì)其處理的數(shù)據(jù)集合一般都有一定的要求,比如數(shù)據(jù)完整性好、數(shù)據(jù)的冗余性少、屬性之間的相關(guān)性小。 除了實(shí)現(xiàn)上述功能以外,客戶(hù)管理系統(tǒng)還應(yīng)該具有友好、簡(jiǎn)潔的界面,安全性要高,穩(wěn)定性要強(qiáng)。 (8)客戶(hù)流失分析:實(shí)現(xiàn)決策樹(shù)算法的應(yīng)用,用決策樹(shù)來(lái)判斷客戶(hù)的流失,分析流失的原因。 (6)判斷客戶(hù)價(jià)值:實(shí)現(xiàn)粗糙集算法的應(yīng)用,對(duì)一個(gè)客戶(hù)進(jìn)行價(jià)值判斷。 (4)發(fā)掘潛在客戶(hù)資料:可以對(duì)客戶(hù)與商品之間的關(guān)系進(jìn)行管理,對(duì)關(guān)聯(lián)規(guī)則算法中的表的數(shù)據(jù)而進(jìn)行增加或刪除的功能。 (2)客戶(hù)基本資料管理:可以對(duì)客戶(hù)進(jìn)行增加、修改、刪除、還可以進(jìn)行多種查詢(xún)功能。它通過(guò)數(shù)據(jù)對(duì)客戶(hù)群分析,運(yùn)用適者生存的原則,對(duì)客戶(hù)群進(jìn)行分類(lèi),將沒(méi)有效益的客戶(hù)群或低效益客戶(hù)群轉(zhuǎn)化為高效益客戶(hù)群,同時(shí)獎(jiǎng)勵(lì)和發(fā)展有效益的客戶(hù)群。在客戶(hù)關(guān)系管理系統(tǒng)中,我們所實(shí)現(xiàn)的對(duì)客戶(hù)優(yōu)化的問(wèn)題,也正是運(yùn)用了這種思想。 遺傳算法 自然界的生物體在遺傳、變異和選擇的相互作用下,優(yōu)勝劣汰,不斷地由低級(jí) 向高級(jí)進(jìn)化和發(fā)展。雖然這也很貴,但比起和一個(gè)全新的客戶(hù)簽約還是便宜了許多。比如說(shuō),在移動(dòng)電話(huà)行業(yè)中,吸引并使一個(gè)新客戶(hù)簽約的開(kāi)支估計(jì)為 300 美元或更多,這其中包括了硬件折舊和銷(xiāo)售費(fèi)用。交叉銷(xiāo)售是建立在“雙贏 ”原則的基礎(chǔ)之上的 , 客戶(hù)因得到更多、更好符合個(gè)性需求的服務(wù)而滿(mǎn)足 ,企業(yè)也因銷(xiāo)售 的 增長(zhǎng)而獲益。這就需要我們學(xué)院理學(xué)學(xué)士論文 第二章 系統(tǒng)的需求分析 8 要用關(guān)聯(lián)規(guī)則算法,來(lái)實(shí)現(xiàn)“交叉銷(xiāo)售”。它把數(shù)據(jù)集看作決策表,由用戶(hù)指定數(shù)據(jù)庫(kù)中某一個(gè)或多個(gè)屬性作為分類(lèi)的類(lèi)別,并對(duì)決策表進(jìn)行屬性約簡(jiǎn),根據(jù)這些屬性的不同取值,將數(shù)據(jù)庫(kù)中數(shù)據(jù) 分為不同的類(lèi)別,并對(duì)決策表進(jìn)行屬性約簡(jiǎn)和值約簡(jiǎn),刪除冗余的屬性和屬性值,在決策表中導(dǎo)出決策規(guī)則,從而從少量的客戶(hù)屬性資料數(shù)據(jù)判斷誰(shuí)是高價(jià)值客戶(hù),誰(shuí)是低價(jià)值客戶(hù),在決策過(guò)程中應(yīng)給予不同重視,那將給企業(yè)帶來(lái)了無(wú)限商機(jī)。這些數(shù)據(jù)是企業(yè)的財(cái)富,它如實(shí)地記錄著企業(yè)運(yùn)作的本質(zhì)狀況。在這里,我來(lái)介紹以下的幾種算法的需求分析。本系統(tǒng)由二大模塊組成 —— 客戶(hù)資料管理和客戶(hù)信息分析,其中客戶(hù)信息分析里引用了數(shù)據(jù)挖掘中的四個(gè)算法 —— 粗糙集、關(guān)聯(lián)規(guī)則、決策樹(shù)、遺傳算法。 系統(tǒng)需要解決的主要問(wèn)題 首先,該系統(tǒng)主要是面向管理級(jí)人員而開(kāi)發(fā)的,并且系統(tǒng)里的資料是企業(yè)客戶(hù)的重要信息,所以用戶(hù)者必須驗(yàn)證身份才能登入。 學(xué)院理學(xué)學(xué)士論文 第二章 系統(tǒng)的需求分析 7 第二章 系統(tǒng)需求分析 要實(shí)現(xiàn)一個(gè)軟件系統(tǒng),首先應(yīng)該進(jìn)行需求分析,這樣才能設(shè)計(jì)出的軟件滿(mǎn)足用戶(hù)的各項(xiàng)功能。 項(xiàng)目可行性研究報(bào)告 縱上所述,從開(kāi)發(fā)的語(yǔ)言、所要運(yùn)用的工具,到數(shù)據(jù)挖掘在客戶(hù)關(guān)系管理中應(yīng)用的價(jià)值,都具備了可以開(kāi)發(fā)本系統(tǒng)的要求。 經(jīng)濟(jì)可行性評(píng)估 由于采用 Visual C ++ 開(kāi)發(fā),用 VC+ODBC 連接數(shù)據(jù)庫(kù)的開(kāi)發(fā)方式盡可能地縮短開(kāi)發(fā)周期、節(jié)約系統(tǒng)的開(kāi)發(fā)費(fèi)用,適合大、中 型企業(yè),適合遠(yuǎn)程網(wǎng)絡(luò),特別適合小型企業(yè),操作簡(jiǎn)單、明朗,將會(huì)給它們帶來(lái)豐厚的利潤(rùn)。例如,在如何更好地為 現(xiàn)有的客戶(hù)提供服務(wù)方面,通過(guò)數(shù)據(jù)挖掘,能夠幫助企業(yè)確定現(xiàn)有的客戶(hù)的特點(diǎn),從而為客戶(hù)提供有針對(duì)性的服務(wù);如何開(kāi)拓企業(yè)新市場(chǎng),獲取新客戶(hù)方面,通過(guò)數(shù)據(jù)挖掘,可以發(fā)現(xiàn)購(gòu)買(mǎi)每一商品的客戶(hù)的特征,從而可以向那些具有這些特征卻沒(méi)有購(gòu)買(mǎi)的客戶(hù)推銷(xiāo)這個(gè)商品;如何挖掘現(xiàn)有客戶(hù)群的潛力,為企業(yè)提供更多價(jià)值方面,通過(guò)數(shù)據(jù)挖掘,可以分析各個(gè)客戶(hù)對(duì)企業(yè)帶來(lái)的贏利能力,找到那些“金牌客戶(hù)”后提供更加有針對(duì)性的服務(wù),同時(shí)也可以分析現(xiàn)有客戶(hù)的興趣,向他們推薦提供新的產(chǎn)品和服務(wù);在如何保持現(xiàn)有客戶(hù)群方面,通過(guò)數(shù)據(jù)挖掘,可以找到流失客戶(hù)的特征 ,以搶在那些具有相似特征的客戶(hù)還未學(xué)院理學(xué)學(xué)士論文 第一章 可行性研究報(bào)告 6 流失之前,就可以采取針對(duì)性的措施防止他們的流失;在預(yù)測(cè)公司未來(lái)發(fā)展方面,通過(guò)數(shù)據(jù)挖掘,可以預(yù)測(cè)客戶(hù)贏利能力的變化,幫助企業(yè)提前采取各種對(duì)應(yīng)的措施。以上都希望用客戶(hù)關(guān)系管理的方法來(lái)實(shí)現(xiàn)。企業(yè)要了解客戶(hù)的喜好 不僅包括產(chǎn)品,還包括樣式和服務(wù)的外觀。 所以我們要運(yùn) 用新的技術(shù),來(lái)改變單一的銷(xiāo)售模式,尋求最有利可圖的途徑建立和維持穩(wěn)定的客戶(hù)關(guān)系。 我們?yōu)槭裁葱枰蛻?hù)關(guān)系管理呢?因?yàn)榇蠹叶贾溃? (1)獲得一個(gè)新客戶(hù)比留住一個(gè)老客戶(hù)要花更多的錢(qián); (2)客戶(hù)離開(kāi)后再把他們吸引回來(lái)所花的錢(qián)要比他們一開(kāi)始就滿(mǎn)意所花的錢(qián)多得多; (3)將新的商品賣(mài)給老客戶(hù)要比賣(mài)給新客戶(hù)容易得多; (4)有些客戶(hù)比其他客戶(hù)更有利可圖。 客戶(hù)關(guān)系管理首先是一種商業(yè)策略,它貫穿于企業(yè)的各個(gè)部 門(mén)和經(jīng)營(yíng)環(huán)節(jié),其目的在于理解、預(yù)測(cè)和管理企業(yè)現(xiàn)有的或潛在的顧客。 CRM 要求以客戶(hù)為中心的商業(yè)哲學(xué)和企業(yè)文化來(lái)支持有效的營(yíng)銷(xiāo)、銷(xiāo)售以及客戶(hù)服務(wù)。用戶(hù)所要做的只是把信封寄出去,這是非常有效的方法。在實(shí)際應(yīng)用中,如何使用數(shù)據(jù)挖掘的輸出結(jié)果?最簡(jiǎn)單的辦法是把結(jié)果看作黑盒。 這就需要引進(jìn)客戶(hù)交互、情景。 我們必須所指出的問(wèn)題是: (1)數(shù)據(jù)挖掘的結(jié)果不同于其他數(shù)據(jù)驅(qū)動(dòng)的商業(yè)活動(dòng)。數(shù)據(jù)挖掘是企業(yè)同客戶(hù)打交道的一長(zhǎng)串步驟中的一個(gè)部分。 從商業(yè)角度來(lái)看,數(shù)據(jù)挖掘是一種新的信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)化、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。 通過(guò)使用 PL/pgSQL,應(yīng)用可以獲得可觀的性能提升 。 所有這些東西都會(huì)產(chǎn)生進(jìn)程間通訊,并且如果客戶(hù)端在另外一臺(tái)機(jī)器上甚至還會(huì)導(dǎo)致網(wǎng)絡(luò)開(kāi)銷(xiāo) 。 但是所有 SQL 語(yǔ)句都必須由數(shù)據(jù)庫(kù)服務(wù)器獨(dú)立地執(zhí)行 。 SQL是 Postgre SQL(和大多數(shù)其它關(guān)系型數(shù)據(jù)庫(kù) )用做查詢(xún)語(yǔ)言的語(yǔ)言 。 由于所有主要的關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)都支持 SQL 語(yǔ)言,用戶(hù)可將使用 SQL的技能從一個(gè) RDBMS 轉(zhuǎn)到另一個(gè)。 SQL 可用于所有用戶(hù)的 DB 活動(dòng)模型,包括系統(tǒng)管理員、數(shù)據(jù)庫(kù)管理員、 應(yīng)用程序員、決策 支持系統(tǒng)人員及許多其它類(lèi)型的終端用戶(hù)。所有 SQL 語(yǔ)句使用查詢(xún)優(yōu)化器,它是 RDBMS 的一部分,由它決定對(duì)指定數(shù)據(jù)存取的最快速度的手段。 SQL 不要求用戶(hù)指定對(duì)數(shù)據(jù)的存放方法。所有 SQL 語(yǔ)句接受集合作為輸入,返回集合作為輸出。 SQL 的優(yōu)點(diǎn) : SQL 是一個(gè)非過(guò)程化的語(yǔ)言,因?yàn)樗淮翁幚硪粋€(gè)記錄,對(duì)數(shù)據(jù)提供自動(dòng)導(dǎo)航。 SQL 語(yǔ)言結(jié)構(gòu)簡(jiǎn)潔,功能強(qiáng)大,簡(jiǎn)單易學(xué),所以自從 IBM 公司 1981 年推出以來(lái), SQL 語(yǔ)言,得到了廣泛的應(yīng)用。 迄今為止, Visual C ++ 可以說(shuō)是一個(gè)功能最強(qiáng)大和使用范圍最廣泛的軟件開(kāi)發(fā)工具。 MFC 主要具有下面的優(yōu)勢(shì): (1)MFC 提供了大量的類(lèi),把 Windows API 函數(shù)封裝在類(lèi)中。 Visual C ++ 程序調(diào)試器功能更強(qiáng)大,它提供了診 斷映射機(jī)制、無(wú)須要重編譯的調(diào)試、遠(yuǎn)程調(diào)試和實(shí)現(xiàn)調(diào)試等功能。 Visual C ++ 源代碼編輯器提供了自動(dòng)語(yǔ)句完成的功能,編輯輸入源程序時(shí),它自動(dòng)顯示當(dāng)前對(duì)象的成員變量和成員函數(shù),并指明函數(shù)的參數(shù)類(lèi)型。 利用 Visual C ++可以編制各種類(lèi)型的 Windows 應(yīng)用程序,從最簡(jiǎn)單的單文學(xué)院理學(xué)學(xué)士論文 第一章 可行性研究報(bào)告 2 檔和對(duì)話(huà)框程序到復(fù)雜的多文檔和組合界面程序。 Visual C ++ 的特點(diǎn): Visual C ++的源程序要求用 C ++語(yǔ)言編寫(xiě),它支持面向?qū)ο笤O(shè)計(jì)方法,并可以使用功能強(qiáng)大的軟件基 礎(chǔ)類(lèi)庫(kù) MFC(Microsoft foundation class),充分體現(xiàn)了Microsoft 公司的技術(shù)精華。 Visual C ++ 由許多組件組成,包括編輯器、編譯器、調(diào)試器、以及程序向?qū)?AppWizard、類(lèi)向?qū)?Class Wizard 等開(kāi)發(fā)工具。 VC ++ 編程語(yǔ)言的介紹 [2] Visual C ++ 是一個(gè)功能強(qiáng)大的可視化軟件開(kāi)發(fā)工具。整體設(shè)計(jì)工程遵循軟件工程的原理、技術(shù)和方法,經(jīng)過(guò)需求分析、總體設(shè)計(jì)、文檔和代碼的編制、模塊測(cè)試和系統(tǒng)實(shí)現(xiàn)幾個(gè)階段。 關(guān)鍵詞: 客戶(hù)關(guān)系管理 (CRM);數(shù)據(jù)挖掘 (Data Mining);界面設(shè)計(jì);數(shù)據(jù)庫(kù)設(shè)計(jì);數(shù)據(jù)處理 學(xué)院理學(xué)學(xué)士論文 ABSTRACT II ABSTRACT This text mainly discusses the application of data mining in the system of customer relationship management, which applies the related techniques of data mining (such as rough set, association rule, decision tree, geic algorithms, etc.), and bines the market management analysis and the CRM system’s development of sale business, and builds up the system of customer relationship management based on data mining—customer service, and makes part of functions e true. The techniques of data mining can be mainly applied in the field of customer relationship management: (1) Judge customers’ value through data mining, customer classification. (2)Find potential clients through data mining, and then carry out cross selling to improve the value of clients. (3)Analyze the drain of clients through data mining, to prevent the drain of potential clients. (4)