freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

數據挖掘系統(tǒng)的設計與實現(xiàn)畢業(yè)論文(編輯修改稿)

2025-07-25 13:56 本頁面
 

【文章內容簡介】 交叉銷售等市場分析行為,以及客戶流失性分析、客戶信用評分、欺詐發(fā)現(xiàn)等等。數據挖掘技術在企業(yè)市場營銷中得到了比較普遍的應用,它是以市場營銷學的市場細分原理為基礎,其基本假定是@消費者過去的行為是其今后消費傾向的最好說明。通過收集、加工和處理涉及消費者消費行為的大量信息,確定特定消費群體或個體的興趣、消費習慣、消費傾向和消費需求,進而推斷出相應消費群體或個體下一步的消費行為,然后以此為基礎,對所識別出來的消費群體進行特定內容的定向營銷,這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而為企業(yè)帶來更多的利潤。商業(yè)消費信息來自市場中的各種渠道。例如:每當我們用信用卡消費時,商業(yè)企業(yè)就可以在信用卡結算過程中收集商業(yè)消費信息,記錄下我們進行消費的時間、地點、感興趣的商品或服務、愿意接收的價格水平和支付能力等數據;當我們在申辦信用卡、辦理汽車駕駛執(zhí)照、填寫商品保修單等其他需要填寫表格的場合時,我們的個人信息就存入了相應的業(yè)務數據庫;企業(yè)除了自行收集相關業(yè)務信息之外,甚至可以從其他公司或機構購買此類信息為自己所用。這些來自各種渠道的數據信息被組合,應用超級計算機、并行處理、神經元網絡、模型化算法和其他信息處理技術手段進行處理,從中得到商家用于向特定消費群體或個體進行定向營銷的決策信息。這種數據信息是如何應用的呢?舉一個簡單的例子,當銀行通過對業(yè)務數據進行挖掘后,發(fā)現(xiàn)一個銀行帳戶持有者突然要求申請雙人聯(lián)合帳戶時,并且確認該消費者是第一次申請聯(lián)合帳戶,銀行會推斷該用戶可能要結婚了,它就會向該用戶定向推銷用于購買房屋、支付子女學費等長期投資業(yè)務,銀行甚至可能將該信息賣給專營婚慶商品和服務的公司。數據挖掘構筑競爭優(yōu)勢。在市場經濟比較發(fā)達的國家和地區(qū),許多公司都開始在原有信息系統(tǒng)的基礎上通過數據挖掘對業(yè)務信息進行深加工,以構筑自己的競爭優(yōu)勢,擴大自己的營業(yè)額。美國運通公司有一個用于記錄信用卡業(yè)務的數據庫,數據量達到54億字符,并仍在隨著業(yè)務進展不斷更新。運通公司通過對這些數據進行挖掘,制定了“關聯(lián)結算優(yōu)惠”的促銷策略,即如果一個顧客在一個商店用運通卡購買一套時裝,那么在同一個商店再買一雙鞋,就可以得到比較大的折扣,這樣既可以增加商店的銷售量,也可以增加運通卡在該商店的使用率。再如,居住在倫敦的持卡消費者如果最近剛剛乘英國航空公司的航班去過巴黎,那么他可能會得到一個周末前往紐約的機票打折優(yōu)惠卡?;跀祿诰虻臓I銷,常??梢韵蛳M者發(fā)出與其以前的消費行為相關的推銷材料??ǚ蚴称饭窘⒘艘粋€擁有3000萬客戶資料的數據庫,數據庫是通過收集對公司發(fā)出的優(yōu)惠券等其他促銷手段作出積極反應的客戶和銷售記錄而建立起來的,卡夫公司通過數據挖掘了解特定客戶的興趣和口味,并以此為基礎向他們發(fā)送特定產品的優(yōu)惠券,并為他們推薦符合客戶口味和健康狀況的卡夫產品食譜。美國的讀者文摘出版公司運行著一個積累了40年的業(yè)務數據庫,其中容納有遍布全球的一億多個訂戶的資料,數據庫每天24小時連續(xù)運行,保證數據不斷得到實時的更新,正是基于對客戶資料數據庫進行數據挖掘的優(yōu)勢,使讀者文摘出版公司能夠從通俗雜志擴展到專業(yè)雜志、書刊和聲像制品的出版和發(fā)行業(yè)務,極大地擴展了自己的業(yè)務。數據挖掘系統(tǒng)的其它應用還有:? 在對客戶進行分析方面:銀行信用卡和保險行業(yè),利用數據挖掘將市場分成有意義的群組和部門,從而協(xié)助市場經理和業(yè)務執(zhí)行人員更好地集中于有促進作用的活動和設計新的市場運動。? 在客戶關系管理方面:數據挖掘能找出產品使用模式或協(xié)助了解客戶行為,從而可以改進通道管理。又如正確時間銷售就是基于顧客生活周期模型來實施的。? 在零售業(yè)方面:數據挖掘用于顧客購貨籃的分析可以協(xié)助貨架布置,促銷活動時間,促銷商品組合以及了解滯銷和暢銷商品狀況等商業(yè)活動。通過對一種廠家商品在各連鎖店的市場共享分析,客戶統(tǒng)計以及歷史狀況的分析,可以確定銷售和廣告業(yè)務的有效性。? 在產品質量保證方面:數據挖掘協(xié)助管理大數量變量之間的相互作用,并能自動發(fā)現(xiàn)出某些不正常的數據分布,揭示制造和裝配操作過程中變化情況和各種因素,從而協(xié)助質量工程師很快地注意到問題發(fā)生范圍和采取改正措施。? 在遠程通訊方面:基于數據挖掘的分析協(xié)助組織策略變更以適應外部世界的變化,確定市場變化模式以指導銷售計劃。在網絡容量利用方面,數據挖掘能提供對客戶聚集服務使用的結構和模式的了解,從而指導容量計劃人員對網絡設施作出最佳投資決策。? 在各個企事業(yè)部門,數據挖掘在假偽檢測及險災評估、失誤回避、資源分配、市場銷售預測廣告投資等很多方面,起著很重要作用。例如在化學及制藥行業(yè),將數據挖掘用于巨量生物信息可以發(fā)現(xiàn)新的有用化學成分;在遙感領域針對每天從衛(wèi)星上及其它方面來的巨額數據,對氣象預報、臭氧層監(jiān)測等能起很大作用。上個世紀九十年代開始出現(xiàn)數據挖掘商用軟件以來,據不完全統(tǒng)計,到_1998 年底1999年初,已達50多個廠商從事數據挖掘系統(tǒng)的軟件開發(fā)工作,在美國數據挖掘產品市場在1994年約為5千萬美元,1997年達到5億美元。2001年將達到10億美元。從產品的類型來看,通常有以下五類產品:? 能夠提供廣泛的數據挖掘能力,典型產品有:IBM公司的Intelligent Miner;SAS公司的Enterprise Miner。? 旨在為某個部門求解問題,典型的有:Unica公司的Response Modeler Segment;IBM公司的Business Application等。? 與提供服務聯(lián)系在一起的,典型的有:NeoVista、Hyperparallel、HNC Marksman。? 黑匣工具,典型的有:GroupModel、ModelMax、Predict。? 解決客戶問題,典型的有:MarketierParegram、ExchemgeApplication等。數據挖掘(知識發(fā)現(xiàn))的目的就是為企業(yè)決策提供的正確依據,從分析數據發(fā)現(xiàn)問題作出決策采取行動這一系列操作是一個單位的動作行為,利用計算機及信息技術完成這整體行動,是發(fā)揮機構活力和贏得競爭優(yōu)勢的唯一手段。因此人們將這種機構行為和手段稱這為“事務智能”(Business Intelligent,簡稱BI),BI能極大地改進決策的質量和及時性,從而改進機構的生產率或發(fā)揮競爭優(yōu)勢。所以近年來,一些大公司將數據分析和數據挖掘工具及其有關技術組合起來形成所謂BIS(Business Intelligent Softwave)。其中SAS公司的的Enterprise Minter就是將數據源、數據預處理、數據存貯、數據分析與發(fā)掘、信息表示與應用等方面技術有機形成一個復雜數據挖掘系統(tǒng)有機整體。IBM 公司更全面地考慮BI系統(tǒng)的結構和功能,與其它公司共同合作來開發(fā)BI各類軟件和工具。并從多方面來加以考慮:首先必須有一良好的數據庫和數據倉庫,并能使企業(yè)管理與決策機制能夠過渡到下一個時期,所以提出了一個統(tǒng)一的數據庫系統(tǒng)DB2和一個可視化數據倉庫VDW(Visual Data Warehouse),可以將各種應用和各部門的信息融為一體,加上Visual Warehouse OLAP工具可以生成實時報告在信息發(fā)現(xiàn)和數據發(fā)掘工具方面,提出能對結構型和非結構型數據進行發(fā)掘的一整套智能工具(Intelligent Miner Family)。BI手段只有在好的數據基礎上才能見效,因此提出數據重組工具。由于向用戶提供聯(lián)合統(tǒng)一觀點的企業(yè)數據是作出聰明決策的前提,又提出能支持異形數據庫的DataJointer(數據接合)。BI 系統(tǒng)標志著從數據到知識到決策的進程中的更深入的一步,展示著真正的實用的智能信息系統(tǒng)的雛形。有關數據挖掘研究的若干重點問題描述如下:(1)挖掘方法與用戶交互問題。這其中涉及所挖掘知識的類型,挖掘多細度的知識,領域知識的利用,定制挖掘和知識挖掘的可視化。? 從數據庫挖掘不同類型的知識。由于不同的應用需要不同類型的知識,因此數據挖掘應該覆蓋廣泛的數據分析與知識發(fā)現(xiàn)任務需求。這其中包括:數據概念描述、對比概念描述、關聯(lián)知識、分類知識、聚類分析、趨勢和偏差分析,以及相似性分析。這些挖掘任務可以是對同一個數據庫進行不同的操作。因此需要設計開發(fā)大量的數據挖掘技術。? 基于多層抽象水平的交互挖掘。由于無法準確了解從一個數據庫中究竟能夠發(fā)現(xiàn)什么。因此一個數據挖掘過程應該是交互的。鑒于數據庫中包含大量的數據,首先需要利用合適的采樣技術來幫助實現(xiàn)交互式數據挖掘的探索。交互數據挖掘能夠讓用戶參與并指導對(要挖掘)模式的搜索,或幫助讓用戶精煉所返回的挖掘結果。與數據倉庫OLAP交互模式類似,用戶也可以與數據挖掘系統(tǒng)進行交互來幫助進行更有效地數據挖掘,以便能從多個不同角度發(fā)現(xiàn)多個抽象層次(細度)的模式知識。? 數據挖掘查詢語言與定制數據挖掘。關系(數據庫)查詢語言,如:SQL語言,能夠幫助用戶提出各種有針對性的數據檢索要求。同樣開發(fā)高水平的數據挖掘查詢語言以幫助用戶描述特定的挖掘任務(包括描述其中的數據特征)、描述挖掘任務所涉及的領域知識、挖掘結果的模式知識類型,以及對挖掘結果有趣性等約束條件。這樣一種語言還應該與數據庫或數據倉庫查詢語言集成在一起,并為實現(xiàn)有效靈活的數據挖掘而進行集成優(yōu)化。? 數據挖掘結果表達與可視化。數據挖掘應該能夠用高水平語言、可視化表示、或其它表示方式來描述所挖掘出的知識,以使用戶更加容易地理解和應用所挖掘出的知識。數據挖掘結果的可視化表示,對于交互式數據挖掘系統(tǒng)而言是非常重要的,同時也要求系統(tǒng)采用多種表示形式,如:樹、表格、規(guī)則、圖、示意圖、矩陣、曲線來描述所數據挖掘結果。? 處理有噪聲或不完整的數據。數據庫中的數據或許反映有噪聲、不完整、以外的數據對象。因此當挖掘數據規(guī)律時,這些對象或許會使挖掘過程迷失方向以致挖掘出一個不符合實際情況的模型。這時就需要數據清洗和數據分析方法以處理這些有噪聲的數據;有時也需要異類挖掘方法以幫助實現(xiàn)意外情況的挖掘與處理。? 模式評估:有趣性問題。一個數據挖掘系統(tǒng)能夠發(fā)現(xiàn)數以千計的模式,而用戶常常只對其中的一小部分模式感興趣;其它大多數都屬于常識性或缺乏新意的知識。如何對所挖掘出模式的趣味性進行評估,特別是如何基于用戶信念和期待對所挖掘模式進行主觀評估,仍然是一個尚待進一步研究的問題。如何利用趣味性來指導挖掘過程以有效減少搜索空間,也是尚待進一步研究的問題。(2)性能問題。這其中包括:效率、可擴展性和數據挖掘算法的并行化等問題。? 數據挖掘算法的效率與可擴展性。為了能夠有效地從數據庫大量的數據中抽取模式知識,數據挖掘算法就必須是高效的和可擴展的。算法的可擴展性表現(xiàn)在它的(數據挖掘)運行時間與所處理的數據規(guī)模呈線性關系,假設挖掘系統(tǒng)可利用的其它資源不變的情況下(如:內存和硬盤空間等);這也就意味著當被挖掘數據的規(guī)模確定后,相應數據挖掘算法的運行時間是可以預測的,當然也是可以接受的。從數據庫角度來要求知識發(fā)現(xiàn)算法,效率和可擴展性也是構造數據挖掘系統(tǒng)的一個關鍵問題。前面所介紹的數據挖掘方法與用戶交互中的許多問題也涉及到效率與可擴展性的問題。? 并行、分布和增量更新算法。許多數據庫中數據的巨大規(guī)模、廣泛分布的數據(存儲)地點,以及一些數據挖掘算法的計算復雜性等,都極大地推動了并行分布數據挖掘算法的研究與開發(fā)。這類算法將數據分為若干份進行并行處理,然后將處理獲得的結果合并在一起。此外一些數據挖掘過程所涉及的高昂代價也促使了增量數據挖掘算法的發(fā)展,這類增量挖掘算法無需每次(挖掘時)均對整個數據庫進行挖掘而只需對數據庫中的增量數據進行挖掘即可。當然增量挖掘算法需要對之前所挖掘獲得的模式知識進行增量式修改與完善。(3)數據庫類型多樣化所涉及的問題。? 關系和復雜類型數據的處理。數據庫與數據倉庫的類型有許多種,期望一個數據挖掘系統(tǒng)能夠對所有類型的數據都能夠很好地完成挖掘任務是不現(xiàn)實的。鑒于關系數據庫與數據倉庫應用較廣,研究設計高效有效地挖掘這類數據的數據挖掘系統(tǒng)是必要的。然而其它數據庫包含復雜數據對象,如:超文本、多媒體數據、空間數據、時間數據,或交易數據,顯然一個數據挖掘系統(tǒng)不可能滿足挖掘不同數據類型并完成不同挖掘任務的要求。因此需要根據特定的挖掘數據,構造相應的數據挖掘系統(tǒng)。? 異構數據庫和全球信息系統(tǒng)的信息挖掘。本地和廣域計算機網絡系統(tǒng)(如:互聯(lián)網)將許多數據源連接在一起,從而構成了一個巨大的、分布的、異構的數據庫。如何從來自不同數據源(具有不同數據語義),這其中包括:結構化數據、半結構數據和無結構數據,挖掘出所需要的模式知識是數據挖掘研究所面臨巨大挑戰(zhàn)。數據挖掘或許能夠幫助從多個異構數據庫中挖掘高層次的數據規(guī)律,而這些數據規(guī)律是無法通過簡單查詢系統(tǒng)就可獲得的,由此甚至還可以幫助改善信息交換和異構數據庫之間的互操作性。這里對以下幾個方面的內容作了概要的介紹與說明。這些方面內容包括:? 數據技術,它從基本的文件處理發(fā)展到具有查詢與事務處理能力的數據庫管理系統(tǒng)。來自各行各業(yè)應用,其中包括:商業(yè)與管理、行政管理、科學與工程和環(huán)境控制等所收集數據的爆炸性增長,更進一步地刺激了對有效數據分析和數據理解工具的需求。? 數據挖掘,它是一個從大量有噪聲、不完整數據中挖掘出有意義模式知識的過程。所挖掘的數據對象可以是數據庫或數據倉庫內容,也可以是其它數據源內容。數據挖掘是一個新興的多學科交叉領域,這其中主要涉及:數據庫系統(tǒng)、數據倉庫、統(tǒng)計學、機器學習、數據可視化、信息檢索和高性能計算等,其它學科還包括:人工神經網絡、模式識別、空間數據分析、圖像數據庫、信號處理和歸納邏輯編程。數據挖掘是一個包含多個處理步驟的知識發(fā)現(xiàn)過程,這其中主要包括:數據清洗、數據集成、數據選擇、數據轉換、數據挖掘、模式評估和知識表達輸出。? 數據倉庫,它是一個存放來自多個數據源并隨時間積累的數據容器,其目的就是為
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1