freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

unit8數(shù)據(jù)挖掘的概念(參考版)

2025-05-14 19:41本頁面
  

【正文】 3. 數(shù)據(jù)挖掘產(chǎn)生的內(nèi)容 (或知識 )包括廣義知識 、 關(guān)聯(lián)知識 、 分類知識 、 預(yù)測型知識 、 偏差型知識等 4. 挖掘的數(shù)據(jù)對象是多樣的 ,可以是關(guān)系數(shù)據(jù)庫 、 數(shù)據(jù)倉庫 、 高級數(shù)據(jù)庫 、 flat文件和 WWW等 5. 數(shù)據(jù)挖掘的常用技術(shù)包括人工神經(jīng)網(wǎng)絡(luò) 、 決策樹 、 遺傳算法 、 近鄰算法 、 規(guī)則推導等 本 講 主 要 目 標 。 62 學完本講后 , 你應(yīng)該能夠了解: 1. 數(shù)據(jù)挖掘是一門交叉學科 。目前市場上有一些類似的軟件,但大部分方法只是把文本移來移去,或簡單地計算一下某些詞匯的出現(xiàn)頻率,并沒有真正的分析功能。從這個例子可以看出,無論是在數(shù)據(jù)結(jié)構(gòu)還是在分析處理方法方面,文本數(shù)據(jù)挖掘和前面談到的數(shù)據(jù)挖掘相差很大。 61 數(shù)據(jù)挖掘的熱點和主要問題 3. 文本的數(shù)據(jù)挖掘( Textual mining) 人們很關(guān)心的另外一個話題是文本數(shù)據(jù)挖掘?,F(xiàn)在很多廠商正在致力于這方面的研究。 對于生物信息或基因的數(shù)據(jù)挖掘和通常的數(shù)據(jù)挖掘相比,無論在數(shù)據(jù)的復(fù)雜程度、數(shù)據(jù)量還有分析和建立模型的算法而言,都要復(fù)雜得多。 60 數(shù)據(jù)挖掘的熱點和主要問題 2. 生物信息或基因的數(shù)據(jù)挖掘 生物信息或基因數(shù)據(jù)挖掘則完全屬于另外一個領(lǐng)域,在商業(yè)上很難講有多大的價值,但對于人類卻受益非淺。因而對電子商務(wù)網(wǎng)站進行數(shù)據(jù)挖掘所做的主要工作是數(shù)據(jù)準備。 就分析和建立模型的技術(shù)和算法而言,網(wǎng)站的數(shù)據(jù)挖掘和原來的數(shù)據(jù)挖掘差別并不是特別大,很多方法和分析思想都可以運用。但有的時候,客戶對自己的背景信息十分珍重,不肯把這部分信息填寫在登記表上,這就會給數(shù)據(jù)分析和挖掘帶來不便。若想在競爭中生存進而獲勝,就要比您的競爭對手更了解客戶。網(wǎng)站的內(nèi)容和層次、用詞、標題、獎勵方案、服務(wù)等任何一個地方都有可能成為吸引客戶、同時也可能成為失去客戶的因素。要想有效益就必須吸引客戶,增加能帶來效益的客戶忠誠度。這類工具開采能力很強,但價格昂貴,并要花很長時間進行學習。該工具使用模糊概念和“ 最近 ” 搜索技術(shù)的數(shù)據(jù)查詢工具,它可以讓用戶指定目標,然后對數(shù)據(jù)庫進行搜索,找出接近目標的所有記錄,并對結(jié)果進行評估。這類工具的主要優(yōu)點是,規(guī)則和決策樹都是可讀的。 53 數(shù) 據(jù) 挖 掘 工 具 2. 基于規(guī)則和決策樹的工具 大部分數(shù)據(jù)挖掘工具采用規(guī)則發(fā)現(xiàn)或決策樹分類技術(shù)來發(fā)現(xiàn)數(shù)據(jù)模式和規(guī)則,其核心是某種歸納算法。其開采過程基本上是將數(shù)據(jù)聚類,然后分類計算權(quán)值。而現(xiàn)在這些技術(shù)已經(jīng)被直接集成到許多大型的工業(yè)標準的數(shù)據(jù)倉庫和聯(lián)機分析系統(tǒng)中去了。 ? 規(guī)則推導 從統(tǒng)計意義上對數(shù)據(jù)中的 “ 如果 那么 ” 規(guī)則進行尋找和推導。 ? 遺傳算法 基于進化理論,并采用遺傳結(jié)合、遺傳變異、以及自然選擇等設(shè)計方法的優(yōu)化技術(shù)。 43 所有模式都是 有用的嗎 ? 44 所有模式都是有用的嗎 ? ? 所有的模式都是有趣的嗎? ? 什么樣的模式是有趣的? ? 數(shù)據(jù)挖掘系統(tǒng)能產(chǎn)生所有有趣的模式嗎? ? 數(shù)據(jù)挖掘系統(tǒng)能僅產(chǎn)生有趣模式嗎? 45 數(shù)據(jù)挖掘系統(tǒng) 的分類 46 數(shù) 據(jù) 挖 掘 系 統(tǒng) 的 分 類 數(shù)據(jù)挖掘系統(tǒng)是一個多學科交叉融合領(lǐng)域 正由于源于多學科,數(shù)據(jù)挖掘研究產(chǎn)生了大量的、各種不同類型的數(shù)據(jù)挖掘系統(tǒng),按不同的標準,數(shù)據(jù)挖掘系統(tǒng)可分為 ? 根據(jù)挖掘的數(shù)據(jù)庫類型分類 ? 根據(jù)挖掘的知識類型分類 ? 根據(jù)所用的挖掘技術(shù)分類 ? 根據(jù)應(yīng)用分類 47 數(shù)據(jù)挖掘 常用技術(shù) 48 數(shù) 據(jù) 挖 掘 常 用 技 術(shù) ? 人工神經(jīng)網(wǎng)絡(luò) 仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的非線形預(yù)測模型,通過學習進行模式識別。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結(jié)果與模型預(yù)測值的偏差、量值隨時間的變化等。 ? 聚類分析與分類和預(yù)測的區(qū)別:聚類分析數(shù)據(jù)對象,而不考慮已知的類標記。聚類增強了人們對客觀現(xiàn)實的認識,是概念描述和偏差分析的先決條件。一個典型的例子是市場預(yù)測問題,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報最大的用戶,其它可預(yù)測的問題包括預(yù)報破產(chǎn)以及認定對指定事件最可能作出反應(yīng)的群體。 ? 關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這些規(guī)則展示屬性值頻繁地在給定數(shù)據(jù)集中一起出現(xiàn)的條件。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。 ? 生成一個類的特征性描述只涉及該類對象中所有對象的共性。數(shù)據(jù)挖掘任務(wù)有兩類:描述和預(yù)測
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1