freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第6章現(xiàn)代數(shù)據(jù)挖掘技術(shù)與發(fā)展(參考版)

2024-07-31 12:28本頁面
  

【正文】 對(duì)該系統(tǒng)進(jìn)行一個(gè)實(shí)際的評(píng)價(jià),并描述一下其具體的實(shí)現(xiàn)方法。討論如何挖掘這種商業(yè)模式。 ? (2)利用粗糙集技術(shù)對(duì)本表的數(shù)據(jù)進(jìn)行分析,討論可能會(huì)得到什么結(jié)論。 ( tight coupling) DM系統(tǒng)被平滑地集成到 DB/DW系統(tǒng)中 知識(shí)挖掘工具運(yùn)用中的問題 (1)數(shù)據(jù)質(zhì)量 (2)數(shù)據(jù)可視化 (3)極大數(shù)據(jù)庫 (vLDB)的問題 (4)性能和成本 (5)商業(yè)分折員的技能 (6)處理噪聲和不完全數(shù)據(jù) (7)模式評(píng)估 —— 興趣度問題 知識(shí)挖掘工具運(yùn)用中的問題 (1)規(guī)則歸納應(yīng)用中的問題 主要用于顯式描述數(shù)據(jù)抽取的規(guī)則 、 找到所有的規(guī)則 , 工作量是巨大的 (2)神經(jīng)網(wǎng)絡(luò)應(yīng)用中的問題 受訓(xùn)練過度的影響 、 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度問題 (3)遺傳算法應(yīng)用中的問題 知識(shí)挖掘的價(jià)值 現(xiàn)代數(shù)據(jù)挖掘工具簡(jiǎn)介 文本挖掘 ⑴ 文本分析 ⑵ 語義網(wǎng)絡(luò) ⑴ 文本總結(jié) ⑵ 基于關(guān)鍵字的關(guān)聯(lián)分析 ⑶ 文檔分類分析 ⑷ 文檔聚類分析 ⑸ 文本挖掘的應(yīng)用 Web挖掘技術(shù) 1. Web的特點(diǎn) 2. Web內(nèi)容挖掘 ⑴ 基于文本信息的挖掘 ⑵ 基于多媒體信息的挖掘 4. Web使用記錄的挖掘 ⑴ 數(shù)據(jù)預(yù)處理階段 ⑵ 模式識(shí)別階段 ⑶ 模式分析階段 可視化數(shù)據(jù)挖掘技術(shù) ⑴ 數(shù)據(jù)可視化 ⑵ 數(shù)據(jù)挖掘結(jié)果可視化 ⑶ 數(shù)據(jù)挖掘過程可視化 ⑷ 交互式可視化數(shù)據(jù)挖掘 空間數(shù)據(jù)挖掘 ⑴ 地理信息系統(tǒng)概念 ⑵ 地理信息系統(tǒng)的特點(diǎn) ⑴ 圖形化數(shù)據(jù)挖掘 ⑵ 圖形化統(tǒng)計(jì)查詢 ⑶ 圖形化報(bào)表輸出 ⑷ 專業(yè)的地理分析功能 分布式數(shù)據(jù)挖掘 SQL查詢 查詢結(jié)果 結(jié)果 用戶查詢 圖 PADMA體系結(jié)構(gòu) 數(shù)據(jù)挖掘代理 元數(shù)據(jù) 數(shù)據(jù)挖掘代理 協(xié)調(diào)器 應(yīng)用 WW用戶接口 磁盤 磁盤 分布式數(shù)據(jù)挖掘 圖 CDM的體系結(jié)構(gòu) 數(shù)據(jù)站點(diǎn) A 數(shù)據(jù)站點(diǎn) B 數(shù)據(jù)站點(diǎn) C 分布式數(shù)據(jù)挖掘代理 分布式數(shù)據(jù)挖掘代理 分布式數(shù)據(jù)挖掘代理 A局部模型 B局部模型 C局部模型 協(xié)調(diào)器 全局?jǐn)?shù)據(jù)模型 練 習(xí) ? ?它們是如何相互配合完成知識(shí)發(fā)現(xiàn)的? ? ,數(shù)據(jù)已經(jīng)概括處理,其中的合計(jì)數(shù)為對(duì)應(yīng)所給定的部門、職務(wù)、年齡和工資值的人數(shù)。 計(jì)算剩余各個(gè)屬性的相應(yīng)的信息增益,選擇信息增益最大的屬性作為測(cè)試屬性,這時(shí)信息增益最大的是“學(xué)生”屬性,創(chuàng)建一個(gè)節(jié)點(diǎn),用“學(xué)生”標(biāo)記 。 一個(gè)給定的樣本分類所需要的期望信息為 由 A劃分成子集的熵或期望信息是 ? ? ? ?????miiim ppsssI1221 l o g, ????????vjmjjmjj ssIsssAE111 )()( ?? 決策樹型現(xiàn)代挖掘技術(shù) 1. 決策樹技術(shù) 為第 j個(gè)子集的權(quán) , 等于子集 ( A值為 aj) 中的樣本數(shù)除以 S中的樣本數(shù) 。 信息增益是指劃分前后進(jìn)行正確預(yù)測(cè)所需的信息量之差 。 (c)繼續(xù)劃分得到的改進(jìn)不明顯 。 (a)給定節(jié)點(diǎn)的所有樣本都屬于同一類 。 ( 3) 對(duì)測(cè)試屬性中的每一個(gè)值 , 創(chuàng)建相應(yīng)的一個(gè)分支 , 并據(jù)此劃分樣本 。 如果樣本都在同一類 , 則算法停止 , 把該節(jié)點(diǎn)改成樹葉節(jié)點(diǎn) , 并用該類標(biāo)記 。 決策樹型現(xiàn)代挖掘技術(shù) 1. 決策樹技術(shù) ID3, 該算法建立在推理系統(tǒng)和概念學(xué)習(xí)系統(tǒng)的基礎(chǔ)之上 , 基本步驟是 。 同樣 , 980625沒有流失 , 但是不能排除 970230和 990211流失 。 當(dāng)然 , 也不能排除 970230和 990211已經(jīng)流失 , 而 980625毫無疑問沒有流失 。 而 9702 990211就是邊界實(shí)例 , 即它們不能根據(jù)有效知識(shí)進(jìn)行適當(dāng)?shù)姆诸?。 客戶編號(hào) 贊揚(yáng)競(jìng)爭(zhēng)對(duì)手的產(chǎn)品否 挑選產(chǎn)品時(shí)間很長(zhǎng) 距最后一次銷售時(shí)間 客戶流失否 970102 否 是 長(zhǎng) 是 970230 是 否 長(zhǎng) 是 980304 是 是 很長(zhǎng) 是 980625
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1