freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘概念與技術(shù)第一章(編輯修改稿)

2025-06-20 11:39 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 BA 制定決策 數(shù)據(jù)表示 可視化技術(shù) 數(shù)據(jù)挖掘 信息發(fā)現(xiàn) 數(shù)據(jù)探查 OLAP, MDA 統(tǒng)計(jì)分析 , 查詢和報(bào)告 數(shù)據(jù)倉(cāng)庫(kù) / 數(shù)據(jù)集市 數(shù)據(jù)源 文字記錄 , 文件 , 信息提供者 , 數(shù)據(jù)庫(kù)系統(tǒng) , OLTP系統(tǒng) 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 20 典型的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)清理 數(shù)據(jù)集成 過(guò)濾 數(shù)據(jù)庫(kù) 數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)挖掘引擎 模式評(píng)估 圖形用戶界面 知識(shí)庫(kù) 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 21 數(shù)據(jù)挖掘 :在什么數(shù)據(jù)上進(jìn)行 ? ? 關(guān)系數(shù)據(jù)庫(kù) ? 數(shù)據(jù)倉(cāng)庫(kù) ? 事務(wù) (交易 )數(shù)據(jù)庫(kù) ? 先進(jìn)的數(shù)據(jù)庫(kù)和信息存儲(chǔ) ? 面向?qū)ο蠛蛯?duì)象 關(guān)系數(shù)據(jù)庫(kù) ? 空間和時(shí)間數(shù)據(jù) ? 時(shí)間序列數(shù)據(jù)和流數(shù)據(jù) ? 文本數(shù)據(jù)庫(kù)和多媒體數(shù)據(jù)庫(kù) ? 異種數(shù)據(jù)庫(kù)和遺產(chǎn)數(shù)據(jù)庫(kù) ? WWW 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 22 數(shù)據(jù)挖掘功能 (1) ? 概念描述 : 特征和區(qū)分 ? 概化 , 匯總 , 和比較數(shù)據(jù)特征 , 例如 , 干燥和潮濕的地區(qū) ? 關(guān)聯(lián) (相關(guān)和因果關(guān)系 ) ? 多維和單維關(guān)聯(lián) ? age(X, “20..29”) ^ ine(X, “20..29K”) ?buys(X, “PC”) [support = 2%, confidence = 60%] ? contains(T, “puter”) ? contains(T, “software”) [support = 1%, confidence = 75%] 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 23 數(shù)據(jù)挖掘功能 (2) ? 分類和預(yù)測(cè) ? 找出描述和識(shí)別類或概念的模型 ( 函數(shù) ), 用于將來(lái)的預(yù)測(cè) ? 例如根據(jù)氣候?qū)?guó)家分類 , 或根據(jù)單位里程的耗油量對(duì)汽車分類 ? 表示 : 判定樹(shù) (decisiontree), 分類規(guī)則 , 神經(jīng)網(wǎng)絡(luò) ? 預(yù)測(cè) : 預(yù)測(cè)某些未知或遺漏的數(shù)值值 ? 聚類分析 ? 類標(biāo)號(hào) (Class label) 未知 : 對(duì)數(shù)據(jù)分組 , 形成新的類 . 例如 , 對(duì)房屋分類 , 找出分布模式 ? 聚類原則 : 最大化類內(nèi)的相似性 , 最小化類間的相似性 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 24 數(shù)據(jù)挖掘功能 (3) ? 孤立點(diǎn) (Outlier)分析 ? 孤立點(diǎn) : 一個(gè)數(shù)據(jù)對(duì)象 , 它 與數(shù)據(jù)的一般行為不一致 ? 孤立點(diǎn)可以被視為例外 , 但對(duì)于欺騙檢測(cè)和罕見(jiàn)事件分析 , 它是相當(dāng)有用的 ? 趨勢(shì)和演變分析 ? 趨勢(shì)和偏離 : 回歸分析 ? 序列模式挖掘 , 周期性分析 ? 基于相似的分析 ? 其它基于模式或統(tǒng)計(jì)的分析 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 25 挖掘出的所有模式都是有趣的嗎 ? ? 一個(gè)數(shù)據(jù)挖掘系統(tǒng) /查詢可以挖掘出數(shù)以千計(jì)的模式 , 并非所有的模式都是有趣的 ? 建議的方法 : 以人為中心 , 基于查詢的 , 聚焦的挖掘 ? 興趣度度量 : 一個(gè)模式是 有趣的 如果它是 易于被人理解的 , 在某種程度上 在新的或測(cè)試數(shù)據(jù)上是有效的 , 潛在有用的 , 新穎的 , 或 驗(yàn)證了用戶希望證實(shí)的某種假設(shè) ? 客觀與主觀的興趣度度量 : ? 客觀 : 基于模式的統(tǒng)計(jì)和結(jié)構(gòu) , 例如 , 支持度 , 置信度 , 等 . ? 主觀 : 基于用戶對(duì)數(shù)據(jù)的確信 , 例如 , 出乎意料 , 新穎性 , 可行動(dòng)性(actionability), 等 . 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 26 能夠只發(fā)現(xiàn)有趣的模式嗎 ? ? 發(fā)現(xiàn)所有有趣的模式 : 完全性 ? 數(shù)據(jù)挖掘系統(tǒng)能夠發(fā)現(xiàn) 所有 有趣的模式嗎 ? ? 關(guān)聯(lián) vs. 分類 vs. 聚類 ? 僅搜索有趣的模式 : 優(yōu)化 ? 數(shù)據(jù)挖掘系統(tǒng)能夠 僅 發(fā)現(xiàn)有趣的模式嗎 ? ? 方法 ? 首先找出所有模式 , 然后過(guò)濾掉不是有趣的那些 . ? 僅產(chǎn)生有趣的模式 — 挖掘查詢優(yōu)化 2021年 6月 14日星期一 數(shù)據(jù)挖掘:概念與技術(shù) 27 數(shù)據(jù)挖掘 : 多學(xué)科交叉 數(shù)據(jù)挖掘 數(shù)據(jù)庫(kù)技術(shù) 統(tǒng)計(jì)學(xué) 其它學(xué)科 信息科學(xué) 機(jī)器學(xué)習(xí) 可視化 2021年 6月 14日星期一
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1