freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘概述(學(xué)時2)-資料下載頁

2024-10-19 19:41本頁面
  

【正文】 預(yù)測模型 ? 關(guān)聯(lián)分析 ? 分類分析 ? 聚類分析 數(shù)據(jù)挖掘的類型 ?序列分析 ?偏差檢測 ?模式相似性挖掘 ?Web數(shù)據(jù)挖掘 DWamp。DM 2021/11/12 47 ? 預(yù)測模型( Predictive Modeling): 所謂預(yù)測即從數(shù)據(jù)庫或數(shù)據(jù)倉庫中已知的數(shù)據(jù)推測未知的數(shù)據(jù)或?qū)ο蠹心承傩缘闹捣植?。如預(yù)測用戶的業(yè)務(wù)趨勢。 ? 建立預(yù)測模型的常用方法: ?回歸分析 ?線性模型 ?關(guān)聯(lián)規(guī)則 預(yù)測模型 ?決策樹預(yù)測 ?遺傳算法 ?神經(jīng)網(wǎng)絡(luò) DWamp。DM 2021/11/12 48 ? 關(guān)聯(lián)( Association) 分析:關(guān)聯(lián)規(guī)則描述了一組數(shù)據(jù)項(xiàng)之間的密切度或關(guān)系。關(guān)聯(lián)分析用于發(fā)現(xiàn)項(xiàng)目集之間的關(guān)聯(lián)。 ? 關(guān)聯(lián)規(guī)則挖掘近幾年研究較多?,F(xiàn)在,關(guān)聯(lián)規(guī)則的挖掘已經(jīng)從單一概念層次關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)發(fā)展到多概念層次的關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),并把研究的重點(diǎn)放在提高算法的效率和規(guī)模可收縮性上。它廣泛地運(yùn)用于幫助市場導(dǎo)向、商品目錄設(shè)計(jì)等商業(yè)決策過程中?!捌【坪湍虿肌笔墙?jīng)典的 關(guān)聯(lián)分析。 關(guān)聯(lián)分析 DWamp。DM 2021/11/12 49 ? 關(guān)聯(lián)分析算法: APRIORI算法、 DHP算法、 DIC算法、 PARTITION算法及它們的各種改進(jìn)算法等。另外,對于大規(guī)模、分布在不同站點(diǎn)上的數(shù)據(jù)庫或數(shù)據(jù)倉庫,關(guān)聯(lián)規(guī)則的挖掘可以使用并行算法,如: Count分布算法、 Data分布算法、 Candidate 分布算法、智能 Data分布算法( IDD) 和 DMA分布算法等。 DWamp。DM 2021/11/12 50 ? 分類( Classification) 分析:根據(jù)數(shù)據(jù)的特征為每個類別建立一個模型,根據(jù)數(shù)據(jù)的屬性將數(shù)據(jù)分配到不同的組中。 ? 分類分析已經(jīng)成功地用于顧客分類、疾病分類、商業(yè)建模和信用卡分析等。 ? 分類分析的常用方法:決策樹、粗糙集( Rough Set) 、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)分析法。 分類分析 DWamp。DM 2021/11/12 51 ? 聚類 (Clustering)分析:聚類分析是按照某種相近程度度量方法將數(shù)據(jù)分成互不相同的一些分組。每一個分組中的數(shù)據(jù)相近,不同分組之間的數(shù)據(jù)相差較大。 ? 聚類分析的常用方法:隨機(jī)搜索聚類法、特征聚類、CF樹。 聚類分析 DWamp。DM 2021/11/12 52 ? 序列( Sequence) 分析:序列分析主要用于分析數(shù)據(jù)倉庫中的某類與時間相關(guān)的數(shù)據(jù),搜索類似的序列或子序列,并挖掘時序模式、周期性、趨勢和偏離等。 ? 例如,它可以導(dǎo)出類似“若 ATamp。T股票連續(xù)上漲兩天且 DEC股票不下跌,則第三天 IBM股票上漲的可能性為 75%”的數(shù)據(jù)關(guān)系。 ? 序列模式可以看成是一種特定的關(guān)聯(lián)模型,它在關(guān)聯(lián)模型中增加了時間屬性。 序列分析 DWamp。DM 2021/11/12 53 ? 偏差檢測( Deviation Detection): 用于檢測并解釋數(shù)據(jù)分類的偏差,它有助于濾掉知識發(fā)現(xiàn)引擎所抽取的無關(guān)信息,也可濾掉那些不合適的數(shù)據(jù),同時可產(chǎn)生新的關(guān)注性事實(shí)。 ? 模式相似性挖掘:用于在時間數(shù)據(jù)庫或空間數(shù)據(jù)庫中搜索相似模式時,從所有對象中找出用戶定義范圍內(nèi)的對象;或找出所有元素對,元素對中兩者的距離小于用戶定義的距離范圍。 偏差檢測與模式相似性挖掘 DWamp。DM 2021/11/12 54 ? Web數(shù)據(jù)挖掘:萬維網(wǎng)是一個巨大的、分布廣泛的和全球性的信息服務(wù)中心,其中包含了豐富的超鏈接信息,為數(shù)據(jù)挖掘提供了豐富的資源。Web數(shù)據(jù)挖掘包括 Web使用模式挖掘 、 Web結(jié)構(gòu)挖掘 和 Web內(nèi)容挖掘 等。 ? 基于 Web的研究: 搜索引擎 的設(shè)計(jì)、文件 自動分類 技術(shù)、關(guān)鍵詞的 自動提取 、半結(jié)構(gòu)化信息的提取及 Web上新型應(yīng)用的研究等。 Web數(shù)據(jù)挖掘 DWamp。DM 2021/11/12 55 數(shù)據(jù)挖掘技術(shù)可以為決策、過程控制、信息管理和查詢處理等任務(wù)提供服務(wù)。 ? 電信:客戶流失分析; ? 銀行:客戶信譽(yù)度分析; ? 百貨公司超市:購物籃分析(關(guān)聯(lián)規(guī)則); ? 保險(xiǎn):交叉銷售,客戶流失(原因分析); ? 信用卡: 欺詐探測; ? 電子商務(wù):網(wǎng)站日志分析; ? 稅務(wù)部門:偷漏稅行為探測; ? 警察機(jī)關(guān):犯罪行為分析; ? 醫(yī)學(xué):醫(yī)療保??; ? 其他 等。 數(shù)據(jù)挖掘應(yīng)用 DWamp。DM 2021/11/12 56 查找關(guān)于數(shù)據(jù)倉庫、數(shù)據(jù)挖掘的實(shí)例 Homework
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1