freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

unit8數(shù)據(jù)挖掘的概念(編輯修改稿)

2025-06-15 19:41 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 3. 數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別 ? 數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析 (如查詢、報(bào)表、聯(lián)機(jī)應(yīng)用分析 )的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒(méi)有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí) .數(shù)據(jù)挖掘所得到的信息應(yīng)具有先未知 ,有效和可實(shí)用三個(gè)特征 . ? 先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的 ,既數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識(shí) ,甚至是違背直覺的信息或知識(shí) ,挖掘出的信息越是出乎意料 ,就可能越有價(jià)值 . ? 在商業(yè)應(yīng)用中最典型的例子就是一家連鎖店通過(guò)數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有著驚人的聯(lián)系 . 25 數(shù)據(jù)挖掘的 研究?jī)?nèi)容和本質(zhì) 26 數(shù)據(jù)挖掘的研究?jī)?nèi)容和本質(zhì) 隨著 DMKD研究逐步走向深入,數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的研究已經(jīng)形成了三根強(qiáng)大的技術(shù)支柱:數(shù)據(jù)庫(kù)、人工智能和數(shù)理統(tǒng)計(jì)。目前 DMKD的主要研究?jī)?nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉(cāng)庫(kù)、可視化技術(shù)、定性定量互換模型、知識(shí)表示方法、發(fā)現(xiàn)知識(shí)的維護(hù)和再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)以及網(wǎng)上數(shù)據(jù)挖掘等。 27 數(shù)據(jù)挖掘的研究?jī)?nèi)容和本質(zhì) ? 數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識(shí)最常見的有以下幾類: ? 廣義知識(shí)( Generalization) ? 關(guān)聯(lián)知識(shí)( Association) ? 分類知識(shí) (Classification& Clustering) ? 預(yù)測(cè)型知識(shí)( Prediction) ? 偏差型知識(shí) (Deviation) 28 數(shù)據(jù)挖掘的研究?jī)?nèi)容和本質(zhì) 1. 廣義知識(shí) 廣義知識(shí)指類別特征的概括性描述知識(shí)。根據(jù)數(shù)據(jù)的微觀特性發(fā)現(xiàn)其表征的、帶有普遍性的、較高層次概念的、中觀和宏觀的知識(shí),反映同類事物共同性質(zhì),是對(duì)數(shù)據(jù)的概括、精煉和抽象。 29 數(shù)據(jù)挖掘的研究?jī)?nèi)容和本質(zhì) 2. 關(guān)聯(lián)知識(shí) 它反映一個(gè)事件和其他事件之間依賴或關(guān)聯(lián)的知識(shí)。如果兩項(xiàng)或多項(xiàng)屬性之間存在關(guān)聯(lián),那么其中一項(xiàng)的屬性值就可以依據(jù)其他屬性值進(jìn)行預(yù)測(cè)。 30 數(shù)據(jù)挖掘的研究?jī)?nèi)容和本質(zhì) 3. 分類知識(shí) 它反映同類事物共同性質(zhì)的特征型知識(shí)和不同事物之間的差異型特征知識(shí)。最為典型的分類方法是基于決策樹的分類方法。它是從實(shí)例集中構(gòu)造決策樹,是一種有指導(dǎo)的學(xué)習(xí)方法。該方法先根據(jù)訓(xùn)練子集(又稱為窗口)形成決策樹。如果該樹不能對(duì)所有對(duì)象給出正確的分類,那么選擇一些例外加入到窗口中,重復(fù)該過(guò)程一直到形成正確的決策集。最終結(jié)果是一棵樹,其葉結(jié)點(diǎn)是類名,中間結(jié)點(diǎn)是帶有分枝的屬性,該分枝對(duì)應(yīng)該屬性的某一可能值。 31 數(shù)據(jù)挖掘的研究?jī)?nèi)容和本質(zhì) 4. 預(yù)測(cè)型知識(shí) 根據(jù)時(shí)間序列型數(shù)據(jù),由歷史的和當(dāng)前的數(shù)據(jù)去推測(cè)未來(lái)的數(shù)據(jù),也可以認(rèn)為是以時(shí)間為關(guān)鍵屬性的關(guān)聯(lián)知識(shí)。 32 數(shù)據(jù)挖掘的研究?jī)?nèi)容和本質(zhì) 5. 偏差型知識(shí) (Deviation) 它是對(duì)差異和極端特例的描述,揭示事物偏離常規(guī)的異?,F(xiàn)象,如標(biāo)準(zhǔn)類外的特例,數(shù)據(jù)聚類外的離群值等。所有這些知識(shí)都可以在不同的概念層次上被發(fā)現(xiàn),并隨著概念層次的提升,從微觀到中觀、到宏觀,以滿足不同用戶不同層次決策的需要 6. 孤立點(diǎn)數(shù)據(jù)分析、欺騙檢測(cè)等 33 在何種數(shù)據(jù)上 進(jìn)行數(shù)據(jù)挖掘 34 在何種數(shù)據(jù)上進(jìn)行數(shù)據(jù)挖掘 原則上講, DM可以在任何類型的信息存儲(chǔ)上進(jìn)行 .包括 : ? 關(guān)系數(shù)據(jù)庫(kù) ? 數(shù)據(jù)倉(cāng)庫(kù) ? 高級(jí)數(shù)據(jù)庫(kù) ? 面向?qū)ο蟮臄?shù)據(jù)庫(kù) ? 對(duì)象 關(guān)系數(shù)據(jù)庫(kù) ? 空間數(shù)據(jù)庫(kù) ? 時(shí)間數(shù)據(jù)庫(kù)和時(shí)間序列數(shù)據(jù)庫(kù) ? 文本數(shù)據(jù)庫(kù)和多媒體數(shù)據(jù)庫(kù) ? 異種數(shù)據(jù)庫(kù)和遺產(chǎn)數(shù)據(jù)庫(kù) ? flat文件 ? WWW 35 數(shù)據(jù)挖掘 的功能 36 數(shù) 據(jù) 挖 掘 的 功 能 數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要找的模式類型。數(shù)據(jù)挖掘任務(wù)有兩類:描述和預(yù)測(cè) .描述性挖掘任務(wù)刻畫數(shù)據(jù)庫(kù)中數(shù)據(jù)的一般特性;預(yù)測(cè)性數(shù)據(jù)挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進(jìn)行推斷、預(yù)測(cè) . ? 概念描述 ? 關(guān)聯(lián)分析 ? 自動(dòng)預(yù)測(cè)趨勢(shì)和行為 ? 聚類 ? 偏差檢測(cè) 37 數(shù) 據(jù) 挖 掘 的 功 能 1. 概念描述 ? 概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征。 ? 概念描述分為特征性描述和區(qū)別性描述,前者描述某類對(duì)象的共同特征,后者描述不同類對(duì)象之間的區(qū)別。 ? 生成一個(gè)類的特征性描述只涉及該類對(duì)象中所有對(duì)象的共性。 ? 生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等 38 數(shù) 據(jù) 挖 掘 的 功 能 2. 關(guān)聯(lián)分析 ? 數(shù)據(jù)關(guān)聯(lián)是數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1