freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

[理學(xué)]廈門大學(xué)數(shù)據(jù)挖掘課件之第1章數(shù)據(jù)挖掘概述-在線瀏覽

2025-02-20 23:50本頁面
  

【正文】 ? 本課程從 統(tǒng)計(jì)學(xué) 的觀點(diǎn)出發(fā), 立足理論,著眼應(yīng)用 ,在明確了數(shù)據(jù)挖掘定義和對(duì)象的基礎(chǔ)上,從七個(gè)方面對(duì)數(shù)據(jù)挖掘的理論及統(tǒng)計(jì)方法和應(yīng)用進(jìn)行較為詳細(xì)的介紹。 講授數(shù)據(jù)挖掘的定義,并以技術(shù)和商業(yè)的角度給出了數(shù)據(jù)挖掘的定義。最后對(duì)數(shù)據(jù)分析提出一些思考。 以數(shù)據(jù)挖掘的發(fā)展歷史為線索,講授數(shù)據(jù)挖掘領(lǐng)域研究所取得成果,解釋數(shù)據(jù)挖掘自身的特點(diǎn),從中領(lǐng)悟到了數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)的關(guān)系。 2022/1/4 ? 第三章介紹數(shù)據(jù)準(zhǔn)備。 ? 第四章介紹 Rough集的基本模型及有關(guān)概念。以統(tǒng)計(jì)思想與 Rough集理論相結(jié)合,介紹對(duì)事務(wù)性數(shù)據(jù)庫的統(tǒng)計(jì)描述,對(duì)事務(wù)性數(shù)據(jù)庫事務(wù)項(xiàng)及屬性項(xiàng)壓縮的方法,構(gòu)建事務(wù)性數(shù)據(jù)庫列聯(lián)表示的模型的思想。 ? 第五章重點(diǎn)介紹數(shù)據(jù)挖掘中的聚類問題。介紹聚類分析數(shù)據(jù)類型衍生的思想,并對(duì)聚類分析方法進(jìn)行了比較和檢驗(yàn)。 2022/1/4 ? 第六章介紹挖掘大型數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則。另外,引入相應(yīng)分析作為數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的提升,介紹相應(yīng)分析適應(yīng)性檢驗(yàn)的基本思想及方法,及相應(yīng)分析適應(yīng)性的分層量度方法。 ? 第七章理解一些其它的數(shù)據(jù)挖掘技術(shù)。 ? 為了滿足實(shí)際的需要,我們將利用所講授的方法,對(duì)某地區(qū)中國(guó)移動(dòng)通訊用戶消費(fèi)數(shù)據(jù)庫、某大學(xué)大學(xué)生隱形教育調(diào)查資料和上證指數(shù)收盤價(jià)信息進(jìn)行剖析,以便讓學(xué)生充分地領(lǐng)悟到數(shù)據(jù)挖掘的理論和實(shí)際價(jià)值 。 數(shù)據(jù)挖掘的定義 167。 數(shù)據(jù)挖掘?qū)ο? 167。 吃酒要被酒 殺 死,一 點(diǎn) 酒也不要吃。2 ? 2≦ x≦ 3 ? 40 247。 數(shù)據(jù)挖掘的技術(shù)定義與商業(yè)定義 ? 什么是數(shù)據(jù)挖掘 (Data Mining)? 關(guān)于定義取決于定義者的觀點(diǎn)和背景,各人的說法不一 . Friedman, J. Data Mining and Statistics: What39。 數(shù)據(jù)挖掘的技術(shù)定義 ? 從技術(shù)角度, 數(shù)據(jù)挖掘 (Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程 . ? 它是涉及機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、人工智能、數(shù)據(jù)庫管理及數(shù)據(jù)可視化等學(xué)科的邊緣學(xué)科 . 2022/1/4 這個(gè)定義包括好幾層含義 : ? 數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的; ? 發(fā)現(xiàn)的是用戶感興趣的知識(shí); ? 發(fā)現(xiàn)的知識(shí)要可接受、可理解、可運(yùn)用; ? 這些知識(shí)是相對(duì)的,是有特定前提和約束條件的,在特定領(lǐng)域中具有實(shí)際應(yīng)用價(jià)值 . 2022/1/4 什么是知識(shí)呢 ? ? 從廣義上理解,數(shù)據(jù)、信息是知識(shí)的表現(xiàn)形式,但是人們更把 概念、規(guī)則、模式、規(guī)律和約束等看作知識(shí) . ? 人們把數(shù)據(jù)看作是形成知識(shí)的源泉,好像從礦石中采礦或淘金一樣 . ? 原始數(shù)據(jù)可以是 結(jié)構(gòu)化的 ,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是 半結(jié)構(gòu)化的 ,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù) . ? 發(fā)現(xiàn)知識(shí)的方法可以是 數(shù)學(xué)的, 也可以 是非數(shù)學(xué)的; 可以是 演繹的, 也可以是 歸納的 . 發(fā)現(xiàn)的知識(shí)可以被用于信息管理、查詢優(yōu)化、決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護(hù) . 2022/1/4 167。 數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn) ( DM amp。 知識(shí)發(fā)現(xiàn) (Knowledge Discovery in Database)過程 知識(shí)發(fā)現(xiàn)過程可以粗略的理解為三部曲: 數(shù)據(jù)準(zhǔn)備 (data preparation) 數(shù)據(jù)挖掘 (data mining) 結(jié)果的解釋評(píng)估 (interpretation and evaluation) 2022/1/4 知識(shí)發(fā)現(xiàn)過程示意圖 2022/1/4 ? 數(shù)據(jù)準(zhǔn)備又可分為三個(gè)子步驟 : 數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理和數(shù)據(jù)變換 . ? 數(shù)據(jù)選取 的目的是確定發(fā)現(xiàn)任務(wù)的操作對(duì)象,即目標(biāo)數(shù)據(jù) . ? 數(shù)據(jù)預(yù)處理 一般可能包括消除噪聲、推導(dǎo)計(jì)算缺值數(shù)據(jù)、消除重復(fù)記錄、完成數(shù)據(jù)類型轉(zhuǎn)換等 . ? 數(shù)據(jù)變換 的主要目的是消減數(shù)據(jù)維數(shù)或降維,即從初始特征中找出真正有用的特征以減少數(shù)據(jù)開采時(shí)要考慮的特征或變量數(shù) . 2022/1/4 ? 數(shù)據(jù)挖掘階段 主要是確定開采的任務(wù),如 數(shù)據(jù)總結(jié)、分類、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)或序列模式發(fā)現(xiàn)等 . ? 確定了開采任務(wù)后,就要決定使用什么樣的開采算法 . 選擇實(shí)現(xiàn)算法有兩個(gè)需要考慮的因素: 一是不同的數(shù)據(jù)有不同的特點(diǎn),需要用與之相應(yīng)的算法來開采; 二是根據(jù)用戶或?qū)嶋H運(yùn)行系統(tǒng)的要求來開采 . 2022/1/4
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1