freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘培訓(xùn)課件-文庫(kù)吧資料

2025-03-13 13:12本頁(yè)面
  

【正文】 ? 商業(yè)角度的定義 數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性信息。發(fā)現(xiàn)的是用戶感興趣的知識(shí) 。 與數(shù)據(jù)挖掘相近的同義詞包括:數(shù)據(jù)融合、數(shù)據(jù)分析和決策支持等。數(shù)據(jù)挖掘已經(jīng)成了國(guó)際學(xué)術(shù)研究的重要熱點(diǎn)之一 。 概述 (1) 1980年在美國(guó)召開(kāi)了第一屆國(guó)際機(jī)器學(xué)習(xí)研討會(huì) 明確了機(jī)器學(xué)習(xí)是人工智能的重要研究方向 (2) 1989年 8月于美國(guó)底特律市召開(kāi)的第一屆知識(shí)發(fā)現(xiàn)( KDD) 國(guó) 際學(xué)術(shù)會(huì)議; 首次提出知識(shí)發(fā)現(xiàn)概念 (3) 1995年在加拿大召開(kāi)了第一屆知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘( DM) 國(guó)際學(xué)術(shù)會(huì)議; 首次提出數(shù)據(jù)挖掘概念 IEEE的 Knowledge and Data Engineering會(huì)刊率先在 1993年出版了 KDD技術(shù)專刊。 隨后,在 1991年、 1993年和 1994年都舉行 KDD專題討論會(huì),匯集來(lái)自各個(gè)領(lǐng)域的研究人員和應(yīng)用開(kāi)發(fā)者,集中討論數(shù)據(jù)統(tǒng)計(jì)、海量數(shù)據(jù)分析算法、知識(shí)表示、知識(shí)運(yùn)用等問(wèn)題。它是一個(gè)新興的,面向商業(yè)應(yīng)用的AI研究。 Why?數(shù)據(jù)挖掘的社會(huì)需求 數(shù)據(jù)挖掘 數(shù)據(jù)庫(kù)越來(lái)越大 有價(jià)值的知識(shí) 可怕的數(shù)據(jù) 所有企業(yè)面臨的一個(gè) 共同問(wèn)題 是:企業(yè)數(shù)據(jù)量非常大,而其中真正有價(jià)值的信息卻很少,因此需要從大量的數(shù)據(jù)中經(jīng)過(guò) 深層分析 ,獲得有利于商業(yè)運(yùn)作、提高競(jìng)爭(zhēng)力的信息,就像 從礦石中淘金 一樣,數(shù)據(jù)挖掘也由此而得名。目前的數(shù)據(jù)庫(kù)系統(tǒng)雖然可以高效地實(shí)現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計(jì)等功能,但 無(wú)法發(fā)現(xiàn) 數(shù)據(jù)中存在的 關(guān)系和規(guī)則 ,無(wú)法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。 ( 5) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量很大 大型 DW的數(shù)據(jù)是一個(gè) TB( 1000GB) 級(jí)數(shù)據(jù)量 ( 一般為 10GB級(jí) DW, 相當(dāng)于一般數(shù)據(jù)庫(kù)100MB的 100倍 ) ( 6) 數(shù)據(jù)倉(cāng)庫(kù)軟 、 硬件要求較高 需要一個(gè)巨大的硬件平臺(tái) 需要一個(gè)并行的數(shù)據(jù)庫(kù)系統(tǒng) 二十世紀(jì)末以來(lái),全球信息量以驚人的速度急劇增長(zhǎng) — 據(jù)估計(jì),每二十個(gè)月將增加一倍。 ( 4) 數(shù)據(jù)倉(cāng)庫(kù)是隨時(shí)間變化的 數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)時(shí)限在 5~ 10年 , 故數(shù)據(jù)的鍵碼包含時(shí)間項(xiàng) , 標(biāo)明數(shù)據(jù)的歷史時(shí)期 , 這適合DSS進(jìn)行時(shí)間趨勢(shì)分析 。 ( 3) 數(shù)據(jù)倉(cāng)庫(kù)是穩(wěn)定的 (不可修改的 ) 數(shù)據(jù)倉(cāng)庫(kù)中包括了大量的歷史數(shù)據(jù) 。統(tǒng)一 原始數(shù)據(jù)中的所有矛盾之處 , 如字段的同名異義 , 異名同義 , 單位不統(tǒng)一 , 字長(zhǎng)不一致等 。由于歷史的原因,各操作數(shù)據(jù)庫(kù)的組織結(jié)構(gòu)往往是不同的,在這些異構(gòu)數(shù)據(jù)輸入到數(shù)據(jù)倉(cāng)庫(kù)之前,必須經(jīng)歷一個(gè)集成過(guò)程。 ( 2)數(shù)據(jù)倉(cāng)庫(kù)是集成的 最重要的特點(diǎn)。 DW的客戶數(shù)據(jù)來(lái)源: 從 銀行儲(chǔ)蓄 DB、信用卡 DB、貸款 DB等三個(gè) DB中抽取同一客戶的數(shù)據(jù)整理而成。 主題是數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個(gè)主題基本對(duì)應(yīng)一個(gè)宏觀的分析領(lǐng)域。所謂面向應(yīng)用,指的是系統(tǒng)實(shí)現(xiàn)過(guò)程中主要圍繞著一些應(yīng)用或功能。 ( 2) SAS軟件研究所觀點(diǎn): 數(shù)據(jù)倉(cāng)庫(kù)是一種管理技術(shù),旨在通過(guò)通暢、合理、全面的信息管理,達(dá)到有效的決策支持。 ? OLAP的 基本思想 是決策者從多方面和多角度以 多維的形式 來(lái)觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。 新的挑戰(zhàn):如何不被淹沒(méi)在信息的海洋里 ? OLAP專門(mén)用于支持復(fù)雜的決策分析操作,側(cè)重對(duì)分析人員和高層管理人員的決策支持 , ? OLAP可以應(yīng)分析人員的要求快速、靈活地
點(diǎn)擊復(fù)制文檔內(nèi)容
外語(yǔ)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1