freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的olap技術(shù)(留存版)

2024-10-19 12:12上一頁面

下一頁面
  

【正文】 按小數(shù)定標 ? 屬性構(gòu)造 數(shù)據(jù)變換 2020/9/16 65 數(shù)據(jù)歸約 歸約數(shù)據(jù)集小、近似保持原數(shù)據(jù)的完整性 數(shù)據(jù)立方體聚集:聚集數(shù)據(jù)立方體 使用與給定任務(wù)相關(guān)的最小方體 屬性子集選擇 檢測、刪除不相關(guān) 弱相關(guān) 冗于的屬性和維 方法:逐步向前、逐步向后、向前向后結(jié)合 決策樹歸納:信息增益法 2020/9/16 66 數(shù)據(jù)歸約 歸約數(shù)據(jù)集小、近似保持原數(shù)據(jù)的完整性 數(shù)據(jù)壓縮:編碼機制壓縮數(shù)據(jù) 方法:小波變換、主成分分析( PCA) 數(shù)值壓縮:用替代的、較小的數(shù)據(jù)表示數(shù)據(jù) 方法:有參方法 回歸和對數(shù)線性模型 無參方法 直方圖 聚類 抽樣 2020/9/16 67 離散化和概念分層 原始值用區(qū)間值或較高 層的概念替換 離散化:原始值劃分為有限個區(qū)間,減少了連續(xù)屬性值的個數(shù) 概念分層:原始值用較高層的概念替換 2020/9/16 68 離散化和概念分層: 對數(shù)值數(shù)據(jù) :分箱 直方圖分析 聚類分析 基于熵的離散化 (entropy) 通過信息增益方法確定區(qū)間邊界 使用類信息,更可能將區(qū)間邊界定義準確 基于卡方分析的區(qū)間合并 通過自然劃分分段 345規(guī)則 (P58):將數(shù)值數(shù)據(jù)劃分成相對一致的區(qū)間 2020/9/16 69 對分類數(shù)據(jù) : ? 分類數(shù)據(jù)是離散數(shù)據(jù)。分析型處理經(jīng)常要訪問大量的歷史數(shù)據(jù),支持復(fù)雜的查詢。因此數(shù)據(jù)倉庫必須不斷捕捉 OLTP數(shù)據(jù)庫中變化的數(shù)據(jù),生成數(shù)據(jù)庫的快照,經(jīng)集成后增加到數(shù)據(jù)倉庫中去;另外數(shù)據(jù)倉庫還需要隨時間的變化刪去過期的、對分析沒有幫助的數(shù)據(jù),并且還需要按規(guī)定的時間段增加綜合數(shù)據(jù)。 ? 隨著數(shù)據(jù)庫技術(shù)的迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,人們積累的數(shù)據(jù)越來越多,但缺乏挖掘數(shù)據(jù)中隱藏的知識的手段,導(dǎo)致了“ 數(shù)據(jù)爆炸但知識貧乏的 ” 現(xiàn)象。第 3章 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的 OLAP技術(shù) 本章要點 ? 數(shù)據(jù)倉庫的基本概念 ? 多維數(shù)據(jù)模型 ? 數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu) ? 數(shù)據(jù)倉庫實現(xiàn) ? 數(shù)據(jù)立方體技術(shù)的近一步發(fā)展 ? 從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘 數(shù)據(jù)倉庫的發(fā)展 ? 自從 NCR公司為 Wal Mart建立了第一個數(shù)據(jù)倉庫。 數(shù)據(jù)挖掘的發(fā)展 ? 數(shù)據(jù)挖掘是與數(shù)據(jù)倉庫密切相關(guān)的一個信息技術(shù)新領(lǐng)域,它是信息技術(shù)自然演化的結(jié)果。 時變性 ? 時變性:許多商業(yè)分析要求對發(fā)展趨勢做出預(yù)測,對發(fā)展趨勢的分析需要訪問歷史數(shù)據(jù)。它幫助決策者分析數(shù)據(jù)以察看趨向、判斷問題。一個分類屬性可能有有限個不同的值。它是事件驅(qū)動、面向應(yīng)用的,通常是對一個或一組記錄的增、刪、改以及簡單查詢等。因此,數(shù)據(jù)倉庫在提取數(shù)據(jù)時必須經(jīng)過數(shù)據(jù)集成,消除源數(shù)據(jù)中的矛盾,并進行數(shù)據(jù)綜合和計算。Trees(前端報表工具)構(gòu)成的一套較有特色的整體方案。 ? IBM的實驗室在數(shù)據(jù)倉庫方面已經(jīng)進行了 10多年的研究,并將研究成果發(fā)展成為商用產(chǎn)品。 ? 數(shù)據(jù)倉庫是與操作型系統(tǒng)相分離的、基于標準企業(yè)模型集成的、帶有時間屬性的、面向主題及不可更新的數(shù)據(jù)集合。因此,數(shù)據(jù)倉庫的功能是支持管理層進行科學(xué)決策,而不是事務(wù)處理。 事務(wù)型處理數(shù)據(jù)和分析型處理數(shù)據(jù)的區(qū)別 事務(wù)型處理數(shù)據(jù) 分析型處理數(shù)據(jù) 細節(jié)的 綜合的,或提煉的 在存取瞬間是準確的 代表過去的數(shù)據(jù) 可更新 不可更新,只讀的 操作需求事先可知道 操作需求事先不知 生命周期符合 SDLC 完全不同的生命周期 對性能要求高 對性能要求寬松 一個時刻操作一個單元 一個時刻操作一個 事務(wù)驅(qū)動 分析驅(qū)動 面向應(yīng)用 面向分析 一次操作數(shù)據(jù)量小 一次操作數(shù)據(jù)量大 支持日常操作 支持管理需求 OLTP和 OLAP的區(qū)別 ? 用戶和系統(tǒng)的面向性 : OLTP是面向顧客的 ,用于事務(wù)和查詢處理 OLAP是面向市場的 ,用于數(shù)據(jù)分析 ? 數(shù)據(jù)內(nèi)容 : OLTP系統(tǒng)管理當(dāng)前數(shù)據(jù) . OLAP系統(tǒng)管理大量歷史數(shù)據(jù) ,提供匯總和 聚集機制 . ? 數(shù)據(jù)庫設(shè)計 : OLTP采用實體 聯(lián)系 ER模型和面向應(yīng)用的 數(shù)據(jù)庫設(shè)計 . OLAP采用星型或雪花模型和面向主題的數(shù) 據(jù)庫設(shè)計 . ? 視圖 : OLTP主要關(guān)注一個企業(yè)或部門內(nèi)部的當(dāng)前 數(shù)據(jù) ,不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù) OLAP則相反 . ? 訪問模式 : OLTP系統(tǒng)的訪問主要由短的原子事務(wù)組成 . 這種系統(tǒng)需要并行和恢復(fù)機制 . OLAP系統(tǒng)的訪問大部分是只讀操作 . 為什么需要分離的數(shù)據(jù)倉庫 ? 分離操作數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)倉庫的主
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1