freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基礎(chǔ)第2章olap(趙志升)xxxx修改(編輯修改稿)

2025-03-27 12:39 本頁面
 

【文章內(nèi)容簡介】 維數(shù)據(jù)作數(shù)據(jù)挖掘,然后再利用立方體計算算法對挖掘出來的結(jié)果做進(jìn)一步的深入分析。 ? 立方體計算與數(shù)據(jù)挖掘同時進(jìn)行。在挖掘的過程中,可以根據(jù)需要對數(shù)據(jù)視圖做相應(yīng)的多維操作。這也意味著同一個挖掘算法可以應(yīng)用于多維數(shù)據(jù)視圖的不同部分。 ? 回溯操作。 OLAM的標(biāo)簽和回溯特性,允許用戶回溯一步或幾步,或回溯至標(biāo)志處,然后沿著另外的途徑進(jìn)行挖掘,這樣用戶在挖掘分析中可以交互式的進(jìn)行立方體計算和數(shù)據(jù)挖掘。 OLAM技術(shù)的發(fā)展趨勢 ? OLAM技術(shù)實現(xiàn)了 OLAP和 DM技術(shù)的互補(bǔ),它的發(fā)展趨勢是兩者更加可靠的集成、融合,有自己合理優(yōu)化的結(jié)構(gòu)體系和一套完備的技術(shù)理論基礎(chǔ),從整體上為決策分析提供完美支持。 ? OLAM技術(shù)是一門交叉學(xué)科,涉及機(jī)器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、智能數(shù)據(jù)庫、人工智能、高性能計算、數(shù)據(jù)可視化、專家系統(tǒng)等綜合技術(shù)。這些相關(guān)學(xué)科的發(fā)展,無疑也將會推動OLAM技術(shù)的發(fā)展。特別是,近年來隨著數(shù)據(jù)庫技術(shù)的發(fā)展,出現(xiàn)了不同數(shù)據(jù)類型的高級數(shù)據(jù)庫,如面向?qū)ο髷?shù)據(jù)庫、對象關(guān)系型數(shù)據(jù)庫、空間數(shù)據(jù)庫、超文本數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、時序數(shù)據(jù)庫等。因此,未來的 OLAM技術(shù)應(yīng)用應(yīng)基于這些高級數(shù)據(jù)庫展開。 ? 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,全球信息的共享,基于 Web的聯(lián)機(jī)分析挖掘 (Web0LAM),也將成為 OLAM技術(shù)發(fā)展的一個新方向。 P87頁 OLAP的典型操作 OLAP對數(shù)據(jù)倉庫中數(shù)據(jù)的操作是針對多維數(shù)據(jù)視圖 ( 又稱為超立方體 ) 進(jìn)行的 。 對立方體的典型操作包括:切片 、 切塊以及旋轉(zhuǎn)等 。 ? 切片 選定多維數(shù)組的一個二維子集; ? 切塊 選定多維數(shù)組的一個三維子集; ? 旋轉(zhuǎn) 改變一個立方體顯示的維方向 , 人們可以從不同的角度更加清晰 、 直觀地觀察數(shù)據(jù) 。 切片切塊旋轉(zhuǎn)地域年份 地域產(chǎn)品圖 2 . 1 對超立方體的典型操作 多維數(shù)據(jù) ? Sales volume as a function of product, month, and region Product Month Dimensions: Product, Location, Time Hierarchical summarization paths Industry Region Year Category Country Quarter Product City Month Week Office Day 立方體實例 Total annual sales of TV in . Date Country sum sum TV VCR PC 1Qtr 2Qtr 3Qtr 4Qtr Canada Mexico sum 數(shù)據(jù)立方體的瀏覽 ? Visualization ? OLAP capabilities ? Interactive manipulation 第一節(jié) 多維數(shù)據(jù)模型 數(shù)據(jù)立方體 數(shù)據(jù)倉庫和 OLAP工具基于 多維數(shù)據(jù)模型 ,多維數(shù)據(jù)模型將數(shù)據(jù)看作 數(shù)據(jù)立方體 ( data cube)形式。數(shù)據(jù)立方體允許以多維對數(shù)據(jù)建模和觀察,由 維 和 事實 定義。 第一節(jié) 多維數(shù)據(jù)模型 數(shù)據(jù)立方體 數(shù)據(jù)倉庫和 OLAP工具基于 多維數(shù)據(jù)模型 ,多維數(shù)據(jù)模型將數(shù)據(jù)看作 數(shù)據(jù)立方體 ( data cube)形式。數(shù)據(jù)立方體允許以多維對數(shù)據(jù)建模和觀察,由 維 和 事實 定義。 第一節(jié) 多維數(shù)據(jù)模型 OLAP展現(xiàn)在用戶面前的是一幅幅多維視圖。 聯(lián)機(jī)分析處理 維( Dimension): 是人們觀察數(shù)據(jù)的特定角度,是考慮問題時的一類屬性,屬性集合構(gòu)成一個維(時間維、地理維等)。 維的層次( Level): 人們觀察數(shù)據(jù)的某個特定角度(即某個維)還可以存在細(xì)節(jié)程度不同的各個描述方面(時間維:日期、月份、季度、年)。 維的成員( Member): 維的一個取值,是數(shù)據(jù)項在某維中位置的描述。(“某年某月某日”是在時間維上位置的描述)。 度量( Measure): 多維數(shù)組的取值。( 2023年 1月,上海,筆記本電腦, 0000)。 第一節(jié) 多維數(shù)據(jù)模型 數(shù)據(jù)立方體 ? 維是關(guān)于一個組織想要記錄的透視或?qū)嶓w; ? 每一個維都有一個表與之相關(guān)聯(lián),該表稱 為維表,它進(jìn)一步描述維; ? 多維數(shù)據(jù)模型圍繞中心主題組織,主題用 事實表表示; ? 事實是數(shù)值的度量,事實表包括事實的名 稱或度量,以及每個相關(guān)維表的關(guān)鍵字。 第一節(jié) 多維數(shù)據(jù)模型 數(shù)據(jù)立方體 設(shè)某 BSEK北星易家連鎖公司由下列關(guān)系表描述: Customer( cust_id, name, address, age, … ) Item( item_id, name, type, price, … ) Employee ( empl_id, name, salary, … ) purchases( trans_id, cust_id , empl_id , date, time, method_paid, amount, … ) Branch( branch_id, name, address) 第一節(jié) 多維數(shù)據(jù)模型 數(shù)據(jù)立方體 例如, BSEK可能創(chuàng)建一個數(shù)據(jù)倉庫 sales,記錄商店的銷售情況,涉及 time, item和 location。典型 3D立方體如圖: time location item 多維模型 事實 度量 (Metrics) 時間維 時間維的屬性 第一節(jié) 多維數(shù)據(jù)模型 多維數(shù)據(jù)庫模式 ER數(shù)據(jù)模型適用于 OLTP,而數(shù)據(jù)倉庫需要簡明的、面向主題的模式,便于聯(lián)機(jī)數(shù)據(jù)分析。數(shù)據(jù)倉庫的數(shù)據(jù)模型采用 多維數(shù)據(jù)模型 。 ? 星型模式 ? 雪花模式 ? 事實星座模式 第三節(jié) 數(shù)據(jù)倉庫的實現(xiàn) 數(shù)據(jù)立方體的有效計算 多維數(shù)據(jù)分析的核心是有效地計算多個維集合上的聚集,類似于 SQL中的分組。 ? 基本立方操作及實現(xiàn) ? 部分物化 ? 數(shù)據(jù)立方體計算中多路數(shù)組聚集 第三節(jié) 數(shù)據(jù)倉庫的實現(xiàn) 索引 OLAP數(shù)據(jù) ? 位圖索引 ? 連接索引 ? 復(fù)合連接索引 第四節(jié) 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘 數(shù)據(jù)倉庫的使用 數(shù)據(jù)倉庫的三種應(yīng)用: ? 信息處理 ? 分析處理 ? 數(shù)據(jù)挖掘 第四節(jié) 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘 數(shù)據(jù)倉庫的使用 信息處理 :支持查詢和基本的統(tǒng)計分析,并使用交叉表、表、圖表或圖進(jìn)行報告。數(shù)據(jù)倉庫信息處理的當(dāng)前趨勢是構(gòu)造低成本的基于 Web的存取工具,然后與 Web瀏覽器集成在一起。 第四節(jié) 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘 數(shù)據(jù)倉庫的使用 分析處理 :支持基本的 OLAP操作,包括切片與切塊、下鉆、上卷和轉(zhuǎn)軸。一般在匯總的和細(xì)節(jié)的歷史數(shù)據(jù)上操作,它支持?jǐn)?shù)據(jù)倉庫的多維數(shù)據(jù)分析。 第四節(jié) 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘 數(shù)據(jù)倉庫的使用 數(shù)據(jù)挖掘 :支持知識發(fā)現(xiàn),包括找出隱藏的模式和關(guān)聯(lián),構(gòu)造分析模型,進(jìn)行分類和預(yù)測,并用可視化工具提供挖掘結(jié)果。 數(shù)據(jù)挖掘不限于分析數(shù)據(jù)倉庫中的數(shù)據(jù),比OLAP更自動化,更深入,應(yīng)用更廣。 第四節(jié) 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘 從 OLAP到 OLAM OLAM聯(lián)機(jī)分析挖掘?qū)⒙?lián)機(jī)分析處理與數(shù)據(jù)挖掘以及多維數(shù)據(jù)庫中的發(fā)現(xiàn)知識集成在一起。 ? 數(shù)據(jù)倉庫中的數(shù)據(jù)高質(zhì)量 ? 環(huán)繞數(shù)據(jù)倉庫的有價值的信息處理基礎(chǔ)設(shè)施 ? 基于 OLAP的探測式數(shù)據(jù)分析 ? 數(shù)據(jù)挖掘功能的聯(lián)機(jī)選擇 多維數(shù)據(jù)模型上的 OLAP操作: 多維數(shù)據(jù)模型上的 OLAP操作: 有鉆取( Drillup和Drilldown)、切片( Slice)和切塊( Dice)、以及旋轉(zhuǎn)( Pivot)等。 鉆?。?是改變維的層次,變換分析的粒度。它包括向下鉆?。?Drilldown)和向上鉆?。?Drillup) /上卷 (Rollup)。 Drillup是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而 Drilldown則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。 切片和切塊 : 是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個,則是切片;如果有三個或以上,則是切塊。 旋轉(zhuǎn): 是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。 多維數(shù)據(jù)模型上的 OLAP操作 概念分層 將屬性或維組織成漸進(jìn)的抽象層,它將低層概念映射到更一般的高層概念。概念分層對于多抽象層上的挖掘有
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1