freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘2章數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的olap技術(shù)(編輯修改稿)

2025-06-14 03:06 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 理中,并不是對(duì)從事務(wù)型處理環(huán)境 中得到的細(xì)節(jié)數(shù)據(jù)進(jìn)行分析。細(xì)節(jié)數(shù)據(jù)量太大,會(huì)嚴(yán)重影響分析的效率,而且太多的細(xì)節(jié)數(shù)據(jù)不利于分析人員將注意力集中于有用的信息。分析型處理過(guò)程中經(jīng)常用到外部數(shù)據(jù),這部分?jǐn)?shù)據(jù)不是由事務(wù)型處理系統(tǒng)產(chǎn)生的,而是來(lái)自于其他外部數(shù)據(jù)源。 事務(wù)型處理數(shù)據(jù)和分析型處理數(shù)據(jù)的區(qū)別 事務(wù)型處理數(shù)據(jù) 分析型處理數(shù)據(jù) 細(xì)節(jié)的 綜合的,或提煉的 在存取瞬間是準(zhǔn)確的 代表過(guò)去的數(shù)據(jù) 可更新 不可更新,只讀的 操作需求事先可知道 操作需求事先不知 生命周期符合 SDLC 完全不同的生命周期 對(duì)性能要求高 對(duì)性能要求寬松 一個(gè)時(shí)刻操作一個(gè)單元 一個(gè)時(shí)刻操作一個(gè) 事務(wù)驅(qū)動(dòng) 分析驅(qū)動(dòng) 面向應(yīng)用 面向分析 一次操作數(shù)據(jù)量小 一次操作數(shù)據(jù)量大 支持日常操作 支持管理需求 OLTP和 OLAP的區(qū)別 ? 用戶(hù)和系統(tǒng)的面向性 : OLTP是面向顧客的 ,用于事務(wù)和查詢(xún)處理 OLAP是面向市場(chǎng)的 ,用于數(shù)據(jù)分析 ? 數(shù)據(jù)內(nèi)容 : OLTP系統(tǒng)管理當(dāng)前數(shù)據(jù) . OLAP系統(tǒng)管理大量歷史數(shù)據(jù) ,提供匯總和 聚集機(jī)制 . ? 數(shù)據(jù)庫(kù)設(shè)計(jì) : OLTP采用實(shí)體 聯(lián)系 ER模型和面向應(yīng)用的 數(shù)據(jù)庫(kù)設(shè)計(jì) . OLAP采用星型或雪花模型和面向主題的數(shù) 據(jù)庫(kù)設(shè)計(jì) . ? 視圖 : OLTP主要關(guān)注一個(gè)企業(yè)或部門(mén)內(nèi)部的當(dāng)前 數(shù)據(jù) ,不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù) OLAP則相反 . ? 訪問(wèn)模式 : OLTP系統(tǒng)的訪問(wèn)主要由短的原子事務(wù)組成 . 這種系統(tǒng)需要并行和恢復(fù)機(jī)制 . OLAP系統(tǒng)的訪問(wèn)大部分是只讀操作 . 為什么需要分離的數(shù)據(jù)倉(cāng)庫(kù) ? 分離操作數(shù)據(jù)庫(kù)系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)的主要 原因是提高兩個(gè)系統(tǒng)的性能 .操作數(shù)據(jù)庫(kù)系統(tǒng)是為已知的任務(wù)和負(fù)載設(shè)計(jì)的 ,而數(shù)據(jù)倉(cāng)庫(kù)的查詢(xún)通常是復(fù)雜的 ,涉及大量數(shù)據(jù)在匯總級(jí)的計(jì)算 ,在操作數(shù)據(jù)庫(kù)系統(tǒng)上處理 OLAP查詢(xún) ,可能會(huì)大大降低操作任務(wù)的性能 . 多維數(shù)據(jù)模型 ? 數(shù)據(jù)倉(cāng)庫(kù)和 OLAP工具基于多維數(shù)據(jù)模型 ,該模型將數(shù)據(jù)看作數(shù)據(jù)立方體形式 ? 數(shù)據(jù)立方體允許以多維對(duì)數(shù)據(jù)建模和觀察 .具體圖形詳見(jiàn) 71頁(yè)圖 31 多維數(shù)據(jù)庫(kù)模式 星型 ,雪花和事實(shí)星座模式是主要的存在形式 ? 星型模式包含一個(gè)大的包含大批數(shù)據(jù)的事實(shí)表和一系列維表 .如 73頁(yè)圖 34 ? 雪花模式是星型模式的變種 ,不同的是將某些維表規(guī)范化 .如 74頁(yè)圖 35 ? 事實(shí)星座模式對(duì)應(yīng)多個(gè)事實(shí)表共享維表 .如 74頁(yè)圖 36 定義模式的例子 定義圖 34的星型模式 : ? 定義立方體 : Define cube sales_star[time,item,branch,location]: dollars_sold=sum(sales_in_dollars), units_old=count(*) ? 定義維 Define dimension time as (time_key,day,day_of_week,month,quarter,year) 度量的分類(lèi)和計(jì)算 ? 分布的 : 設(shè)數(shù)據(jù)被劃分為 n個(gè)集合 ,函數(shù)在每一部分上的計(jì)算得到一個(gè)聚集值 .如果將函數(shù)用于 n個(gè)聚集值得到的結(jié)果 ,與將函數(shù)用于所有數(shù)據(jù)得到的結(jié)果一樣則該度量是分布的 ,如 count(),sum()等 ? 代數(shù)的 : 如果一個(gè)聚集函數(shù)能夠由一個(gè)具有 M個(gè)參數(shù)的代數(shù)函數(shù)計(jì)算 ,且每個(gè)參數(shù)都可以用一個(gè)分布聚集函數(shù)求得 .如 avg()可以由sum()/count()計(jì)算 ,其中 sum()和 count()是分布聚集函數(shù) . ? 整體的 : 如果一個(gè)聚集函數(shù)無(wú)法用具有 M個(gè)參數(shù)的代數(shù)函數(shù)進(jìn)行這一計(jì)算 ,則這個(gè)函數(shù)稱(chēng)是整體的 ,如 rand()等 ? 許多度量可以用關(guān)系的聚集操作計(jì)算 對(duì)應(yīng)圖 24,我們也可寫(xiě)出 SQL語(yǔ)句 .
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1