freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)ppt課件(2)-資料下載頁(yè)

2025-01-14 19:27本頁(yè)面
  

【正文】 指標(biāo)實(shí)體代表一系列相關(guān)事實(shí),完成一項(xiàng)指定的功能。位于星形 圖星角上的實(shí)體是維度實(shí)體,其作用是限制用戶的查詢結(jié)果,將 數(shù)據(jù)過(guò)濾使得從指標(biāo)實(shí)體查詢返回較少的行,從而縮小訪問(wèn)范圍。 每個(gè)維表有自己的屬性,維表和事實(shí)表通過(guò)關(guān)鍵字相關(guān)聯(lián)。 星形模式雖然是一個(gè)關(guān)系模型,但是它不是一個(gè)規(guī)范化的模 型。在星形模式中,維度表被故意地非規(guī)范化了,這是星形模式 與 OLTP系統(tǒng)中的關(guān)系模式的基本區(qū)別。 使用星形模式主要原因 :提高查詢的效率。采用星形模式設(shè)計(jì) 的數(shù)據(jù)倉(cāng)庫(kù)的優(yōu)點(diǎn)是由于數(shù)據(jù)的組織已經(jīng)過(guò)預(yù)處理,主要數(shù)據(jù)都 在龐大的事實(shí)表中 ,所以只要掃描事實(shí)表就可以進(jìn)行查詢,而不必 把多個(gè)龐大的表聯(lián)接起來(lái),查詢?cè)L問(wèn)效率較高。同時(shí)由于維表一 般都很小 ,甚至可以放在高速緩存中 ,與事實(shí)表作連接時(shí)其速度較 快 。便于用戶理解。對(duì)于非計(jì)算機(jī)專業(yè)的用戶而言,星形模式比較 直觀,通過(guò)分析星形模式,很容易組合出各種查詢。 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模式 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 星型模式 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模式 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 雪花模式 (Snowflake Schema) ?維一般是由若干層次組成 ?把維按其層次結(jié)構(gòu)表示成若干個(gè)表 ?規(guī)范化、節(jié)省存儲(chǔ)空間 ?但需多做連接操作 定單號(hào) 銷售員號(hào) 客戶號(hào) 產(chǎn)品號(hào) 日期標(biāo)識(shí) 地區(qū)名稱 數(shù)量 總價(jià) 定單號(hào) 定貨日期 客戶號(hào) 客戶名稱 客戶地址 銷售員號(hào) 姓名 城市 產(chǎn)品號(hào) 產(chǎn)品名稱 單價(jià) 日期標(biāo)識(shí) 日 月 年 地區(qū)名稱 省 事實(shí)表 雪花模式 產(chǎn)品號(hào) 公司代碼 公司代碼 公司名稱 地址 雪花模式 (Snowflake Schema) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模式 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 雪花模式是對(duì)星形模式維表的進(jìn)一步層次化,將某些維表擴(kuò) 展成事實(shí)表,這樣既可以應(yīng)付不同級(jí)別用戶的查詢,又可以將源 數(shù)據(jù)通過(guò)層次間的聯(lián)系向上綜合,最大限度地減少數(shù)據(jù)存儲(chǔ)量, 因而提高了查詢功能。 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模式 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 星模式與雪花模式的區(qū)別 主要內(nèi)容 數(shù)據(jù)倉(cāng)庫(kù)基本概念 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模式 多維分析 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) ? (Slice and Dice) – 在多維數(shù)據(jù)結(jié)構(gòu)中 ,按二維進(jìn)行切片 ,按三維進(jìn)行切塊 ,可得到所需要的數(shù)據(jù) 。 如在 “ 城市 、 產(chǎn)品 、 時(shí)間 ”三維立方體中進(jìn)行切塊和切片 ,可得到各城市 、 各產(chǎn)品的銷售情況 。 ? (Drill) – 鉆取包含向下鉆取 (Drilldown)和向上鉆取 (Drillup)/上卷 (Rollup)操作 , 鉆取的深度與維所劃分的層次相對(duì)應(yīng) 。 ? (Rotate)/轉(zhuǎn)軸 (Pivot) – 通過(guò)旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù) 。 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 多維分析 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 多維分析 OLAP的分析方法 (一 )切片 (slicing)、切塊 (dicing) 按時(shí)間維向上鉆取 60 按時(shí)間維向下鉆取 OLAP的分析方法 (二 )鉆取 (drilldown) 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 多維分析 OLAP的分析方法 (三 )旋轉(zhuǎn) 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 多維分析 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 多維分析 多維分析方法總結(jié) 切片是在一部分維上選定值后,關(guān)心數(shù)據(jù)在剩余維上的數(shù)據(jù)度量。 鉆取是改變維的層次,變換分析的粒度; Roll up是在某一維上將 低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù); Drill down則相反, 它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察。 旋轉(zhuǎn)式改變維的方向,即在表格中重新安排維的位臵(如行列互 換)。 主要內(nèi)容 數(shù)據(jù)倉(cāng)庫(kù)基本概念 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模式 多維分析 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 在 OLTP環(huán)境中,作業(yè)(任務(wù))的特征是具有高度選擇性 的查詢。并且此查詢通常不(應(yīng)該)包含大量的復(fù)雜的全表掃 描和連接操作。與此相反,數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市的查詢通常包 含復(fù)雜的連接操作和掃描大量的數(shù)據(jù),并且這些查詢往往包含 重復(fù)的成分。例如,某個(gè)用戶想查看各銷售區(qū)域的收入。另一 個(gè)用戶可能希望查看在所有區(qū)域中產(chǎn)品 A的銷售量在各區(qū)銷售 收入中所占的比例。某個(gè)查詢都包含掃描整個(gè)銷售表格以分組 區(qū)域數(shù)據(jù),并計(jì)算區(qū)域總量。 在這樣的環(huán)境中數(shù)據(jù)并行化和非規(guī)格化是實(shí)行高性能計(jì)算 的主要技巧(技術(shù))。當(dāng)然索引也是必需考慮的問(wèn)題。 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 非規(guī)格化數(shù)據(jù) 非規(guī)格化數(shù)據(jù)倉(cāng)庫(kù)的兩個(gè)主要優(yōu)勢(shì): 1 能夠提高多個(gè)數(shù)量級(jí)的查詢響應(yīng)時(shí)間; 因?yàn)榇笮偷?,長(zhǎng)時(shí)間的表格掃描或復(fù)雜的連接可以被簡(jiǎn)單 地查找預(yù)先計(jì)算出來(lái)的結(jié)果所取代; 2 將使系統(tǒng)資源被更加有效地利用; 能夠大量減少為獲得某個(gè)特定查詢的結(jié)果而需要處理的工 作量。 非規(guī)格化數(shù)據(jù)倉(cāng)庫(kù)一般方法:預(yù)聚集、列復(fù)制、預(yù)連接 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 非規(guī)格化數(shù)據(jù) 非規(guī)格化數(shù)據(jù)的三種技巧 1 預(yù)聚集 將一個(gè)聚集函數(shù)(例如求和求平均)的結(jié)果存儲(chǔ)以被后用 的方法稱為預(yù)聚集;該方法在數(shù)據(jù)庫(kù)中也經(jīng)常使用,因?yàn)檫@些 聚集函數(shù)的計(jì)算往往需要掃描大量的記錄,將他們計(jì)算一次后 就存儲(chǔ)在數(shù)據(jù)庫(kù)中以便后續(xù)使用是非常實(shí)際的方法。例如在稅 務(wù)系統(tǒng)中經(jīng)常將每月稅收總計(jì)和平均存儲(chǔ)在特定的表中。在數(shù) 據(jù)倉(cāng)庫(kù)中,一般將詳細(xì)數(shù)據(jù)進(jìn)行匯總。 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 非規(guī)格化數(shù)據(jù) 非規(guī)格化數(shù)據(jù)的三種技巧 2 列復(fù)制 當(dāng)用戶經(jīng)常進(jìn)行連接操作時(shí),為了較少連接的代價(jià),將經(jīng)常 連接的兩個(gè)或者多個(gè)表合并。 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 非規(guī)格化數(shù)據(jù) 非規(guī)格化數(shù)據(jù)的三種技巧 3 預(yù)連接 是列復(fù)制的極端情況。列復(fù)制只是將某個(gè)表的一列或者幾 列復(fù)制到一個(gè)表中。預(yù)連接時(shí)將某個(gè)表中的所有列復(fù)制到一個(gè) 表中。就是說(shuō)用指定的連接鍵來(lái)連接兩個(gè)(多個(gè))表格,并將 連接結(jié)果存儲(chǔ)在一個(gè)表中。表掃描的代價(jià)顯然要比表連接的代 價(jià)小。 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 非規(guī)格化數(shù)據(jù) 非規(guī)格化數(shù)據(jù)的三種技巧 非規(guī)格化的代價(jià): 增加了磁盤容量;非規(guī)格化本身需要大量的計(jì)算和合并代價(jià); 增加了數(shù)據(jù)倉(cāng)庫(kù)的刷新代價(jià)。 對(duì)于那些查詢需要非規(guī)格化需要在實(shí)際應(yīng)用用加以驗(yàn)證和改 進(jìn),也就是說(shuō)與應(yīng)用環(huán)境有關(guān)。 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 并行數(shù)據(jù)處理 數(shù)據(jù)庫(kù)的并行處理集中反映在對(duì)事務(wù)的并行處理和數(shù)據(jù)的分布存儲(chǔ)兩個(gè)方面。事務(wù)的并行處理通過(guò)利用多處理器并行和單處理器多進(jìn)程(線程)并行,大大提高數(shù)據(jù)庫(kù)系統(tǒng)的處理能力。與此相適應(yīng),將數(shù)據(jù)庫(kù)在多個(gè)磁盤上分布存儲(chǔ),可以利用多個(gè)處理器對(duì)磁盤數(shù)據(jù)進(jìn)行并行處理,從而解決磁盤 I/O瓶頸。 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 類型劃分 無(wú)共享型 共享內(nèi)存型 共享磁盤型 共享內(nèi)存 共享磁盤 磁盤 磁盤 磁盤 內(nèi)存 內(nèi)存 內(nèi)存 CPU CPU CPU 磁盤 磁盤 磁盤 內(nèi)存 內(nèi)存 內(nèi)存 網(wǎng)絡(luò) 網(wǎng)絡(luò) 網(wǎng)絡(luò) CPU CPU CPU CPU CPU CPU SN: Shared Nothing SM: Shared Memory SD: Shared Disk SM:處理器之間的通信通過(guò)共享內(nèi)存,數(shù)據(jù)處理算法比較簡(jiǎn)單。 最大的問(wèn)題是難以擴(kuò)展 SD:消除了 SM的問(wèn)題,將所有處理器連接到磁盤上,磁盤 成為可擴(kuò)展性的障礙。 SN:消除了 SM、 SD存在的問(wèn)題,可擴(kuò)展性最好,網(wǎng)絡(luò)成為主要 瓶頸。 瓶頸 SM 內(nèi)存 SD 磁盤 SN 網(wǎng)絡(luò) 類型 第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 并行數(shù)據(jù)處理 多數(shù)文獻(xiàn)將數(shù)據(jù)放臵歸類于靜態(tài)負(fù)載均衡類。研究將關(guān)系劃分并放臵到群集 的多個(gè)節(jié)點(diǎn)。數(shù)據(jù)劃分是查詢處理并行化的基礎(chǔ),研究表明,數(shù)據(jù)劃分對(duì)并 行數(shù)據(jù)處理系統(tǒng)的性能具有非常重大的影響。數(shù)據(jù)放臵的均衡性是決定系統(tǒng) 效率的關(guān)鍵因素之一。 一個(gè)包含大量數(shù)據(jù)的表節(jié)點(diǎn)組第 2章 數(shù)據(jù)倉(cāng)庫(kù) 高性能物理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 并行數(shù)據(jù)處理
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1