freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

a數(shù)據(jù)倉庫概述ppt課件(編輯修改稿)

2025-06-08 04:59 本頁面
 

【文章內(nèi)容簡介】 季度 二季度 三季度 四季度 南京 廣州 手機 空調(diào) 下鉆( drill_down): 按時間分到月、甚至天為單位 6 6 8 8 17 16 14 13 時間 南京 廣州 手機 8 13 11 13 14 14 13 12 16 10 10 15 13 11 10 16 空調(diào) 1 2 3 4 5 6 7 8 9 10 11 12 下鉆 30 數(shù)據(jù)倉庫的 粒度: 反映數(shù)據(jù)的粗細程度 若要分析去年春節(jié)手機打折銷售后的銷售情況,此時在數(shù)據(jù)倉庫中已經(jīng)無法進行了。只有將粒度確定為“天”才有可能。 銷售數(shù)據(jù)庫存儲了每一筆業(yè)務(wù)的細節(jié),在分析時對每一筆分析是無意義的。因此可以考慮數(shù)據(jù)倉庫的粒度級別以星期為單位,即在數(shù)據(jù)從數(shù)據(jù)庫裝入數(shù)據(jù)倉庫時,按星期匯總。由星期通過計算能得到月、季度、年的匯總??梢哉J為該數(shù)據(jù)倉庫在時間上有 多重粒度。 粒度細:數(shù)據(jù)分析靈活,但存儲空間大,計算量大 粒度粗:存儲空間小,但有時無法回答一些比較細節(jié)的問題 31 分割 目的:提高效率 含義:將數(shù)據(jù)分散到各自的物理單元中,以便能分別獨立處理。 分割標準:日期、地域、業(yè)務(wù)領(lǐng)域等。 在數(shù)據(jù)倉庫中,圍繞分割問題的關(guān)鍵不是對數(shù)據(jù)該不該分割,而是如何分割。 對數(shù)據(jù)倉庫中,如果粒度和分割做得很好的話,則數(shù)據(jù)倉庫設(shè)計和實現(xiàn)的幾乎所有其它問題都解決了。 32 數(shù)據(jù)倉庫的結(jié)構(gòu) 早期細節(jié)級 當前細節(jié)級 輕度綜合級 數(shù)據(jù)集市 高度綜合級 元數(shù)據(jù) 操作型轉(zhuǎn)換 33 OLAP數(shù)據(jù)立方體的計算(物化) 數(shù)據(jù)立方體的個數(shù) 有產(chǎn)品 (type)、城市 (city)、日期 (date)三個維,則: all year type city type year city date city type city type date 一般,若有 n個維,則不同立方體的個數(shù)是: nnnnn ccc 2..10 ????34 實際維上有分層,如(年、季度、月、星期、日),所以實際的立方體個數(shù)是極大的。所以,實時計算的工作量極大,但全部事先計算,則存儲量又極大。 所以,在 OLAP中一般采用部分物化,即有選擇的事先計算。 35 三、數(shù)據(jù)挖掘 OLAP使用戶能利用工具快速的查詢數(shù)據(jù)。但不能解決哪些信息是有意義的,哪些是無意義的。 在 OLAP使用中,一般是用戶提出一個假設(shè)(模式),通過OLAP去驗證假定或從返回的數(shù)據(jù)信息中總結(jié)出某種規(guī)律 。有時返回的信息太多而無法處理。(比如在搜索引擎查“數(shù)據(jù)挖掘”返回許多頁面,而有關(guān)的“數(shù)據(jù)開采”, “知識發(fā)現(xiàn)”又沒有返回)。 二十年前查不到數(shù)據(jù)是因為數(shù)據(jù)太少,而今天數(shù)據(jù)查不到是因為數(shù)據(jù)太多。 36 若把大量的數(shù)據(jù)比做藏有金子的山, OLAP提供了在山中各處迅速地觀察工具,它能讓你迅速的到達你想到的地方。但不能告訴你是否此處有價值。如果山是巨大的,發(fā)現(xiàn)其中重要的有價值的位置本身是非常耗時的。 37 數(shù)據(jù)挖掘( Data mining ) 從大量的數(shù)據(jù)集合中的數(shù)據(jù)中提取有用的信息 ( 不平常的 , 暗藏的 , 先前未知的和很可能有用的 )。 數(shù)據(jù)挖掘 就是對觀測到的數(shù)據(jù)集(經(jīng)常是很龐大的)進行分析,目的是發(fā)現(xiàn)未知的關(guān)系和以數(shù)據(jù)擁有者可以理解并對其有價值的新穎方式來總結(jié)數(shù)據(jù)。 38 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫關(guān)系 ? 數(shù)據(jù)倉庫的目標是提供 OLAP及數(shù)據(jù)挖掘功能。 ? 數(shù)據(jù)挖掘的數(shù)據(jù)源不一定是數(shù)據(jù)倉庫 ? 數(shù)據(jù)倉庫允許你建立“數(shù)據(jù)山”,而數(shù)據(jù)挖掘允許你在山 中篩選數(shù)據(jù),得到對你有用的信息 39 數(shù)據(jù)挖掘的過程 Data Cleaning 數(shù)據(jù)整理 Data Integration數(shù)據(jù)集成 數(shù)據(jù)庫 數(shù)據(jù) 倉庫 相關(guān)任務(wù)數(shù)據(jù) 挑選 數(shù)據(jù)挖掘 模式評估 Pattern Evaluation 40 數(shù)據(jù)倉庫的投資回報率( ROI) 96年, IDC( Intenational Data Corporation)做了關(guān)于數(shù)據(jù)倉庫經(jīng)濟價值的研究。報告指出:對 IT業(yè)的投資還未產(chǎn)生預(yù)期的利潤。 94年全世界投入了 4640億美元用于開發(fā)新技術(shù)。企業(yè)、公司的高級管理人員開始懷疑投資 IT業(yè)到底有沒有利益? ROI底的原因是:傳統(tǒng)的計算技術(shù)只重視如何自動完成職員的日常工作、提高已有過程的效率和收集數(shù)據(jù)。不幸的是雖然收集了大量數(shù)據(jù),但直到近年,這些數(shù)據(jù)的價值才被發(fā)現(xiàn)和利用。 隨著數(shù)據(jù)倉庫的到來,公司可以把收集到的信息加以利用以獲得較大的投資回報率。 IDC的報告認為實現(xiàn)數(shù)據(jù)倉庫有較大經(jīng)濟回報 ,原因是: 41 ? 能應(yīng)用到商業(yè)過程中,對商業(yè)過程做完整的經(jīng)濟分析。這時的機構(gòu)能在了解整個系統(tǒng)的基礎(chǔ)上,而不是不完整的數(shù)據(jù)上做估計和決策。 ? 能自動創(chuàng)建一個完整的企業(yè)范圍內(nèi)的信息倉儲,而不是開發(fā)一些單獨的決策支持系統(tǒng)和相應(yīng)的基礎(chǔ)設(shè)施。 ? 開發(fā)、部署和維護大型信息數(shù)據(jù)存儲花費的硬件、軟件和存儲代價繼續(xù)下降。 ? 數(shù)據(jù)倉庫可以輕易拓展到能產(chǎn)生巨大利益的戰(zhàn)略決策過程中。 ? 能同時從宏觀和微觀上了解和管理企業(yè)。這可以節(jié)省無數(shù)的手工勞動,避免由不完全或不正確數(shù)據(jù)得出的假設(shè)導(dǎo)致的錯誤 ——這種錯誤有時是致命的 。 42 IDC的研究結(jié)論認為: 數(shù)據(jù)挖掘平均三年的 ROI能達到 401%,在被調(diào)查的企業(yè)中,有超過 90%的企業(yè)的 ROI超過了 40%, 50%的企業(yè)的 ROI超過了 160%, 25%的企業(yè)的 ROI超過了 600% 43 四、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘產(chǎn)品 單點產(chǎn)品 僅局限于數(shù)據(jù)倉庫方案實施中的一部分或某一特定功能,主要是作為第三方產(chǎn)品或者和其它公司的產(chǎn)品結(jié)合起來進行使用。 44 Business Objects ?主要工具: BusinessObjects 是集成查詢,報表和分析功能的工具; Webintelligence 是世界上第一個通過 Web進行查詢、報表和分析的決策支持工具; Businessquery 是第一
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1