freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

最新網(wǎng)絡(luò)技術(shù)和電子商務(wù)設(shè)計(jì)-資料下載頁(yè)

2025-07-30 06:03本頁(yè)面
  

【正文】 部門的數(shù)據(jù),而不同系統(tǒng)的數(shù)據(jù)難以集成。⑶ 由于訪問數(shù)據(jù)的能力不足,所以它對(duì)海量數(shù)據(jù)的訪問性能明顯下降。隨著C∕S技術(shù)的成熟和并行數(shù)據(jù)庫(kù)的發(fā)展,信息處理技術(shù)的發(fā)展趨勢(shì)是從大量的事務(wù)型數(shù)據(jù)庫(kù)中抽取數(shù)據(jù),并將其清理、轉(zhuǎn)換為新的存儲(chǔ)格式,即為決策目標(biāo),而把數(shù)據(jù)聚合在一種特殊的格式中。隨著此過程的發(fā)展和完善,這種支持決策的、特殊的數(shù)據(jù)存儲(chǔ)即被稱為數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse,DW)。 數(shù)據(jù)倉(cāng)庫(kù)的概念數(shù)據(jù)倉(cāng)庫(kù)并不是一個(gè)新的平臺(tái),它仍然建立在數(shù)據(jù)庫(kù)管理系統(tǒng)基礎(chǔ)上,只是一個(gè)新的概念。從用戶的角度來(lái)看,數(shù)據(jù)倉(cāng)庫(kù)是一些數(shù)據(jù)、過程、工具和設(shè)施,它能夠管理完備的、及時(shí)的、準(zhǔn)確的和可理解的業(yè)務(wù)信息,并把這種信息提交給授權(quán)的個(gè)人,使他們有效地做出決定。1. 數(shù)據(jù)倉(cāng)庫(kù)的定義數(shù)據(jù)倉(cāng)庫(kù)之父W.H.Inmon給數(shù)據(jù)倉(cāng)庫(kù)下的定義是:數(shù)據(jù)倉(cāng)庫(kù)是支持管理決策過程的、面向主題的、集成的、隨時(shí)間變化的、但信息本身相對(duì)穩(wěn)定的數(shù)據(jù)集合。其中,“主題”是指用戶使用數(shù)據(jù)倉(cāng)庫(kù)輔助決策時(shí)所關(guān)心的重點(diǎn)問題,每一個(gè)主題對(duì)應(yīng)一個(gè)客觀分析領(lǐng)域,如銷售、成本、利潤(rùn)的情況等。那么,所謂“面向主題”就是指數(shù)據(jù)倉(cāng)庫(kù)中的信息是按主題組織的,按主題來(lái)提供信息?!凹傻摹笔侵笖?shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)不是業(yè)務(wù)處理系統(tǒng)數(shù)據(jù)的簡(jiǎn)單拼湊與匯總,而是經(jīng)過系統(tǒng)地加工整理,是相互一致的、具有代表性的數(shù)據(jù)。所謂“隨時(shí)間變化”,是指數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的是一個(gè)時(shí)間段的數(shù)據(jù),而不僅僅是某一個(gè)時(shí)的數(shù)據(jù),所以主要用于進(jìn)行時(shí)間趨勢(shì)分析。一般數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)時(shí)限為5年至10年,數(shù)據(jù)量也比較大,一般為10GB左右?!靶畔⒈旧硐鄬?duì)穩(wěn)定”,是指數(shù)據(jù)一旦進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),一般情況下將被長(zhǎng)期保留,變更很少。從數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)來(lái)源及實(shí)施環(huán)境來(lái)看,它離不開數(shù)據(jù)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與數(shù)據(jù)庫(kù)技術(shù)有緊密聯(lián)系,二者能相互連通,相互支持,但又有著重要差別。主要是數(shù)據(jù)倉(cāng)庫(kù)側(cè)重于決策分析,而數(shù)據(jù)庫(kù)則側(cè)重于操作和管理。數(shù)據(jù)倉(cāng)庫(kù)作為決策支持系統(tǒng)(DSS)的一種有效、可行和體系化解決方案,包括了以下三個(gè)方面的內(nèi)容:⑴ 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)用于數(shù)據(jù)的存儲(chǔ)和組織:⑵ 聯(lián)機(jī)分析技術(shù)(On-Line Analytical Processing,OLAP)集中于數(shù)據(jù)的分析;⑶ 數(shù)據(jù)挖掘技術(shù)(Data Mining,DM)致力于知識(shí)的自動(dòng)發(fā)現(xiàn)。2. 數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)⑴ 數(shù)據(jù)倉(cāng)庫(kù)的邏輯結(jié)構(gòu)和物理結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)是存儲(chǔ)數(shù)據(jù)的一種組織形式,它從傳統(tǒng)數(shù)據(jù)庫(kù)中獲得原始數(shù)據(jù),先按輔助決策的主題要求形成當(dāng)前基本數(shù)據(jù)層,再按綜合決策的要求形成綜合數(shù)據(jù)層(又可分為輕度綜合層和高度綜合層)。隨著時(shí)間的推移,由時(shí)間控制機(jī)制將當(dāng)前基本數(shù)據(jù)層轉(zhuǎn)為歷史數(shù)據(jù)層??梢姅?shù)據(jù)倉(cāng)庫(kù)中的邏輯結(jié)構(gòu)數(shù)據(jù)由3層到4層數(shù)據(jù)組成,它們均由元數(shù)據(jù)(MetaData)組織而成。數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的物理存儲(chǔ)形式有多維數(shù)據(jù)庫(kù)組織形式(空間超立方體形式)和基于關(guān)系數(shù)據(jù)庫(kù)組織形式(由關(guān)系型事實(shí)表和維表組成)。⑵ 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)(DWS)由數(shù)據(jù)倉(cāng)庫(kù)、倉(cāng)庫(kù)管理和分析工具三部分組成。①源數(shù)據(jù):數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)來(lái)源于多個(gè)數(shù)據(jù)源,包括企業(yè)內(nèi)部數(shù)據(jù)、市場(chǎng)調(diào)查報(bào)告及各種文檔之類的外部數(shù)據(jù)。②倉(cāng)庫(kù)管理:在確定數(shù)據(jù)倉(cāng)庫(kù)信息需求后,首先進(jìn)行數(shù)據(jù)建模,然后確定從源數(shù)據(jù)到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)抽取、清理和轉(zhuǎn)換過程,最后劃分維數(shù)及確定數(shù)據(jù)倉(cāng)庫(kù)的物理存儲(chǔ)結(jié)構(gòu)。元數(shù)據(jù)是數(shù)據(jù)倉(cāng)庫(kù)的核心,它用于存儲(chǔ)數(shù)據(jù)模型和定義數(shù)據(jù)結(jié)構(gòu)、轉(zhuǎn)換規(guī)劃、倉(cāng)庫(kù)結(jié)構(gòu)、控制信息等。倉(cāng)庫(kù)管理包括對(duì)數(shù)據(jù)的安全、歸檔、備份、維護(hù)、恢復(fù)等工作,這些工作需要利用數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)的功能。③分析工具:用于完成實(shí)際決策問題所需的各種查詢檢索工具、多維數(shù)據(jù)的OLAP分析工具、數(shù)據(jù)開采的DM工具等,以實(shí)現(xiàn)決策支持系統(tǒng)的各種要求。⑶數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的C∕S結(jié)構(gòu)形式數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用是一個(gè)典型的C∕S結(jié)構(gòu)。其客戶端的工作包括客戶交互、格式化查詢及結(jié)果和報(bào)表生成等。服務(wù)器端完成各種輔助決策的SQL查詢、復(fù)雜的計(jì)算和各類綜合功能等?,F(xiàn)在,一種越來(lái)越普遍的形式是三層結(jié)構(gòu),即在客戶與服務(wù)器之間增加一個(gè)多維數(shù)據(jù)分析服務(wù)器。OLAP服務(wù)器能加強(qiáng)和規(guī)范決策支持的服務(wù)工作,集中和簡(jiǎn)化原客戶端和DW服務(wù)器的部分工作,降低系統(tǒng)數(shù)據(jù)傳輸量,因此工作效率更高。 數(shù)據(jù)倉(cāng)庫(kù)的關(guān)鍵技術(shù)1. 數(shù)據(jù)的抽取數(shù)據(jù)的抽取是數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的人口。由于數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)獨(dú)立的數(shù)據(jù)環(huán)境,所以它需要通過抽取過程將數(shù)據(jù)從聯(lián)機(jī)事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源、脫機(jī)的數(shù)據(jù)存儲(chǔ)介質(zhì)中導(dǎo)人數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)抽取在技術(shù)上主要涉及互連、復(fù)制、轉(zhuǎn)換、調(diào)度和監(jiān)控等幾個(gè)方面。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)并不要求與聯(lián)機(jī)事務(wù)處理系統(tǒng)保持實(shí)時(shí)的同步,因此數(shù)據(jù)抽取可以定時(shí)進(jìn)行,但多個(gè)抽取操作的時(shí)間、相互的順序、成敗對(duì)數(shù)據(jù)倉(cāng)庫(kù)中信息的有效性卻是至關(guān)重要的。在技術(shù)發(fā)展上,數(shù)據(jù)抽取所涉及的單個(gè)技術(shù)環(huán)節(jié)都已相對(duì)成熟,其中有些是躲不開編程的,但整體的集成度還很不夠。目前市面上所提供的大多是數(shù)據(jù)抽取工具。這些工具通過用戶選定源數(shù)據(jù)和目標(biāo)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,會(huì)自動(dòng)生成數(shù)據(jù)抽取的代碼。但抽取工具支持的數(shù)據(jù)種類是有限的;同時(shí)數(shù)據(jù)抽取過程涉及到數(shù)據(jù)的轉(zhuǎn)換,它是一個(gè)與實(shí)際應(yīng)用密切相關(guān)的部分,其復(fù)雜性使得不可嵌入用戶編程的抽取工具往往不能滿足要求。因此,在實(shí)際的數(shù)據(jù)倉(cāng)庫(kù)實(shí)施過程中往往不一定要使用抽取工具。整個(gè)抽取過程能否因工具的使用而納入有效的管理、調(diào)度和維護(hù)則更為重要。2. 數(shù)據(jù)存儲(chǔ)和管理數(shù)據(jù)倉(cāng)庫(kù)的真正關(guān)鍵是數(shù)據(jù)的存儲(chǔ)和管理。數(shù)據(jù)倉(cāng)庫(kù)的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫(kù)的特性,同時(shí)也決定了其對(duì)外部數(shù)據(jù)的表現(xiàn)形式。要決定采用什么產(chǎn)品和技術(shù)來(lái)建立數(shù)據(jù)倉(cāng)庫(kù)核心,則需要從以下幾個(gè)方面進(jìn)行分析:⑴ 對(duì)大量數(shù)據(jù)的存儲(chǔ)和管理數(shù)據(jù)倉(cāng)庫(kù)中所涉及的數(shù)據(jù)量比傳統(tǒng)事務(wù)處理大得多,且隨時(shí)間的推移而累積。從現(xiàn)有技術(shù)和產(chǎn)品來(lái)看,只有關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)能夠擔(dān)當(dāng)此任。關(guān)系數(shù)據(jù)庫(kù)經(jīng)過近30年的發(fā)展,在數(shù)據(jù)存儲(chǔ)和管理方面已經(jīng)非常成熟,非其他數(shù)據(jù)管理系統(tǒng)可比。目前不少關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)已支持?jǐn)?shù)據(jù)分散技術(shù),即能夠?qū)⒁粋€(gè)大的數(shù)據(jù)庫(kù)表分散在多個(gè)物理存儲(chǔ)設(shè)備中,進(jìn)一步增強(qiáng)了系統(tǒng)管理大數(shù)據(jù)量的擴(kuò)展能力。采用關(guān)系數(shù)據(jù)庫(kù)管理數(shù)百個(gè)GB甚至到TB的數(shù)據(jù)已是一件平常的事情。一些廠商還專門考慮大數(shù)據(jù)量的系統(tǒng)備份問題,好在數(shù)據(jù)倉(cāng)庫(kù)對(duì)聯(lián)機(jī)備份的要求并不高。⑵ 并行處理在傳統(tǒng)聯(lián)機(jī)事務(wù)處理應(yīng)用中,用戶訪問系統(tǒng)的特點(diǎn)是短小而密集;對(duì)于一個(gè)多處理機(jī)系統(tǒng)來(lái)說(shuō),能夠?qū)⒂脩舻恼?qǐng)求進(jìn)行均衡分擔(dān)是關(guān)鍵,這便是并發(fā)操作。而在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,用戶訪問系統(tǒng)的特點(diǎn)是龐大而稀疏,每一個(gè)查詢和統(tǒng)計(jì)都很復(fù)雜,但訪問的頻率并不是很高。此時(shí)系統(tǒng)需要有能力將所有的處理機(jī)調(diào)動(dòng)起來(lái)為這一個(gè)復(fù)雜的查詢請(qǐng)求服務(wù),將該請(qǐng)求并行處理。因此,并行處理技術(shù)在數(shù)據(jù)倉(cāng)庫(kù)中比以往更加重要。目前,關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)在并行處理方面已能做到對(duì)查詢語(yǔ)句的分解并行、基于數(shù)據(jù)分散的并行以及支持跨平臺(tái)多處理機(jī)的群集環(huán)境和MPP環(huán)境,能夠支持多達(dá)上百個(gè)處理機(jī)的硬件系統(tǒng)并保持性能的擴(kuò)展能力。⑶ 決策支持查詢的優(yōu)化這個(gè)問題主要是針對(duì)關(guān)系數(shù)據(jù)庫(kù)而言,因?yàn)槠渌麛?shù)據(jù)管理環(huán)境連基本的通用查詢能力還不完善。在技術(shù)上,針對(duì)決策支持的優(yōu)化涉及數(shù)據(jù)庫(kù)系統(tǒng)的索引機(jī)制、查詢優(yōu)化器、連接策略、數(shù)據(jù)排序和采樣等諸多部分。普通關(guān)系數(shù)據(jù)庫(kù)采用B樹類的索引,對(duì)干性別、年齡、地區(qū)等具有大量重復(fù)值的字段幾乎沒有效果。而擴(kuò)充的關(guān)系數(shù)據(jù)庫(kù)則引入了位圖索引的機(jī)制,以二進(jìn)制位表示字段的狀態(tài),將查詢過程變?yōu)楹Y選過程,單個(gè)計(jì)算機(jī)的基本操作便可篩選多條記錄。由于數(shù)據(jù)倉(cāng)庫(kù)中各數(shù)據(jù)表的數(shù)據(jù)量往往極不均勻,普通查詢優(yōu)化器所得出的最佳查詢路徑可能不是最優(yōu)的,因此,面向決策支持的關(guān)系數(shù)據(jù)庫(kù)在查詢優(yōu)化器上也做了改進(jìn),同時(shí)根據(jù)索引的使用特性增加了多重索引掃描的能力。以關(guān)系數(shù)據(jù)庫(kù)建立的數(shù)據(jù)倉(cāng)庫(kù)在應(yīng)用時(shí)會(huì)遇到大量的表間連接操作,而連接操作對(duì)于關(guān)系數(shù)據(jù)庫(kù)來(lái)說(shuō)是一件耗時(shí)的事情。擴(kuò)充的關(guān)系庫(kù)中對(duì)連接操作可以做預(yù)先的定義,我們稱之為連接索引,使得數(shù)據(jù)庫(kù)在執(zhí)行查詢時(shí)可直接獲取數(shù)據(jù)而不必實(shí)施具體的連接操作。數(shù)據(jù)倉(cāng)庫(kù)的查詢常常只需要數(shù)據(jù)庫(kù)中的部分記錄,如最大的前50家客戶等等。普遍關(guān)系數(shù)據(jù)庫(kù)沒有提供這樣的查詢能力,因此只好將整個(gè)表的記錄進(jìn)行排序,從而耗費(fèi)了大量的時(shí)間。決策支持的關(guān)系數(shù)據(jù)庫(kù)在此做了改進(jìn),提供了這一功能。此外,數(shù)據(jù)倉(cāng)庫(kù)的查詢并不需要像事務(wù)處理系統(tǒng)那樣精確,但在大容量數(shù)據(jù)環(huán)境中需要有足夠短的系統(tǒng)響應(yīng)時(shí)間。因此,一些數(shù)據(jù)庫(kù)系統(tǒng)增加了采樣數(shù)據(jù)的查詢能力,在精確度允許的范圍內(nèi),可大幅度提高系統(tǒng)的查詢效率。總之,將普通關(guān)系數(shù)據(jù)庫(kù)改造成適合擔(dān)當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的服務(wù)器有許多工作可以做,它已成為關(guān)系數(shù)據(jù)庫(kù)技術(shù)的一個(gè)重要研究課題和發(fā)展方向。可見,對(duì)于決策支持的擴(kuò)充是傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)市場(chǎng)的重要技術(shù)措施。⑷ 支持多維分析的查詢模式用戶在使用數(shù)據(jù)倉(cāng)庫(kù)時(shí)的訪問方式與傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)有很大的不同。對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的訪問往往不是簡(jiǎn)單的表和記錄的查詢,而是基于用戶業(yè)務(wù)的分析模式,即聯(lián)機(jī)分析。它的特點(diǎn)是將數(shù)據(jù)想象成多維的立方體,用戶的查詢便相當(dāng)于在其中的部分維(棱)上施加條件,對(duì)立方體進(jìn)行切片、分割,得到的結(jié)果則是數(shù)值的矩陣或向量,并將其制成圖表或輸入數(shù)據(jù)統(tǒng)計(jì)的算法。關(guān)系數(shù)據(jù)庫(kù)本身沒有提供這種多維分析的查詢功能,而且在數(shù)據(jù)倉(cāng)庫(kù)發(fā)展的早期,人們發(fā)現(xiàn)采用關(guān)系數(shù)據(jù)庫(kù)去實(shí)現(xiàn)這種多維查詢模式非常低效、查詢處理的過程也難以自動(dòng)化。為此,人們提出了多維數(shù)據(jù)庫(kù)的概念。多維數(shù)據(jù)庫(kù)是一種以多維數(shù)據(jù)存儲(chǔ)形式來(lái)組織數(shù)據(jù)的數(shù)據(jù)管理系統(tǒng),它不是關(guān)系型數(shù)據(jù)庫(kù),在使用時(shí)需要將數(shù)據(jù)從關(guān)系數(shù)據(jù)庫(kù)中轉(zhuǎn)載到多維數(shù)據(jù)庫(kù)中方可訪問。采用多維數(shù)據(jù)庫(kù)實(shí)現(xiàn)的聯(lián)機(jī)分析應(yīng)用我們稱之為MOLAP。多維數(shù)據(jù)庫(kù)在針對(duì)小型的多維分析應(yīng)用有較好的效果,但它缺少關(guān)系數(shù)據(jù)庫(kù)所擁有的并行處理及大規(guī)模數(shù)據(jù)管理擴(kuò)展性,因此難以承擔(dān)大型數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用。而關(guān)系數(shù)據(jù)庫(kù)若采用“星型模式”來(lái)組織數(shù)據(jù)就能很好地解決多維分析的問題。“星型模式”不過是數(shù)據(jù)庫(kù)設(shè)計(jì)中數(shù)據(jù)表之間的一種關(guān)聯(lián)形式,它的巧妙之處在于能夠找到一個(gè)固定的算法,將用戶的多維查詢請(qǐng)求轉(zhuǎn)換成針對(duì)該數(shù)據(jù)模式的標(biāo)準(zhǔn)SQL語(yǔ)句,而且該語(yǔ)句是最優(yōu)化的。采用關(guān)系數(shù)據(jù)庫(kù)實(shí)現(xiàn)的聯(lián)機(jī)分析應(yīng)用稱為ROLAP。目前,大多數(shù)廠商提供的數(shù)據(jù)倉(cāng)庫(kù)解決方案都采用ROLAP。3. 數(shù)據(jù)的表現(xiàn)數(shù)據(jù)表現(xiàn)是數(shù)據(jù)倉(cāng)庫(kù)的門面。它們主要集中在聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘方面。⑴ 聯(lián)機(jī)分析處理技術(shù)聯(lián)機(jī)分析處理是針對(duì)特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析,通過對(duì)信息進(jìn)行快速、穩(wěn)定、一致和交互式的存取,對(duì)數(shù)據(jù)進(jìn)行多層次、多階段的分析處理,以獲得高度歸納的分析結(jié)果。聯(lián)機(jī)分析處理是一種自上而下、不斷深入的分析工具,在用戶提出問題或假設(shè)之后,它負(fù)責(zé)提取出關(guān)于此問題的詳細(xì)信息,并以一種比較直觀的方式呈現(xiàn)給用戶。聯(lián)機(jī)分析處理要求按多維方式組織企業(yè)的數(shù)據(jù),傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)難以勝任。為此,人們提出了多維數(shù)據(jù)庫(kù)的概念。正是這一技術(shù)的發(fā)展使決策分析中的數(shù)據(jù)結(jié)構(gòu)和分析方法相分離,才有可能研制出通用而靈活的分析工具,并使分析工具產(chǎn)品化。維是人們觀察現(xiàn)實(shí)世界的角度,決策分析需要從不同的角度觀察分析數(shù)據(jù),以多維數(shù)據(jù)為核心的多維數(shù)據(jù)分析是決策的主要內(nèi)容。多維數(shù)據(jù)庫(kù)是以多維方式組織數(shù)據(jù)的。目前,聯(lián)機(jī)分析處理的工具可分為兩大類,一類是基于多維數(shù)據(jù)庫(kù)的,另一類是基于關(guān)系數(shù)據(jù)庫(kù)的。兩者的相同點(diǎn)是基本數(shù)據(jù)源仍是數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù),都是基于關(guān)系數(shù)據(jù)模型的,都向用戶顯示多維數(shù)據(jù)視圖;不同點(diǎn)在于,前者是把分析所需的數(shù)據(jù)從數(shù)據(jù)倉(cāng)庫(kù)中抽取出來(lái),物理地組織成多維數(shù)據(jù)庫(kù),而后者則是利用關(guān)系表來(lái)模擬多維數(shù)據(jù),并不是物理地生成多維數(shù)據(jù)庫(kù)。⑵ 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘的基本思想是從數(shù)據(jù)中抽取有價(jià)值的信息,其目的是幫助決策者尋找數(shù)據(jù)間潛在的關(guān)聯(lián),發(fā)現(xiàn)被忽略的要素,而這些信息對(duì)預(yù)測(cè)趨勢(shì)和決策行為也許是十分有用的。從數(shù)據(jù)庫(kù)的角度看,數(shù)據(jù)挖掘就是這樣一個(gè)過程,它從數(shù)據(jù)庫(kù)的數(shù)據(jù)中識(shí)別出有效的、新穎的、具有潛在效用的并最終可理解的信息(如規(guī)則、約束等)的非平凡過程。非平凡是一個(gè)數(shù)學(xué)概念,即數(shù)據(jù)挖掘既不是把數(shù)據(jù)全部抽取,也不是一點(diǎn)兒也不抽取,而是抽取出隱含的、未知的和可能有用的信息。從決策支持的角度看,數(shù)據(jù)挖掘是一種決策支持的過程,主要基于人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)庫(kù)技術(shù)等多種技術(shù),能高度自動(dòng)地分析企業(yè)原有的數(shù)據(jù),進(jìn)行歸納推理,從中挖掘出潛在的模式,預(yù)測(cè)客戶的行為,幫助企業(yè)的決策者調(diào)整市場(chǎng)策略,從而減少風(fēng)險(xiǎn),輔助做出正確的決策。它是提高商業(yè)和科學(xué)決策過程中的質(zhì)量和效率的一種新方法。數(shù)據(jù)挖掘和聯(lián)機(jī)分析處理都可以在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行分析,以輔助決策,那么它們之間是否有差別呢?答案是肯定的。從某種意義上來(lái)說(shuō),聯(lián)機(jī)分析處理還是一種傳統(tǒng)的決策支持方法。即在某個(gè)假設(shè)的前提下通過數(shù)據(jù)查詢和分析來(lái)驗(yàn)證或否定這個(gè)假設(shè),所以聯(lián)機(jī)分析處理是一種驗(yàn)證型的分析。一般來(lái)說(shuō)驗(yàn)證型的分析有如下局限性:①常常需要以假設(shè)為基礎(chǔ)。用戶的假設(shè)能力有限,往往只能局限于對(duì)幾種變量進(jìn)行假設(shè)。②聯(lián)機(jī)分析處理需要對(duì)用戶的需求有全面而深入的了解,然而實(shí)際上有些時(shí)候用戶的需求并不是確定的。③抽取信息的質(zhì)量依賴于用戶對(duì)結(jié)果的解釋,容易導(dǎo)致錯(cuò)誤。可以看出,聯(lián)機(jī)分析處理是由用戶驅(qū)動(dòng)的,很大程度上受到用戶水平的限制。與聯(lián)機(jī)分析處理不同,數(shù)據(jù)挖掘是數(shù)據(jù)驅(qū)動(dòng)的,是一種真正的知識(shí)發(fā)現(xiàn)方法。使用數(shù)據(jù)挖掘工具,用戶不必提出確切的要求,系統(tǒng)能夠根據(jù)數(shù)據(jù)本身的規(guī)律性,自動(dòng)地挖掘數(shù)據(jù)潛在的模式,或通過聯(lián)想,建立新的業(yè)務(wù)模型,幫助決策者調(diào)整市場(chǎng)策略,并找到正確的決策。這顯然利于發(fā)現(xiàn)未知的事實(shí)。從數(shù)據(jù)分析深度的角度來(lái)看,聯(lián)機(jī)分析處理位于較淺的層次,而數(shù)據(jù)挖掘則處于較深的層次。所以,聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘的主要差別就在于是否能自動(dòng)地進(jìn)行數(shù)據(jù)分析。4. 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的技術(shù)咨詢?cè)跀?shù)據(jù)倉(cāng)庫(kù)的實(shí)施過程中,有一些更為基本的問題需要解答。它們包括:數(shù)據(jù)倉(cāng)庫(kù)提供給哪些部門使用?不同的部門怎樣發(fā)揮數(shù)據(jù)倉(cāng)庫(kù)的決策效益?數(shù)藥倉(cāng)庫(kù)需要存放哪些數(shù)據(jù)?這些數(shù)據(jù)以什么樣的結(jié)構(gòu)存放?數(shù)據(jù)從哪里裝載?裝載的頻率多少為合適?需要購(gòu)置哪些數(shù)據(jù)管理的產(chǎn)品和工具來(lái)建立數(shù)據(jù)倉(cāng)庫(kù)等等。這些問題依賴于特定的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),屬于技術(shù)咨詢的范疇。 數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)1. 數(shù)據(jù)倉(cāng)庫(kù)的處理過程人們總喜歡問:數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)庫(kù)有什么不同?事實(shí)上,數(shù)據(jù)庫(kù)是一種通用的平臺(tái),用來(lái)管理企業(yè)的數(shù)據(jù);而數(shù)據(jù)倉(cāng)庫(kù)則主要是一種概念,在此概念下進(jìn)行的構(gòu)造過程稱為數(shù)據(jù)倉(cāng)庫(kù)處理。因此,數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)是一種解決問題的過程,而不是一個(gè)可以買到的現(xiàn)成產(chǎn)品。數(shù)據(jù)倉(cāng)庫(kù)處理
點(diǎn)擊復(fù)制文檔內(nèi)容
電大資料相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1