freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第2章-數(shù)據(jù)倉(cāng)庫(kù)與olap技術(shù)(已修改)

2025-08-27 23:02 本頁面
 

【正文】 數(shù)據(jù)挖掘 第 2章 數(shù)據(jù)倉(cāng)庫(kù)與 OLAP ? 本章學(xué)習(xí)目標(biāo): ?掌握數(shù)據(jù)倉(cāng)庫(kù)的定義,四個(gè)基本特征 ?理解數(shù)據(jù)集市的概念,與數(shù)據(jù)倉(cāng)庫(kù)區(qū)分 ?了解數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) ?掌握數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)組織方式 ?掌握數(shù)據(jù)處理過程 ?熟悉元數(shù)據(jù)的概念、元數(shù)據(jù)管理的原理 ?掌握 OLAP的定義和特點(diǎn) ?熟悉 OLAP的數(shù)據(jù)模型 ?掌握 OALP的多維數(shù)據(jù)分析 ?熟悉數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì),包括數(shù)據(jù)模型的設(shè)計(jì)、粒度、維度設(shè)計(jì) 數(shù)據(jù)挖掘 第 2章 數(shù)據(jù)倉(cāng)庫(kù)與 OLAP ? 數(shù)據(jù)倉(cāng)庫(kù)定義 ? 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu) ? 數(shù)據(jù)組織結(jié)構(gòu)和形式 ? 數(shù)據(jù)抽取 E、轉(zhuǎn)換 T和裝載 L( ETL) ? 元數(shù)據(jù)管理 ? OLAP的定義和特點(diǎn) ? OLAP的數(shù)據(jù)模型 ? OALP的多維數(shù)據(jù)分析 ? 數(shù)據(jù)倉(cāng)庫(kù)與 OLAP范例 數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù)定義 ?William :數(shù)據(jù)倉(cāng)庫(kù)是一個(gè) 面向主題的 、 集成的 、 非易失的 且 隨時(shí)間變化的 數(shù)據(jù)集合,用于支持管理人員的決策。 數(shù)據(jù)倉(cāng)庫(kù)之父 Bill Inmon 數(shù)據(jù)挖掘 四個(gè)基本特征 ?數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是面向主題的 ?數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是集成的 ?數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是非易失的 ?數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是隨時(shí)間不斷變化的 數(shù)據(jù)挖掘 面向主題 ?主題( Subject) :特定的數(shù)據(jù)分析領(lǐng)域與目標(biāo)。 ?面向主題 :為特定的數(shù)據(jù)分析領(lǐng)域提供數(shù)據(jù)支持。 ?主題 是一個(gè)抽象的概念,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù) 綜合、歸類并進(jìn)行分析利用的抽象 。在邏輯意義上,它對(duì)應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對(duì)象。 數(shù)據(jù)挖掘 面向主題 ?為特定數(shù)據(jù)分析領(lǐng)域提供的數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)是有不同的 。傳統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)是原始的、基礎(chǔ)的數(shù)據(jù),而特定分析領(lǐng)域數(shù)據(jù)則是需要對(duì)它們作必要的抽取、加工與總結(jié)而形成。 ?數(shù)據(jù)倉(cāng)庫(kù)是面向分析、決策人員的主觀要求的,不同的用戶有不同的要求,同一個(gè)用戶的要求也會(huì)隨時(shí)間而經(jīng)常變化,因此, 數(shù)據(jù)倉(cāng)庫(kù)中的主題有時(shí)會(huì)因用戶主觀要求的變化而變化的 。 數(shù)據(jù)挖掘 面向主題示例 ?例:一個(gè) 面向事務(wù)處理 的“商場(chǎng)”數(shù)據(jù)庫(kù)系統(tǒng),其數(shù)據(jù)模式如下 采購(gòu)子系統(tǒng): 訂單 (訂單號(hào),供應(yīng)商號(hào),總金額,日期) 訂單細(xì)則 (訂單號(hào),商品號(hào),類別,單價(jià),數(shù)量) 供應(yīng)商 (供應(yīng)商號(hào),供應(yīng)商名,地址,電話) 銷售子系統(tǒng): 顧客 (顧客號(hào),姓名,性別,年齡,文化程度,地址,電話) 銷售 (員工號(hào),顧客號(hào),商品號(hào),數(shù)量,單價(jià),日期) 數(shù)據(jù)挖掘 面向事務(wù) 庫(kù)存管理子系統(tǒng): 領(lǐng)料單 (領(lǐng)料單號(hào),領(lǐng)料人,商品號(hào),數(shù)量,日期) 進(jìn)料單 (進(jìn)料單號(hào),訂單號(hào),進(jìn)料人,收料人,日期) 庫(kù)存 (商品號(hào),庫(kù)房號(hào),庫(kù)存量,日期) 庫(kù)房 (庫(kù)房號(hào),倉(cāng)庫(kù)管理員,地點(diǎn),庫(kù)存商品描述) 人事管理子系統(tǒng): 員工 (員工號(hào),姓名,性別,年齡,文化程度,部門號(hào)) 部門 (部門號(hào),部門名稱,部門主管,電話) 數(shù)據(jù)挖掘 面向主題示例 ?上述數(shù)據(jù)模式基本上是按照 企業(yè)內(nèi)部的業(yè)務(wù)活動(dòng)及其需要的相關(guān)數(shù)據(jù)來組織數(shù)據(jù)的存儲(chǔ)的 ,沒有實(shí)現(xiàn)真正的數(shù)據(jù)與應(yīng)用分離,其抽象程度也不夠高。 ?如果按照面向主題的方式進(jìn)行數(shù)據(jù)組織, 首先應(yīng)該抽取主題 ,即按照管理人員的分析要求來確定主題,而與每個(gè)主題相關(guān)的數(shù)據(jù)又與有關(guān)的事務(wù)處理所需的數(shù)據(jù)不盡相同。 數(shù)據(jù)挖掘 主題一: 商品 ?商品固有信息 :商品號(hào),商品名,類別,顏色等 ?商品采購(gòu)信息 :商品號(hào),供應(yīng)商號(hào),供應(yīng)價(jià),供應(yīng)日期,供應(yīng)量等 ?商品銷售信息 :商品號(hào),顧客號(hào),售價(jià),銷售日期,銷售量等 ?商品庫(kù)存信息 :商品號(hào),庫(kù)房號(hào),庫(kù)存量,日期等 數(shù)據(jù)挖掘 主題二: 供應(yīng)商 ?供應(yīng)商固有信息 :供應(yīng)商號(hào),供應(yīng)商名,地址,電話等 ?供應(yīng)商品信息 :供應(yīng)商號(hào),商品號(hào),供應(yīng)價(jià),供應(yīng)日期,供應(yīng)量等 數(shù)據(jù)挖掘 主題三: 顧客 ?顧客固有信息 :顧客號(hào),顧客名,性別,年齡,文化程度,住址,電話等 ?顧客購(gòu)物信息 :顧客號(hào),商品號(hào),售價(jià),購(gòu)買日期,購(gòu)買量等 數(shù)據(jù)挖掘 面向主題 ?在每個(gè)主題中,都包含了有關(guān) 該主題的所有信息 ,同時(shí)又拋棄了與分析處理無關(guān)或不需要的數(shù)據(jù),從而將原本分散在各個(gè)子系統(tǒng)中的有關(guān)信息集中在一個(gè)主題中,形成有關(guān)該主題的一個(gè)完整一致的描述。面向主題的數(shù)據(jù)組織方式所強(qiáng)調(diào)的就是要 形成一個(gè)這樣一致的信息集合 。 ?不同的主題之間也有重疊的內(nèi)容,但這種重疊是邏輯上的,而不是物理存儲(chǔ)上的重疊;是部分細(xì)節(jié)的重疊,而不是完全的重疊。 數(shù)據(jù)挖掘 面向主題 ?每個(gè)主題所需數(shù)據(jù)的物理存儲(chǔ): ?多維數(shù)據(jù)庫(kù) ( MDDB— MultiDimensional DataBase)用多維數(shù)組形式存儲(chǔ)數(shù)據(jù)。 ?關(guān)系數(shù)據(jù)庫(kù)。 用一組關(guān)系來組織數(shù)據(jù)的存儲(chǔ),同一主題的一組關(guān)系都有一個(gè) 公共的關(guān)鍵字 ,存放的也不是細(xì)節(jié)性的業(yè)務(wù)數(shù)據(jù),而是經(jīng)過一定程度的綜合形成的綜合性數(shù)據(jù)。 數(shù)據(jù)挖掘 集成的 ?集成性 是 指數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)必須是一致的 。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是從原有的分散的多個(gè)數(shù)據(jù)庫(kù)、數(shù)據(jù)文件和數(shù)據(jù)段中抽取來的,數(shù)據(jù)來源可能既有內(nèi)部數(shù)據(jù)又有外部數(shù)據(jù)。 ?數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是為分析服務(wù)的,而分析需要多種廣泛的不同數(shù)據(jù)源以便進(jìn)行比較、鑒別,因此數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)必須從多個(gè)數(shù)據(jù)源中獲取,這些數(shù)據(jù)源包括多種類型數(shù)據(jù)庫(kù)、文件系統(tǒng)以及 Inter網(wǎng)上數(shù)據(jù)等,它們通過數(shù)據(jù)集成而形成數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)。 數(shù)據(jù)挖掘 集成的 ?集成的方法: ?統(tǒng)一: 消除不一致的現(xiàn)象 ?綜合: 對(duì)原有數(shù)據(jù)進(jìn)行綜合和計(jì)算 ?需要考慮的問題: ?數(shù)據(jù)格式 ?計(jì)量單位 ?數(shù)據(jù)代碼含義混亂 ?數(shù)據(jù)名稱混亂 數(shù)據(jù)挖掘 非易失的 ?數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是經(jīng)過抽取而形成的分析型數(shù)據(jù),不具有原始性,主要供企業(yè)決策分析之用, 執(zhí)行的主要是 ‘ 查詢 ’ 操作,一般情況下不執(zhí)行 ‘ 更新 ’ 操作 。同時(shí),一個(gè)穩(wěn)定的數(shù)據(jù)環(huán)境也有利于數(shù)據(jù)分析操作和決策的制訂。 ?面向應(yīng)用的事務(wù)數(shù)據(jù)庫(kù)需要對(duì)數(shù)據(jù)進(jìn)行頻繁的插入、更新操作,而對(duì)于數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的操作 僅限于數(shù)據(jù)的初始導(dǎo)入和記錄查詢 。 數(shù)據(jù)挖掘 隨時(shí)間不斷變化 ?數(shù)據(jù)倉(cāng)庫(kù)以維的形式對(duì)數(shù)據(jù)進(jìn)行組織, 時(shí)間維是數(shù)據(jù)倉(cāng)庫(kù)中很重要的一個(gè)維度 。并且數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)時(shí)間跨度大,從幾年甚至到幾十年,稱為歷史數(shù)據(jù)。 ?數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)必須以一定時(shí)間段為單位進(jìn)行統(tǒng)一更新。 ?不斷增加新的數(shù)據(jù)內(nèi)容 ?不斷刪去舊的數(shù)據(jù)內(nèi)容 ?更新與時(shí)間有關(guān)的綜合數(shù)據(jù) 數(shù)據(jù)挖掘 數(shù)據(jù)集市( Data Mart) ?建立數(shù)據(jù)集市的原因 ?數(shù)據(jù)倉(cāng)庫(kù)是一種反映主題的 全局性數(shù)據(jù)組織 。但是 ,全局性數(shù)據(jù)倉(cāng)庫(kù)往往太大,在實(shí)際應(yīng)用中將它們按部門或個(gè)人分別建立反映各個(gè)子主題的局部性數(shù)據(jù)組織 ,它們即是 數(shù)據(jù)集市 。因此,有時(shí)我們也稱它為 部門數(shù)據(jù)倉(cāng)庫(kù) 。 ?例:在有關(guān)商品銷售的數(shù)據(jù)倉(cāng)庫(kù)中可以建立多個(gè)不同主題的數(shù)據(jù)集市: ?商品采購(gòu)數(shù)據(jù)集市 ?庫(kù)房使用數(shù)據(jù)集市 ?商品銷售數(shù)據(jù)集市 數(shù)據(jù)挖掘 數(shù)據(jù)集市類型 ?按照數(shù)據(jù)獲取來源: ?獨(dú)立型: 直接從操作型環(huán)境獲取數(shù)據(jù)。 ?從屬型: 從企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)獲取數(shù)據(jù)。 數(shù)據(jù)挖掘 建設(shè)途徑 ?從 全局?jǐn)?shù)據(jù)倉(cāng)庫(kù) 到 數(shù)據(jù)集市 ?從 數(shù)據(jù)集市 到 全局?jǐn)?shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù) VS 數(shù)據(jù)集市 ? 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市的關(guān)系類似于傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中的 基表與視圖 的關(guān)系。 ? 數(shù)據(jù)集市的數(shù)據(jù)來自數(shù)據(jù)倉(cāng)庫(kù),它是數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的一個(gè)部分與局部,是一個(gè)數(shù)據(jù)的再抽取與組織的過程。 數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu) ?數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng) :對(duì)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的原始數(shù)據(jù)完成抽取、轉(zhuǎn)換、過濾、清洗等處理,最終進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),以及對(duì)數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù)進(jìn)行更新、管理、使用、表現(xiàn)等的相關(guān)軟件 /工具進(jìn)行集合,用以支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)應(yīng)用或管理決策。 數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu) ?數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)由 數(shù)據(jù)倉(cāng)庫(kù)( DW)、倉(cāng)庫(kù)管理和分析工具 三部分組成 ORACLE SYBASE SQL Server 文 件 …… 數(shù)據(jù)集市 數(shù)據(jù)集市 數(shù)據(jù)集市 數(shù) 據(jù) 建 模 數(shù)據(jù)倉(cāng)庫(kù) 元數(shù)據(jù)管理 抽 取 …… 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)示意圖 分析工具( OLAP、數(shù)據(jù)挖掘) 數(shù)據(jù)挖掘 過程模型 數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng) 元數(shù)據(jù) 多維關(guān)系 數(shù)據(jù)庫(kù) 多維 數(shù)據(jù)庫(kù) 外部操作型 數(shù)據(jù) 數(shù)據(jù)抽取 數(shù)據(jù)清潔 數(shù)據(jù)裝載 管理平臺(tái) 報(bào)表查詢工具 數(shù)據(jù)挖掘工具 OLAP工具 數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù)管理層 ?數(shù)據(jù)倉(cāng)庫(kù)管理層 的功能就是完成數(shù)據(jù)倉(cāng)庫(kù)的定義,數(shù)據(jù)抽取、轉(zhuǎn)換、裝載,數(shù)據(jù)歸檔、備份、維護(hù)、恢復(fù)及元數(shù)據(jù)管理等。 ?數(shù)據(jù)倉(cāng)庫(kù)的管理部分由 數(shù)據(jù)倉(cāng)庫(kù)定義部件 、 數(shù)據(jù)獲取部件 、 數(shù)據(jù)管理部件 和 元數(shù)據(jù)管理部件 四部分組成 數(shù)據(jù)挖掘 倉(cāng)庫(kù)管理- 數(shù)據(jù)建模 ?數(shù)據(jù)建模是建立數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型。 ?數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型不同于數(shù)據(jù)庫(kù)的數(shù)據(jù)模型在于: ?數(shù)據(jù)倉(cāng)庫(kù)只為決策分析用,不包含事務(wù)處理的數(shù)據(jù)。 ?數(shù)據(jù)倉(cāng)庫(kù)的增加了時(shí)間屬性數(shù)據(jù)。 ?數(shù)據(jù)倉(cāng)庫(kù)增加了一些綜合數(shù)據(jù) 。 ?數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)建模是適應(yīng)決策用戶使用的 邏輯數(shù)據(jù)模型 。 數(shù)據(jù)挖掘 倉(cāng)庫(kù)管理- 元數(shù)據(jù)管理 ?最基本的 元數(shù)據(jù)相當(dāng)于數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)字典 。 ?元數(shù)據(jù)定義了 數(shù)據(jù)倉(cāng)庫(kù)有什么 ,指明了數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的內(nèi)容和位置,刻畫了數(shù)據(jù)的抽取和轉(zhuǎn)換規(guī)則,存儲(chǔ)了與數(shù)據(jù)倉(cāng)庫(kù)主題有關(guān)的各種商業(yè)信息,而且 整個(gè)數(shù)據(jù)倉(cāng)庫(kù)的運(yùn)行都是基于元數(shù)據(jù)的 。 ?數(shù)據(jù)源的元數(shù)據(jù) ?數(shù)據(jù)模型的元數(shù)據(jù) ?數(shù)據(jù)倉(cāng)庫(kù)映射的元數(shù)據(jù) ?數(shù)據(jù)倉(cāng)庫(kù)使用的元數(shù)據(jù) 數(shù)據(jù)挖掘 倉(cāng)庫(kù)管理- 數(shù)據(jù)處理 ?異構(gòu)數(shù)據(jù)源: ?企業(yè)內(nèi)部數(shù)據(jù) ?存檔的歷史數(shù)據(jù) ?企業(yè)的外部數(shù)據(jù)。 ?軟硬件平臺(tái)不一致 ?ETL過程 ?抽?。?Extraction) ?轉(zhuǎn)換( Transform) ?裝載( Load) 數(shù)據(jù)挖掘 分析工具- 查詢工具 ?數(shù)據(jù)倉(cāng)庫(kù)的查詢不是指對(duì)記錄級(jí)數(shù)據(jù)的查詢,而是指對(duì)分析要求的查詢。一般包含: 可視化工具: 以圖形化方式展示數(shù)據(jù) ,可以幫助了解數(shù)據(jù)的結(jié)構(gòu) , 關(guān)系以及動(dòng)態(tài)性 。 數(shù)據(jù)挖掘 分析工具- 多維分析工具 ? 通過對(duì)信息的多種可能的觀察形式進(jìn)行快速、一致和交互性的存取,這樣便利用戶對(duì)數(shù)據(jù)進(jìn)行深入的分析和觀察。 ?多維數(shù)據(jù)的每一維代表對(duì)數(shù)據(jù)的一個(gè)特定的觀察視角,如時(shí)間、地域、業(yè)務(wù)等。 數(shù)據(jù)挖掘 分析工具- 數(shù)據(jù)挖掘工具 ?從大量數(shù)據(jù)中挖掘具有規(guī)律性知識(shí),需要利用數(shù)據(jù)挖掘( Data Mining)工具。 數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù)的運(yùn)行結(jié)構(gòu) ?兩層數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù) 元數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器 ?數(shù)據(jù)邏輯 ?數(shù)據(jù)服務(wù) ?元數(shù)據(jù) ?文件服務(wù) 客戶端 ?圖形用戶接口 /表示邏輯 ?查詢規(guī)范 ?數(shù)據(jù)分析 ?報(bào)表格式 ?總結(jié) ?數(shù)據(jù)訪問 數(shù)據(jù)挖掘 數(shù)據(jù)倉(cāng)庫(kù)的運(yùn)行結(jié)構(gòu) ?多層數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu) 多維數(shù)據(jù)服務(wù)器 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù) 元數(shù)據(jù) ?數(shù)據(jù)邏輯 ?數(shù)據(jù)服務(wù) ?元數(shù)據(jù) ?文件服務(wù) 數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器 應(yīng)用服務(wù)器 ?圖形用戶接口 ?查詢規(guī)范 ?數(shù)據(jù)分析 ?報(bào)表格式 ?數(shù)據(jù)訪問 客戶端 ?過濾 ?總結(jié) ?元數(shù)據(jù) ?多維視圖 ?數(shù)據(jù)訪問 數(shù)據(jù)挖掘 數(shù)據(jù)組織結(jié)構(gòu)和形式 ?典型的數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織結(jié)構(gòu) ?高度綜合級(jí): 數(shù)據(jù)十分精煉,是一種準(zhǔn)決策數(shù)據(jù) ?輕度綜合級(jí): 從當(dāng)前基本數(shù)據(jù)中提取出來,通常以較小的時(shí)間段 (粒度 )統(tǒng)計(jì)而成的數(shù)據(jù),其數(shù)據(jù)量較細(xì)節(jié)及數(shù)據(jù)少得多 ?當(dāng)前細(xì)節(jié)級(jí): 存儲(chǔ)最近時(shí)期的業(yè)務(wù)數(shù)據(jù),反映當(dāng)前業(yè)務(wù)的情況,數(shù)據(jù)量大,是數(shù)據(jù)倉(cāng)庫(kù)用戶最感興趣的部分 ?早期細(xì)節(jié)級(jí): 存儲(chǔ)過去的詳細(xì)數(shù)據(jù),反映真實(shí)的歷史情況,這類數(shù)據(jù)隨著時(shí)間增加,數(shù)據(jù)量很大,使用頻率低,一般存儲(chǔ)在轉(zhuǎn)換介質(zhì) (如磁帶 )中 數(shù)據(jù)挖掘 數(shù)據(jù)組織結(jié)構(gòu)和形式 數(shù)據(jù)挖掘 數(shù)據(jù)粒度 ?粒度 是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。 ?粒度影響存放在數(shù)據(jù)倉(cāng)庫(kù)中的 數(shù)據(jù)量的大小 ,同時(shí)影響數(shù)據(jù)倉(cāng)庫(kù)所能回答查詢問題的細(xì)節(jié)程度,是設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)最重要方面。 ?粒度可以分為兩種形式: ?按時(shí)問段綜合數(shù)據(jù)的粒度 ?按采樣率高低劃分的樣本數(shù)據(jù)庫(kù)。 數(shù)據(jù)挖掘 粒度的一個(gè)例子 能回答,但需要一定量的檢索 不能回答,缺少細(xì)節(jié)信息 數(shù)據(jù)挖掘 粒度權(quán)衡 數(shù)據(jù)挖掘
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1