freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第2章-數(shù)據(jù)倉庫與olap技術(shù)(更新版)

2024-09-19 23:02上一頁面

下一頁面
  

【正文】 55個記錄 830個記錄 29個記錄 77個記錄 顧客類別及描述在分析中不會感興趣,而且為 0個記錄,所以也不考慮 分析過程 數(shù)據(jù)挖掘 Employeer 員工表 Customer 顧客表 Orders 訂單表 Orders Detail 訂單詳情表 Products 產(chǎn)品表 Categories 產(chǎn)品類別表 Suppliers 供貨商表 字段名 功能描述 CategoryID 產(chǎn)品類型的識別碼 CategoryName 產(chǎn)品名稱 Description 產(chǎn)品類型描述 Picture 產(chǎn)品圖片 分析過程 數(shù)據(jù)挖掘 Employeer 員工表 Customer 顧客表 Orders 訂單表 Orders Detail 訂單詳情表 Products 產(chǎn)品表 Categories 產(chǎn)品類別表 Suppliers 供貨商表 UnitOnOrder 一次訂貨量 ReorderLevel 重新訂貨最低庫存量 Discontinued 是否停售 字段名 功能描述 ProductID 產(chǎn)品識別號 ProductName 產(chǎn)品名稱 SupplierID 供貨商識別號 CategoryID 產(chǎn)品分類識別號 QuantityPerUnit 每單位數(shù)量 UnitPrice 單價 UnitInStock 庫存量 分析過程 數(shù)據(jù)挖掘 Employeer 員工表 Customer 顧客表 Orders 訂單表 Orders Detail 訂單詳情表 Products 產(chǎn)品表 Categories 產(chǎn)品類別表 Suppliers 供貨商表 phone 電話 Fax 傳真 HomePage 公司網(wǎng)址 字段名 功能描述 SupplierID 供貨商識別號 CompanyName 公司名稱 ContactName 聯(lián)絡(luò)人姓名 Address 地址 City 城市 Region 地區(qū) PostalCode 郵政編碼 分析過程 數(shù)據(jù)挖掘 Employeer 員工表 Customer 顧客表 Orders 訂單表 Orders Detail 訂單詳情表 Products 產(chǎn)品表 Categories 產(chǎn)品類別表 Suppliers 供貨商表 HomePhone 家庭電話 Extension 公司內(nèi)部分機號 Photo 照片 Notes 員工信息描述 字段名 功能描述 EmployeeID 員工 識別碼 EmployeeName 員工姓名 BirthDate 出生年月 HireDate 雇傭日期 Address 地址 City 城市 Region 地區(qū) PostalCode 郵政編碼 Title 員工職務(wù) 分析過程 數(shù)據(jù)挖掘 Employeer 員工表 Customer 顧客表 Orders 訂單表 Orders Detail 訂單詳情表 Products 產(chǎn)品表 Categories 產(chǎn)品類別表 Suppliers 供貨商表 字段名 功能描述 CustomerID 顧客識別碼 CustomerName 顧客姓名 Address 地址 City 城市 Region 地區(qū) PostalCode 郵政編碼 Country 國家 Phone 電話。 數(shù)據(jù)挖掘 ( 4)風險評估模型 ?模擬風險和利潤間的關(guān)系,建立風險評估的數(shù)學(xué)模型,在滿足高利潤、低風險客戶需求的前提下,達到銀行收益的極大化。 數(shù)據(jù)挖掘 數(shù)據(jù)分析模型 ?( 4)公式模型 ?該模型表示在多個維上,需要引入哪些變量或參數(shù),以及引入后所產(chǎn)生的結(jié)果。 ( 3) 異常報告 當超出邊界條件時提醒分析員 。 ?向上鉆取獲取概括性的數(shù)據(jù)。(如 MS SQL SERVER) ?在 HOLAP的多維數(shù)據(jù)表中的數(shù)據(jù)維度少于 MOLAP中的維度表,數(shù)據(jù)存儲容量也少于 MOLAP方式。 ?ROLAP對于維表的變更有很好的適應(yīng)性。因此, ROLAP的響應(yīng)時間較長。 數(shù)據(jù)挖掘 維的例子 ?地區(qū)的層次 全國 江蘇 北京 上海 蘇州市 揚州市 寶應(yīng)縣 數(shù)據(jù)挖掘 維的例子 ?正好構(gòu)成一個數(shù)據(jù)立方體,可以有更高階的維,但仍然稱為 數(shù)據(jù)立方體。 ?維的取值 :即維的成員。 ?多維數(shù)據(jù)庫服務(wù)器能夠被不同的應(yīng)用和工具所訪問。 ( 3)多維性: 系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖和分析。 ?OLAP的基本思想是從 多方面 和 多角度 以 多維 的形式來觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。如圖所示: ? 源數(shù)據(jù)與目標數(shù)據(jù)之間的映射 ( 1)抽取工作 ( 2)抽取工作步驟 ( 3)抽取表映射 ( 4)抽取屬性映射 ( 5)記錄篩選規(guī)則 源數(shù)據(jù) 獲取 過濾 驗證 融合 綜合 裝載 存檔 目標數(shù)據(jù)挖掘 數(shù)據(jù)倉庫使用的元數(shù)據(jù) ?這類元數(shù)據(jù)是數(shù)據(jù)倉庫中信息的使用情況描述。 ?每個數(shù)據(jù)項更新的頻率,以及由誰或那個過程更新的說明。 ?數(shù)據(jù)倉庫的源數(shù)據(jù)。 ( _ m a x _ m i n ) _ m i nm a x m i nAA A AAAvv n e w n e w n e w?? ? ??例:假定收入屬性的最小與最大分別是 12022和 98000,現(xiàn)在想映射到區(qū)間 [, 1],則 7 3 6 0 0 1 2 0 0 039。 由于源系統(tǒng)的變化,數(shù)據(jù)倉庫需要裝載變化的數(shù)據(jù)。 如果目標表中已經(jīng)存在數(shù)據(jù),追加過程在保存已有數(shù)據(jù)的基礎(chǔ)上增加輸入數(shù)據(jù)。 數(shù)據(jù)挖掘 數(shù)據(jù)轉(zhuǎn)換類型 ( 1)格式修正 ( 2)字段的解碼 ( 3)計算值和導(dǎo)出值 ( 4)單個字段的分離 ( 5)信息的合并 ( 6)特征集合轉(zhuǎn)化 ( 7)度量單位的轉(zhuǎn)化 ( 8)關(guān)鍵字重新構(gòu)造 ( 9)匯總 ( 10)日期 /時間轉(zhuǎn)化 數(shù)據(jù)挖掘 數(shù)據(jù)整合和合并 ?數(shù)據(jù)整合和合并是將相關(guān)的源數(shù)據(jù)組合成一致的數(shù)據(jù)結(jié)構(gòu),裝入數(shù)據(jù)倉庫。當商業(yè)交易時,這些數(shù)據(jù)是會發(fā)生變化的。 ?它占用大量資源,對性能影響極大,因此無實際意義。 ?實際上,與巨大的事實表相比,這種空間的節(jié)省可以忽略。 數(shù)據(jù)挖掘 星型模式 ?事實表 ?主要包含了描述特定商業(yè)事件的數(shù)據(jù),即某些特定商業(yè)事件的度量值。關(guān)系數(shù)據(jù)的基礎(chǔ)是關(guān)系數(shù)據(jù)庫模型,通過標準的 SQL語言來加以實現(xiàn)。 ?是間隔一定時間的操作型數(shù)據(jù)的一個快照。 ?系統(tǒng)層的分割由 數(shù)據(jù)庫管理系統(tǒng)和操作系統(tǒng)完成; ?應(yīng)用層的分割 由應(yīng)用系統(tǒng)完成,在應(yīng)用層上分割更有意義。分割之后,小單元內(nèi)的數(shù)據(jù)相對獨立,處理起來更快、更容易。 數(shù)據(jù)挖掘 分析工具- 多維分析工具 ? 通過對信息的多種可能的觀察形式進行快速、一致和交互性的存取,這樣便利用戶對數(shù)據(jù)進行深入的分析和觀察。 ?數(shù)據(jù)倉庫的增加了時間屬性數(shù)據(jù)。 ?例:在有關(guān)商品銷售的數(shù)據(jù)倉庫中可以建立多個不同主題的數(shù)據(jù)集市: ?商品采購數(shù)據(jù)集市 ?庫房使用數(shù)據(jù)集市 ?商品銷售數(shù)據(jù)集市 數(shù)據(jù)挖掘 數(shù)據(jù)集市類型 ?按照數(shù)據(jù)獲取來源: ?獨立型: 直接從操作型環(huán)境獲取數(shù)據(jù)。同時,一個穩(wěn)定的數(shù)據(jù)環(huán)境也有利于數(shù)據(jù)分析操作和決策的制訂。 ?不同的主題之間也有重疊的內(nèi)容,但這種重疊是邏輯上的,而不是物理存儲上的重疊;是部分細節(jié)的重疊,而不是完全的重疊。在邏輯意義上,它對應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對象。 ?主題 是一個抽象的概念,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù) 綜合、歸類并進行分析利用的抽象 。面向主題的數(shù)據(jù)組織方式所強調(diào)的就是要 形成一個這樣一致的信息集合 。 數(shù)據(jù)挖掘 集成的 ?集成的方法: ?統(tǒng)一: 消除不一致的現(xiàn)象 ?綜合: 對原有數(shù)據(jù)進行綜合和計算 ?需要考慮的問題: ?數(shù)據(jù)格式 ?計量單位 ?數(shù)據(jù)代碼含義混亂 ?數(shù)據(jù)名稱混亂 數(shù)據(jù)挖掘 非易失的 ?數(shù)據(jù)倉庫中的數(shù)據(jù)是經(jīng)過抽取而形成的分析型數(shù)據(jù),不具有原始性,主要供企業(yè)決策分析之用, 執(zhí)行的主要是 ‘ 查詢 ’ 操作,一般情況下不執(zhí)行 ‘ 更新 ’ 操作 。因此,有時我們也稱它為 部門數(shù)據(jù)倉庫 。 ?數(shù)據(jù)倉庫的數(shù)據(jù)模型不同于數(shù)據(jù)庫的數(shù)據(jù)模型在于: ?數(shù)據(jù)倉庫只為決策分析用,不包含事務(wù)處理的數(shù)據(jù)。一般包含: 可視化工具: 以圖形化方式展示數(shù)據(jù) ,可以幫助了解數(shù)據(jù)的結(jié)構(gòu) , 關(guān)系以及動態(tài)性 。 ?數(shù)據(jù)分割后的數(shù)據(jù)單元稱為 分片 。 數(shù)據(jù)挖掘 數(shù)據(jù)分割例子 處理集 A 處理集 B 數(shù)據(jù)挖掘 分割的層次 ?分割的層次一般分為系統(tǒng)層和應(yīng)用層兩層。 數(shù)據(jù)挖掘 簡單直接文件 ?數(shù)據(jù)僅僅是從操作型環(huán)境拖入數(shù)據(jù)倉庫環(huán)境中,并沒有任何累積。 ?實體關(guān)系( ER) 模型一般用于關(guān)系型數(shù)據(jù)庫設(shè)計,而數(shù)據(jù)倉庫采用 ?星型 ?雪 花 型 ?事實星座 數(shù)據(jù)挖掘 基于關(guān)系表的存儲方式 ?關(guān)系數(shù)據(jù)庫一般采用二維數(shù)據(jù)表的形式來表示數(shù)據(jù),一個維是行,另一個維是列,行和列的交叉處就是數(shù)據(jù)元素。維度表中的對象通過事實表與另一維度表中的對象相關(guān)聯(lián),這樣就能建立各個維度表對象之間的聯(lián)系。這種表易于維護,并節(jié)省存儲空間。 數(shù)據(jù)挖掘 前后映像文件方法 ?在抽取數(shù)據(jù)前后對數(shù)據(jù)庫各做一次快照,然后比較兩幅快照從而確定新數(shù)據(jù)。 ?ETL過程 ?抽?。?Extraction) ?轉(zhuǎn)換( Transform) ?裝載( Load) 數(shù)據(jù)挖掘 數(shù)據(jù)抽取 ?確認數(shù)據(jù)源 ?數(shù)據(jù)抽取技術(shù) 數(shù)據(jù)挖掘 確認數(shù)據(jù)源 ? 列出對事實表的每一個數(shù)據(jù)項和事實 ? 列出每一個維度屬性 ? 對于每個目標數(shù)據(jù)項,找出源數(shù)據(jù)項 ? 一個數(shù)據(jù)元素有多個來源,選擇最好的來源 ? 確認一個目標字段的多個源字段,建立合并規(guī)則 ? 確認一個目標字段的多個源字段,建立分離規(guī)則 ? 確定默認值 ? 檢查缺失值的源數(shù)據(jù) 數(shù)據(jù)挖掘 數(shù)據(jù)抽取技術(shù) ?當前值 :源系統(tǒng)中存儲的數(shù)據(jù)都代表了當前時刻的值。 ?清晰: 對單個字段數(shù)據(jù)進行重新分配和簡化 。 ?追加。 ?增量裝載。假定 minA和 maxA分別為屬性 A的最小和最大值,則 : m i n39。 ?D S S分析員所知的數(shù)據(jù)結(jié)構(gòu)。 ?所有數(shù)據(jù)項的業(yè)務(wù)定義。 數(shù)據(jù)挖掘 數(shù)據(jù)倉庫映射的元數(shù)據(jù)示例 ?一個數(shù)據(jù)的抽取要經(jīng)過許多步驟。 數(shù)據(jù)挖掘 OLTP VS. OLAP 面向操作人員,支持日常操作 面向決策人員,支持管理需要 面向應(yīng)用,事務(wù)驅(qū)動 面向分析,分析驅(qū)動 一次處理的數(shù)據(jù)量小 一次處理的數(shù)據(jù)量大 可更新 不可更新,但周期性刷新 當前值數(shù)據(jù) 歷史數(shù)據(jù) 細節(jié)性數(shù)據(jù) 綜合性和提煉性數(shù)據(jù) 原始數(shù)據(jù) 導(dǎo)出數(shù)據(jù) OLTP數(shù)據(jù) OLAP數(shù)據(jù) 數(shù)據(jù)挖掘 OLAP基本思想 ?聯(lián)機分析處理( OnLine Analysis Processing,OLAP) 在數(shù)據(jù)倉庫系統(tǒng)中,聯(lián)機分析處理是重要的數(shù)據(jù)分析工具 。 ( 2)可分析性: OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計分析。 數(shù)據(jù)挖掘 客戶 /服務(wù)器體系結(jié)構(gòu) ?OLAP是建立在客戶 / 服務(wù)器體系結(jié)構(gòu)上的。 如日、月、季、年是時間維的層次。維有層次結(jié)構(gòu),可以在某個層上察看數(shù)據(jù)。 產(chǎn)品名 地區(qū) 銷售量 衣服 北京 600 衣服 上海 700 衣服 廣州 500 鞋 北京 800 鞋 上海 900 鞋 廣州 700 帽子 北京 100 帽子 上海 200 帽子 廣州 80 數(shù)據(jù)挖掘 MOLAP與 ROLAP的比較 ? ? ? ? ? ? ? 數(shù)據(jù)挖掘 ?ROLAP服務(wù)器需要將 SQL語句轉(zhuǎn)化為多維存儲語句,臨時“拼合”出多維數(shù)據(jù)立方體。 數(shù)據(jù)挖掘 ?MOLAP增加新的維度,則多維數(shù)據(jù)庫通常需要重新建立。 ?HOLAP得宜于 ROLAP的可伸縮性 ,和 MOLAP的快速計算。 ?向下鉆取是使用戶在多層數(shù)據(jù)中能通過導(dǎo)航信息而獲得更多的細節(jié)性數(shù)據(jù)。 ( 2) 時間報告 按日歷和時鐘提醒分析員 。 ?例如該公司決策者為了了解某商品的銷售量是否與顧客的年齡有關(guān),引入了行變量-年齡,即在當前的多維視圖上增加了顧客的年齡維。 ? 通過模型計算,主動地對客戶溝通并進行交叉銷售,達到留住客戶和增加利
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1