freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用第1章-展示頁

2025-05-21 02:13本頁面
  

【正文】 處理的時間和效率 , 并且數(shù)據(jù)之間的不一致性和不同步等問題將影響決策的可靠性 。 其中 , 計費數(shù)據(jù)庫記錄了客戶的消費情況 ,財務(wù)數(shù)據(jù)庫記錄了客戶的繳費情況 , 客戶服務(wù)數(shù)據(jù)庫記錄了客戶的咨詢和投訴情況 , 這些數(shù)據(jù)庫里都有與客戶主題相關(guān)的數(shù)據(jù) 。所謂較高層次是相對面向應(yīng)用的數(shù)據(jù)組織方式而言的,是指按照主題進行數(shù)據(jù)組織的方式具有更高的數(shù)據(jù)抽象級別 面向主題( 1) 20 收益數(shù)據(jù) 客戶數(shù)據(jù) 計 費 數(shù) 據(jù) 庫 財 務(wù) 數(shù) 據(jù) 庫 客 戶 服 務(wù) 數(shù) 據(jù) 庫 傳統(tǒng)數(shù)據(jù)庫系統(tǒng) 面 向 主 題 的 數(shù) 據(jù) 倉 庫 圖 1. 4 數(shù)據(jù)倉庫面向主題的特性 面向主題( 2) 21 例如在圖 , 我們示例了一個電信企業(yè)的情況 。從數(shù)據(jù)組織的角度看, 主題是一些數(shù)據(jù)集合,這些數(shù)據(jù)集合對分析對象作了比較完整的、一致的描述,這種描述不僅涉及到數(shù)據(jù)自身,而且涉及到數(shù)據(jù)之間的關(guān)系。 19 與傳統(tǒng)數(shù)據(jù)庫面向應(yīng)用進行數(shù)據(jù)組織的特點相對應(yīng),數(shù)據(jù)倉庫中的數(shù)據(jù)是面向主題進行組織的。 “數(shù)據(jù)倉庫是一種具有集成性、穩(wěn)定性和提供決策支持的處理”?!保ā?A data warehouse is a subjectoriented, integrated, nonvolatile, timevariant collection of data in support of management decisions.”) 對于什么是數(shù)據(jù)倉庫,還有許多不同的定義,如: “數(shù)據(jù)倉庫是融合方法、技術(shù)和工具以在完整的平臺上將數(shù)據(jù)提交給終端用戶的一種手段”。當然,數(shù)據(jù)倉庫的主要驅(qū)動力并不是過去的缺點和問題,而是市場商業(yè)經(jīng)營行為的改變,市場競爭要求捕獲和分析事務(wù)級的業(yè)務(wù)數(shù)據(jù)。必須把分析型數(shù)據(jù)從事務(wù)處理環(huán)境中提取出來,按照 DSS處理的需要進行重新組織,建立單獨的分析處理環(huán)境,數(shù)據(jù)倉庫正是為了構(gòu)建這種新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲和組織技術(shù)。 企業(yè)的生產(chǎn)環(huán)境 , 也由以數(shù)據(jù)庫為中心的環(huán)境發(fā)展為以數(shù)據(jù)庫和數(shù)據(jù)倉庫為中心的環(huán)境 。 事務(wù)處理和信息分析數(shù)據(jù)環(huán)境的劃分如圖 。 事務(wù)處理的使用人員通常是企業(yè)的具體操作人員 , 處理的數(shù)據(jù)通常是企業(yè)業(yè)務(wù)的細節(jié)信息 , 其目標是實現(xiàn)企業(yè)的業(yè)務(wù)運營;而分析處理的使用人員通常是企業(yè)的中高層的管理者 , 或者是從事數(shù)據(jù)分析的工程師 。 事務(wù)處理和分析處理數(shù)據(jù)環(huán)境的分離( 1) 14 分析型處理以數(shù)據(jù)倉庫為中心分析數(shù)據(jù)背后的關(guān)聯(lián)和規(guī)律 ,為企業(yè)的決策提供可靠有效的依據(jù) 。事務(wù)型處理以傳統(tǒng)的數(shù)據(jù)庫為中心進行企業(yè)的日常業(yè)務(wù)處理。 因此 , 要解決“ 蜘蛛網(wǎng) ” 問題 , 必須將用于事務(wù)處理的數(shù)據(jù)環(huán)境和用于分析處理的數(shù)據(jù)環(huán)境分離開 。 數(shù)據(jù)庫技術(shù)一直力圖使自己能勝任從事務(wù)處理 、 批處理到分析處理的各種類型的信息處理任務(wù) 。 在這些數(shù)據(jù)庫中已經(jīng)保存了大量的日常業(yè)務(wù)數(shù)據(jù) 。 如 , 記錄客戶呼叫行為的數(shù)據(jù)庫通常只保留最近 3個月的呼叫話單 , 財務(wù)數(shù)據(jù)庫可能保留客戶今年的交費情況 , 客戶咨詢數(shù)據(jù)庫可能只保留客戶 2年內(nèi)的咨詢信息 , 于是 , 從這些數(shù)據(jù)中提取出完整的信息是不可能的 。但“蜘蛛網(wǎng)”式的結(jié)構(gòu)中數(shù)據(jù)缺乏集成性,因此,對綜合信息需求的支持確實是不充分的。比如,某電信公司要想分析某個大客戶今年的情況和過去 3年有什么不同?大客戶的情況可能包括呼叫行為、話費情況、交費情況、咨詢問題等。 因此,數(shù)據(jù)處理的低效率是蜘蛛網(wǎng)問題所面臨的又一個問題。但是事實并非如此。 如果低效率的過程是一次性的,那么為生成報表花費大量的資源也是可取的。由于企業(yè)中使用的數(shù)據(jù)庫類型很多,因此可能需要使用多種技術(shù)來實現(xiàn)。 首先 , 定位報表需要的數(shù)據(jù) , 即確定報表涉及的內(nèi)容分布在哪個數(shù)據(jù)庫的哪個位置 , 然后調(diào)動各個部門的程序員 /分析員對應(yīng)用進行分析 、 設(shè)計和編碼 。各種數(shù)據(jù)庫的開發(fā)工具和開發(fā)環(huán)境不同 , 當需要在整個企業(yè)范圍內(nèi)查詢數(shù)據(jù)時 , 數(shù)據(jù)處理的低效率將是不容忽視的 。 蜘蛛網(wǎng)問題( 5) 9 外部市場信息 A 外部市場信息 B 外部市場信息 C 外部信息的不同 企業(yè)級 數(shù)據(jù) 庫 市場部 計劃部 抽取數(shù)據(jù)的內(nèi)容不同 星期日晚 星期三下午 抽取數(shù)據(jù)的時間不同 分析程序 1 分析程序 2 分析程序和分析內(nèi)容不同 分析結(jié)果 1 :項目 I市場前景很好 分析結(jié)果 2 :項目 I沒有市場前景 圖 兩個分析結(jié)果的差異 蜘蛛網(wǎng)問題( 6) 10 2. 數(shù)據(jù)處理的效率很低 數(shù)據(jù)分析的結(jié)果缺乏可靠性并不是蜘蛛網(wǎng)問題中唯一的主要問題 。 最后,分析程序的差異。分析項目的發(fā)展趨勢常常需要引入企業(yè)外部的信息,比如報刊信息、國家的政策等。有任何理由相信對某一天抽取的數(shù)據(jù)樣本進行分析與對另一天抽取的數(shù)據(jù)樣本進行的分析可能相同嗎?當然不能!企業(yè)內(nèi)的數(shù)據(jù)總是在變的。 蜘蛛網(wǎng)問題( 4) 8 其次,可能兩部門抽取數(shù)據(jù)的時間不同。作為企業(yè)的最終決策者,將如何根據(jù)這樣的結(jié)論進行決策呢? 為什么分析同一個企業(yè)數(shù)據(jù)庫中的數(shù)據(jù),卻得到截然相反的結(jié)論呢? 首先,兩部門可能抽取數(shù)據(jù)的內(nèi)容不同。 抽取 程序 個人級數(shù)據(jù)庫 企業(yè)級數(shù)據(jù)庫 抽取 程序 抽取 程序 抽取 程序 抽取 程序 個人級數(shù)據(jù)庫 個人級數(shù)據(jù)庫 個人級數(shù)據(jù)庫 抽取 程序 抽取 程序 部門級數(shù)據(jù)庫 個人級數(shù)據(jù)庫 個人級數(shù)據(jù)庫 個人級數(shù)據(jù)庫 個人級數(shù)據(jù)庫 抽取 程序 抽取 程序 抽取 程序 抽取 程序 抽取 程序 個人級數(shù)據(jù)庫 個人級數(shù)據(jù)庫 部門級數(shù)據(jù)庫 部門級數(shù)據(jù)庫 部門級數(shù)據(jù)庫 部門級數(shù)據(jù)庫 部門級數(shù)據(jù)庫 部門級數(shù)據(jù)庫 圖 1 . 1 企業(yè)中存在的 “ 蜘蛛網(wǎng) ” 現(xiàn)象 蜘蛛網(wǎng)問題( 3) 7 1. 數(shù)據(jù)分析的結(jié)果缺乏可靠性 圖 I是否具有市場前景的分析過程和結(jié)果。 企業(yè)的規(guī)模越大 ,“蜘蛛網(wǎng) ” 問題就越嚴重 。 一個大型的公司每天進行上萬次的數(shù)據(jù)抽取很普遍 。又如 , 部門經(jīng)理可能經(jīng)常抽取常用的數(shù)據(jù)到本地 , 有針對性的建立個人級數(shù)據(jù)庫就顯得尤為重要 。 5 在部門級數(shù)據(jù)的基礎(chǔ)上可能還要被繼續(xù)執(zhí)行抽取程序 ,以建立個人級的數(shù)據(jù)庫 。 比如 , 市場部人員通常只關(guān)心企業(yè)的銷售 、 市場策劃方面的信息 , 而不注重企業(yè)的研發(fā) 、 生產(chǎn)等其他環(huán)節(jié) 。 4 蜘蛛網(wǎng)問題( 1) 在市場經(jīng)濟的激烈競爭中 , 信息對于企業(yè)的生存和發(fā)展起著至關(guān)重要的作用 。 而傳統(tǒng)數(shù)據(jù)庫只保留了當前的業(yè)務(wù)處理信息 , 缺乏決策分析所需要的大量的歷史信息 。1 第一篇 數(shù)據(jù)倉庫與 OLAP 第一章 數(shù)據(jù)倉庫基本概念 2 第一章 目錄 ? 從數(shù)據(jù)庫到數(shù)據(jù)倉庫 ? 什么是數(shù)據(jù)倉庫 ? 數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的比較 ? 數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu) ? 數(shù)據(jù)倉庫的數(shù)據(jù)組織 ? 本章小結(jié) 3 從數(shù)據(jù)庫到數(shù)據(jù)倉庫 傳統(tǒng)數(shù)據(jù)庫以及 OLTP ( OnLine Transaction Processing 聯(lián)機事務(wù)處理 ) 在日常的管理事務(wù)處理中獲得了巨大的成功 , 但是對管理人員的決策分析要求卻無法滿足 。 因為 , 管理人員常常希望能夠通過對組織中的大量數(shù)據(jù)進行分析 , 了解業(yè)務(wù)的發(fā)展趨勢 。 為滿足管理人員的決策分析需要 , 就需要在數(shù)據(jù)庫的基礎(chǔ)上產(chǎn)生適應(yīng)決策分析的數(shù)據(jù)環(huán)境 ——數(shù)據(jù)倉庫( Data Warehose) 。 企業(yè)對信息的需求是多方面的 ,為了避免企業(yè)中各部門或各用戶間的沖突和簡化用戶的數(shù)據(jù)視圖 , 一種稱作 “ 抽取程序 ” 的方法被廣泛地應(yīng)用 。 因此 , 將銷售 、 市場策劃方面的信息抽取出來單獨建立部門級的數(shù)據(jù)庫很有必要 , 這樣可以提高數(shù)據(jù)的訪問效率 。 比如 , 專門負責制作公司財務(wù)報表的數(shù)據(jù)人員 , 常常需要從財務(wù)部門的數(shù)據(jù)庫系統(tǒng)中抽取數(shù)據(jù) 。 隨著數(shù)據(jù)的逐層抽取 , 很可能最終導致系統(tǒng)內(nèi)的數(shù)據(jù)間形成了錯綜復雜的網(wǎng)狀結(jié)構(gòu) , 如圖 , 人們形象地稱為“ 蜘蛛網(wǎng) ” 。 這種演變不是人為制造的 , 而是自然演變的結(jié)果 。 蜘蛛網(wǎng)問題( 2) 6 網(wǎng)上的任意兩個節(jié)點的數(shù)據(jù)可能歸根結(jié)底是從一個原始庫中抽取出來的,但其數(shù)據(jù)沒有統(tǒng)一的時間基準,因而錯綜復雜的抽取與訪問將產(chǎn)生很多問題,主要有以下幾個方面。市場部認為“項目 I的市場前景很好” ,而計劃部卻得到截然相反的結(jié)果 “項目I沒有市場前景”。比如,市場部抽取的是項目 I在大客戶中的應(yīng)用情況,而計劃部抽取的是項目 I在普通客戶中的應(yīng)用情況。如市場部在星期日晚上提取分析所需的數(shù)據(jù),而計劃部在星期三下午就抽取了數(shù)據(jù)。 再次,引用外部信息的不同。市場部門引用的外部信息來源可能與計劃部門不同,而外部信息自然是仁者見仁,智者見智,這也可能是導致最終分析結(jié)果不同的原因。市場部門使用的分析程序可能與計劃部門不同,分析的內(nèi)容和指標也可能不同。 在一個大型企業(yè)中 , 不同級別的數(shù)據(jù)庫可能使用不同類型的數(shù)據(jù)庫系統(tǒng) , 對于擁有巨型數(shù)據(jù)量的企業(yè)級數(shù)據(jù)庫可能使用 IBM DB2, 而對于部門級和個人級的中小
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1