freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

crm與數(shù)據(jù)倉庫(1)-wenkub

2023-03-28 21:38:49 本頁面
 

【正文】 銀行業(yè)務數(shù)據(jù)倉庫中 , 選擇業(yè)務 、 貨幣 、 客戶 、 機構 、 會計科目五個主題 , 并將會計科目作為連接其他四個主題的交易主題進行處理 。 數(shù)據(jù)倉庫概念的兩個層次 ? 功能上:數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫; ? 內容和特征上:數(shù)據(jù)倉庫是對多個異構的數(shù)據(jù)源有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。 ? 數(shù)據(jù)倉庫的數(shù)據(jù)從聯(lián)機的事務處理系統(tǒng)、異構的外部數(shù)據(jù)源、脫機的歷史業(yè)務數(shù)據(jù)中得到。 ? 業(yè)務數(shù)據(jù)的模式是針對事務處理系統(tǒng)而設計的,數(shù)據(jù)的格式和描述方式并不適合非計算機專業(yè)人員進行業(yè)務上的分析和統(tǒng)計。 ? 在事務處理系統(tǒng)中積累了大量的細節(jié)數(shù)據(jù),一般而言, DSS并不對這些細節(jié)數(shù)據(jù)進行分析。但對于決策分析而言,歷史數(shù)據(jù)是相當重要的,許多分析方法必須一大量的歷史數(shù)據(jù)為依托。集成數(shù)據(jù)必須以一定的周期(例如 24小時)進行刷新,我們稱其為動態(tài)集成。當前絕大多數(shù)企業(yè)內數(shù)據(jù)的真正狀況是分散而非集成的。 ? 聯(lián)機分析和事務處理對系統(tǒng)的要求不同,同一個數(shù)據(jù)庫在理論上難以做到兩全,將具有如此不同處理性能的兩種應用放在同一個環(huán)境中運行顯然是不適當?shù)摹? ? 所有聯(lián)機事務處理強調的是數(shù)據(jù)更新處理性能和系統(tǒng)的可靠性,并不關心數(shù)據(jù)查詢的方便與快捷。從某種意義上說,數(shù)據(jù)倉庫是客戶關系管理的靈魂。利用數(shù)據(jù)倉庫,企業(yè)可以對客戶行為的分析與預測,從而制定準確的市場策略、發(fā)現(xiàn)企業(yè)的重點客戶和評價市場性能,并通過銷售和服務等部門與客戶交流,實現(xiàn)企業(yè)利潤的提高。在事務處理環(huán)境中,用戶的行為特點是數(shù)據(jù)的存取操作頻率高而每次操作處理的時間短。 ( 2)數(shù)據(jù)集成問題。 ? 造成這種分散的原因有多種,主要有事務處理應用分散、“蜘蛛網(wǎng)”問題、數(shù)據(jù)不一致問題、外部數(shù)據(jù)和非結構化數(shù)據(jù)。顯然,事務處理系統(tǒng)不具備動態(tài)集成的能力。沒有歷史數(shù)據(jù)的詳細分析,是難以把握企業(yè)的發(fā)展趨勢的。在分析前,往往需要對細節(jié)數(shù)據(jù)進行不同程度的綜合。 ? 有人感嘆: 20年前查詢不到數(shù)據(jù)是因為數(shù)據(jù)太少了,而今天查詢不到數(shù)據(jù)是因為數(shù)據(jù)太多了。它是一個聯(lián)機的系統(tǒng),專門為分析統(tǒng)計和決策支持應用服務,通過它可滿足決策支持和聯(lián)機分析應用所要求的一切。 數(shù)據(jù)倉庫四個特點 面向主題 ? 傳統(tǒng)的數(shù)據(jù)庫是面向應用而進行數(shù)據(jù)組織的 , 其抽象程度不夠高 ,沒有完全實現(xiàn)數(shù)據(jù)與應用的分離 。 ? 面向主題可以獨立于數(shù)據(jù)處理邏輯 , 適用于分析型數(shù)據(jù)環(huán)境 , 適用于建設企業(yè)全局數(shù)據(jù)庫;數(shù)據(jù)倉庫中目前仍采用關系數(shù)據(jù)庫技術來實現(xiàn) , 其面向主題所作較高程度上的抽象 , 應強調其邏輯意義 。 ? 數(shù)據(jù)倉庫中的數(shù)據(jù)是集成的 。 數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用 , 所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢 , 一旦某個數(shù)據(jù)進入數(shù)據(jù)倉庫以后 , 一般情況下將被長期保留 ,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作 , 但修改和刪除操作很少 , 通常只需要定期的加載 、 刷新 。 ? 操作型數(shù)據(jù)庫含有“當前值”的數(shù)據(jù),這些數(shù)據(jù)的準確性在訪問時是有效的,同樣當前值的數(shù)據(jù)能被更新。數(shù)據(jù)倉庫的數(shù)據(jù)碼鍵都包含時間項,用作標明數(shù)據(jù)的歷史時期。 ? 如果說傳統(tǒng)數(shù)據(jù)庫系統(tǒng)的重點與要求是快速、準確、安全、可靠地將數(shù)據(jù)存進數(shù)據(jù)庫中的話,那么數(shù)據(jù)倉庫的重點與要求就是能夠準確、安全、可靠地從數(shù)據(jù)庫中取出數(shù)據(jù),經(jīng)過加工轉換成有規(guī)律信息之后,再供管理人員進行分析使用。 數(shù)據(jù)的抽取 ? 數(shù)據(jù)的抽取是數(shù)據(jù)進入倉庫的入口。 存儲和管理 ? 數(shù)據(jù)倉庫的真正關鍵是數(shù)據(jù)的存儲和管理。而多維分析又是數(shù)據(jù)倉庫的重要表現(xiàn)形式,近幾年來由于互聯(lián)網(wǎng)的發(fā)展,使得多維分析領域的工具和產(chǎn)品更加注重提供基于 Web前端聯(lián)機分析界面,而不僅僅是在網(wǎng)上發(fā)布數(shù)據(jù)。外部信息包括各類法律法規(guī)、市場信息和競爭對手的信息等等。要決定采用什么產(chǎn)品和技術來建立數(shù)據(jù)倉庫的核心,則需要從數(shù)據(jù)倉庫的技術特點著手分析。其具體實現(xiàn)可以分為: ROLAP、 MOLAP和HOLAP。 數(shù)據(jù)倉庫概述小結 數(shù)據(jù)倉庫的產(chǎn)生 數(shù)據(jù)倉庫概念及特征 數(shù)據(jù)倉庫的內容 數(shù)據(jù)倉庫系統(tǒng)的體系結構 數(shù)據(jù)倉庫的 項目實施 ? 數(shù)據(jù)倉庫系統(tǒng)是一種解決問題的過程,而不是一個可以買到的現(xiàn)成產(chǎn)品。 ? 數(shù)據(jù)倉庫的建設是一個系統(tǒng)工程,是一個不斷建立、發(fā)展、完善的過程,通常需要較長的時間。 數(shù)據(jù)倉庫的 項目實施 項目計劃 ? 項目計劃是指定義創(chuàng)建數(shù)據(jù)倉庫的項目目標和確定項目范圍 , 包括對項目計劃的評估和流程的調整 。 需要在 OLTP數(shù)據(jù)和主題之間找到一個―平衡點 ‖, 根據(jù)主題的需要完整地收集數(shù)據(jù) , 這樣構建的數(shù)據(jù)倉庫才能滿足決策和分析的需要 。 業(yè)務需求分析 ? 業(yè)務需求分析是數(shù)據(jù)倉庫中一個很重要的階段,好的業(yè)務需求分析會使項目成功的機率大大增加。 數(shù)據(jù)線 模型設計 ? 需求分析已經(jīng)確定了用戶業(yè)務分析所需要的數(shù)據(jù)。 ? 模型設計主要包括四個基本步驟:確定合適的主題、劃分粒度層次、設計維表和設計事實表。 ? 僅僅從數(shù)據(jù)模型的角度來著手設計數(shù)據(jù)倉庫會產(chǎn)生一種“平面”效應。三維透視圖表明了這種三維透視。 數(shù)據(jù)線 模型設計 ? 用來管理數(shù)據(jù)倉庫中載入某個實體的大量數(shù)據(jù)的設計結構通常用“星型連接”。 ? 星型連接中央的“訂單”被稱作是“事實表”,而其周圍的其他實體 — “ 產(chǎn)品”、“客戶”、“供應商”和“發(fā)貨”則被稱為“維表”。 ? 文本數(shù)據(jù)常出現(xiàn)在維表中,數(shù)值數(shù)據(jù)常出現(xiàn)在事實表中,這種劃分似乎在所有情況都會發(fā)生。在決策支持系統(tǒng)數(shù)據(jù)倉庫環(huán)境以外,常有數(shù)據(jù)更新,而且數(shù)據(jù)關系的管理要在秒的一級上進行。 雪花模型是對星型模型的擴展,每個維表都可以向外連接到多個詳細類別表 。 ? 雪花模型增加了用戶必須處理的表數(shù)量,增加了某些查詢的復雜性,但這種方式可以使系統(tǒng)進一步專業(yè)化和實用化,同時降低了系統(tǒng)的通用程度。 它是數(shù)據(jù)倉庫設計工程中非常重要的過程 , 它由三個主要步驟組成:抽?。?Extraction) 、 轉換 (Transformation)、 加載 (Load), 簡稱 ETL。 根據(jù)元數(shù)據(jù)庫中的主題表定義 、 數(shù)據(jù)源定義 、 數(shù)據(jù)抽取規(guī)則定義對異地異構數(shù)據(jù)源 ( 包括各平臺的數(shù)據(jù)庫 、 文本文件 、 HTML文件 、 知識庫等 ) 進行清理 、 轉換 , 對數(shù)據(jù)進行重新組織和加工 ,裝載到數(shù)據(jù)倉庫的目標庫中 。 這兩個數(shù)據(jù)源的值都是正確的 , 但對于目標數(shù)據(jù)來說 , 必須加工為一種統(tǒng)一的方法來表示該屬性值 , 然后交由最終用戶進行驗證 , 這樣才能保證數(shù)據(jù)的質量 。 數(shù)據(jù)倉庫規(guī)模一般都很大 , 從建立之初就要保證它的可管理性 , 一個企業(yè)可能建立幾個數(shù)據(jù)倉庫或數(shù)據(jù)集市 , 但他們可共用一個元數(shù)據(jù)庫對其進行管理 。 技術線 ? 技術線的實施分為技術選擇和產(chǎn)品選擇兩個步驟。技術體系選擇必須從為這些技術建立全局的結構框架和視角出發(fā),選擇中需要同時考慮三個因素:商業(yè)需求、當前的技術環(huán)境、計劃的策略技術方向。 數(shù)據(jù)倉庫的建立最終是為應用服務的 , 所以需要對應用進行設計和開發(fā) , 以更好地滿足用戶的需要 。 ? 應用設計的任務是設計標準的用戶應用模板。 ? 應用是數(shù)據(jù)倉庫建立的最終目的,對于應用提出的要求,數(shù)據(jù)倉庫建立過程中是必須加以充分考慮的。更新操作有兩種情況,即在倉庫的原有數(shù)據(jù)表中進行某些數(shù)據(jù)的更新和產(chǎn)生一個新的時間區(qū)間的數(shù)據(jù),因為匯總數(shù)據(jù)與數(shù)據(jù)倉庫中的許多信息元素有關系,必需完整地匯總,這樣才能保證全體信息的一致性。 在實際建立的過程中 , 一方面數(shù)據(jù)倉庫的數(shù)據(jù)內容 、 結構 、 粒度和其他物理設計需要根據(jù)用戶的反饋信息不斷地調整完善;另一方面 , 應用環(huán)境發(fā)生重大變化或者新技術出現(xiàn) , 都有可能導致用戶的應用需求發(fā)生重大變化 ,使現(xiàn)有系統(tǒng)不能滿足用戶要求 , 需要重新設計系統(tǒng) , 開始一個新的生命周期 。細化程度越高,粒度級就越?。幌喾?,細化程度越低,粒度級就越大。 ? 高粒度級。 ? 高粒度級。然而數(shù)據(jù)量大小和原始空間問題不是僅有的應考慮的問題。 ? 企業(yè)需要多個粒度級而不是一個粒度級的需求,是因為粒度級設計采用雙重級別應該是幾乎每個機構默認的選擇。多達 3 0多天的細節(jié)存放在這種操作層中。 ? 鑒于費用、效率、訪問便利和能夠回答任何可以回答的查詢的能力,數(shù)據(jù)雙重粒度級是 ? 大多數(shù)機構建造數(shù)據(jù)倉庫細節(jié)級的最好選擇。 ? 連續(xù)。換句話說,對一個顧客的一個帳號的每天的所有活動進行合計,并在一天一天的基礎上輸入數(shù)據(jù)倉庫。第一周的七天中的活動被逐一綜合到七個每日相應的位置,到第八天,將七個每日位置的數(shù)據(jù)加到一起,并放入第一周的數(shù)據(jù)位置中。 輪轉綜合數(shù)據(jù)存儲 簡單堆積 vs輪轉綜合 簡單直接文件 ? 數(shù)據(jù)僅僅是從操作型環(huán)境拖入數(shù)據(jù)倉庫環(huán)境中,并沒有任何累積。把 1月份和 2月份的兩個數(shù)據(jù)快照合并,創(chuàng)建數(shù)據(jù)的一個連續(xù)文件。 ? 在數(shù)據(jù)倉庫環(huán)境中的元數(shù)據(jù)所扮演的角色和在操作型環(huán)境中數(shù)據(jù)所扮演的角色是不同的。I T專業(yè)人員不僅懂計算機,而且由于學歷背景和所受的培訓,他們會在系統(tǒng)中找到他們自己的方法。另外,在 D S S分析者計劃該怎樣去做信息型 /分析型處理時,他們要首先去看元數(shù)據(jù)。 基本數(shù)據(jù)元數(shù)據(jù):包括定義 、 結構的所有描述 。 系統(tǒng)的使用方法 , 已定義的查詢 , 視圖和現(xiàn)有的應用等相關的信息 。 靜態(tài)元數(shù)據(jù)主要與數(shù)據(jù)結構有關 。 —— DW中數(shù)據(jù)所持有的類型 。 例如 Customer_ID表示客戶的編號 , 開頭字母為 A表示集體客戶 , B為個人客戶 。 —— 統(tǒng)計數(shù)據(jù)訪問的用戶 , 訪問時間和訪問次數(shù) 。 —— 描述 DW系統(tǒng)的使用方法和管理的特性 , 例如數(shù)據(jù)的使用方法概括數(shù)據(jù)的概括公式等 。換句話說,一個數(shù)據(jù)結構能在 5到 1 0年內保持不變是很不平常的。 DW元數(shù)據(jù)的廣義索引中存有每次數(shù)據(jù)裝載時產(chǎn)生的有關決策的數(shù)據(jù) , 在做決策時 , 可以先查詢該部分數(shù)據(jù) , 再決定是否進行進一步的搜索 。 并清晰的表示出來 ,管理起來 。 ? 數(shù)據(jù)倉庫的開發(fā)過程是一個構造工程的過程 ,必須提供清晰的文檔 。 元數(shù)據(jù)對多個來源的數(shù)據(jù)集成發(fā)揮著關鍵作用 。 ? ⑶ 屬性到屬性的映射 。 數(shù)據(jù)倉庫主要應用 ? 數(shù)據(jù)倉庫直接訪問 ? 使用瀏覽分析工具在 DW中尋找有用的信息。 ? 在保險業(yè)的應用 :滿足保險行業(yè)日益增長的各種查詢 、 統(tǒng)計 、 報表以及分析的需求 , 提高防范和化解經(jīng)營風險的能力 , 有效利用這些數(shù)據(jù)來實現(xiàn)經(jīng)營目標 , 預測保險業(yè)的發(fā)展趨勢 , 甚至利用這些數(shù)據(jù)來設計保險企業(yè)的發(fā)展宏圖 , 在激烈的競爭中贏得先機 . ? 在客戶服務及營銷方面的應用 :CRM ? 在保健領域的應用 :揭示出如何以較低費用獲取較高質量的治療策略趨勢和模式 . 聯(lián)機分析處理( OLAP) ? 聯(lián)機分析處理( OLAP)的概念最早是由關系數(shù)據(jù)庫之父 1993年提出的。 聯(lián)機分析處理( OLAP) ? OLAP是一種軟件技術 , 他使分析人員能夠迅速 、 一致 、交互地從各個方面觀察信息 , 以達到深入理解數(shù)據(jù)的目的 , 這些信息是從原始數(shù)據(jù)直接轉換過來的 , 他們以用戶容易理解的方式反映企業(yè)的真實情況 。 OLAP特性 ? (1)快速性 :用戶對 OLAP的快速反應能力有很高的要求 。 系統(tǒng)必須提供對數(shù)據(jù)的多維視圖和分析 ,包括對層次維和多重層次維的完全支持 。 ? 維是人們觀察問題的特定角度 , 例如:時間維 、 地理維 、 產(chǎn)品維 。在某一時間,也許他想知道哪個商店哪種產(chǎn)品的銷售情況。維就是相同類數(shù)據(jù)的集合,也可以理解為變量。這些屬性對進行決策支持是非常有用的。 如果維已經(jīng)分成了多層次的 , 則維成員就是不同維層次取值的組合 。 多維數(shù)據(jù)集是決策支持的支柱 , 也是 OLAP的核心 。 – 人們很容易理解一個二維表 (如通常的電子表格 ),對于三維立方體同樣也容易理解。要突破三維的障礙,就必須理解邏輯維和物理維的差異。 ? 當在多維數(shù)據(jù)集的每個維都選中一個維成員以后 , 這些維成員的組合就惟一確定了觀察變量的值 。 ? 多維數(shù)據(jù)集的度量值是 OLAP分析的核心值 , 是用戶在 DW中需要查看的數(shù)據(jù) , 一般是銷售量 、 成本 、 費用等 。 ? (Rotate)/轉軸 (Pivot) – 通過旋轉可以得到不同視角的數(shù)據(jù) 。 OLAP存儲方式 – OLAP有多種實現(xiàn)方法,根據(jù)存儲數(shù)據(jù)的方式不同可以分為 ROLAP、MOLAP、 HOLAP。另一類是維表 ,即對每個維至少使用一個表來存放維的層次、成員類別等維的描述信息。以多維數(shù)據(jù)組織方式為核心 ,也就是說 ,MOLAP使用多維數(shù)組存儲數(shù)據(jù)。這種方式具有更好的靈活性。 Budget Time_id Sales Table Discount% Dollars Units Fact Table Market_id Product_id Scenario Product_id
點擊復制文檔內容
醫(yī)療健康相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1