【正文】
Time Sequence 許多業(yè)務(wù)問題可以映射到數(shù)據(jù)挖掘技術(shù) Intelligent Miner for Data IBM Intelligent Miner for Data Sequential Patterns Associations Predictive Modeling Deviation Detection Clustering Classification Data Mining Kernels Visualization Tools IBM DM PreProcessing Library DB2 Flat Files 數(shù)據(jù)驅(qū)動(dòng) 發(fā)現(xiàn)競(jìng)爭(zhēng)優(yōu)勢(shì) Server端運(yùn)行于 NT/2022, AIX, SUN Solaris, MVS, AS/400 Client端運(yùn)行于Win95/NT/2022, AIX, SUN Solaris 分群 (Clustering)結(jié)果樣例 分群 (Clustering)結(jié)果樣例 分類 (Classification)結(jié)果樣例 ?客戶表 ?公司與客戶發(fā)生關(guān)系的各個(gè)方面 ?預(yù)測(cè)客戶可能帶來的利潤(rùn) car type car age profession age amount of claims van physicist 52 0 van 12 physician 31 5,000 pact 1 teacher 25 386 sedan teacher 55 1,234 pact 4 secretary 39 998 sports car 3 car dealer 62 stat. wagon vicar 30 sedan 46 pact butcher 46 預(yù)測(cè)樣例 ? Intelligent Miner for Data支持三種類型的關(guān)聯(lián)分析 ?發(fā)現(xiàn)關(guān)聯(lián)規(guī)則 ? 在交易數(shù)據(jù)庫中,每一筆交易包括一組元素,本算法可以發(fā)現(xiàn)所有的關(guān)聯(lián)關(guān)系,例如一組元素的出現(xiàn)將導(dǎo)致另一組元素的出現(xiàn)。home39。 – 數(shù)據(jù)倉(cāng)庫中的信息是 面向主題的 、 集成化的 、穩(wěn)定的 、 隨時(shí)間變化 的數(shù)據(jù)集合,用以支持管理決策的過程。 VSAM Files Data Joiner DB2 Intelligent Miner for Data 數(shù)據(jù)智能挖掘服務(wù)器 什么是數(shù)據(jù)倉(cāng)庫 數(shù)據(jù)倉(cāng)庫是指從 業(yè)務(wù)數(shù)據(jù) 中創(chuàng)建 信息數(shù)據(jù)庫 ,并針對(duì) 決策 和 分析 進(jìn)行優(yōu)化。 不同的數(shù)據(jù)用于不同的目的 ?面向主題 ?集成 ?比較穩(wěn)定 ?包含歷史數(shù)據(jù) ?支持管理決策 ?面向應(yīng)用 ?有限集成 ?經(jīng)常更新 ?僅有當(dāng)前值 ?支持日常業(yè)務(wù)運(yùn)作 業(yè)務(wù)數(shù)據(jù) 信息數(shù)據(jù) 業(yè)務(wù)數(shù)據(jù)和信息數(shù)據(jù)根本不同! Trust Accounts Checking Accounts Loan Accounts 年 月 日 Account History 建立數(shù)據(jù)倉(cāng)庫的過程 商業(yè)主題 業(yè)務(wù)信息 業(yè)務(wù)數(shù)據(jù) 管理 轉(zhuǎn)換工具 商業(yè)視圖 元數(shù)據(jù) ?成員 ?映射 ?商業(yè)視圖 Templates 外部數(shù)據(jù) DB2 Data Warehouse體系結(jié)構(gòu) ?Log Server ?Kernel ?Dispatcher ?Scheduler Clients Warehouse Server Warehouse Agents Databases Relational Source DB2 Target Data Message Message NonRel Source End Users Data Data Data Data NT/2022, OS/2, AIX, Sun, OS/390, AS/400 ?DDD ?Log ?Editions ?Configuration Control Database DB2 Metadata Metadata Type title ?Type text Flat Files Data Warehouse Center Message NT/2022 NT/2022 Agent NT/2022, AIX, Sun Included with DB2 UDB 數(shù)據(jù)倉(cāng)庫代理 (Agent)技術(shù) 數(shù)據(jù)倉(cāng)庫控制服務(wù)器 (Warehouse Control Server) ? 時(shí)間表啟動(dòng) ? 從控制數(shù)據(jù)庫中獲取商業(yè)視圖定義 ? 啟動(dòng)代理 (通過代理 后臺(tái) 進(jìn)程 ) ? 循環(huán) : 接受和記錄結(jié)果 更新客戶端顯示 數(shù)據(jù)倉(cāng)庫代理 (Agent) ? 響應(yīng) VW管理器 ? 循環(huán) : 接受命令 執(zhí)行命令 報(bào)告狀態(tài) DB2 UDB高度并行的海量數(shù)據(jù)庫 ?Cluster ?多個(gè)大緩沖區(qū) ?支持 64位內(nèi)存尋址 內(nèi)存管理 單處理器 對(duì)稱多處理 (SMP) Massively Parallel Processor (MPP) ?增強(qiáng)的 SMP并行支持 ?MPP并行支持 ?并行事務(wù) CPU SQL CPU SQL CPU SQL CPU SQL ?并行查詢 SQL CPU CPU CPU CPU SQL Query Query Optimizer Best Query Plan Threaded Code Compile Time Run Time Agent Agent Agent Prefetchers ?Single query involves ?1 coordinating agent ?n sub agents ?m prefetchers (shared) ?All executing in parallel on available processors ?Combination of... ?Data parallelism ?Each agent works on subset of data ?Data dynamically assigned so user not required to partition data ?Functional parallelism (pipelining) ?Each agent works on different query functi