freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫復(fù)習(xí)提綱(專業(yè)版)

2025-09-16 07:54上一頁面

下一頁面
  

【正文】 假定這些事務(wù)中的項(xiàng)按順序存放。2概念分層最常用的兩種類型(1)、概念分層:以DB模式中屬性的全序或偏序來定義的概念分層稱作模式分層。2 試述商業(yè)智能系統(tǒng)的演化過程(1)、第一代:基于主機(jī)的查詢與報(bào)表、面向?qū)<以缙诘纳虅?wù)信息系統(tǒng)使用批處理應(yīng)用程序?yàn)樯虡I(yè)用戶提供它們所需的信息。(2)、多維OLAP(MOLAP)服務(wù)器優(yōu)勢:性能好,相應(yīng)速度快;專為OLAP所設(shè)計(jì)支持高性能的決策支持計(jì)算,如:復(fù)雜的跨維的計(jì)算;多用戶的讀寫操作;行級的計(jì)算。試敘述數(shù)據(jù)倉庫設(shè)計(jì)的步驟及每一步完成的工作:(1)、概念模型:界定系統(tǒng)的邊界;確定主要的主題域;(2)、技術(shù)準(zhǔn)備工作:技術(shù)評估;技術(shù)環(huán)境準(zhǔn)備;(3)、邏輯模型設(shè)計(jì):分析主題域;粒度層次的劃分;確定數(shù)據(jù)分割策略;關(guān)系模式定義;定義記錄系統(tǒng);(4)、物理模型設(shè)計(jì):確定數(shù)據(jù)存儲結(jié)構(gòu);確定索引策略;確定數(shù)據(jù)存放位置;確定存儲分配;(5)、數(shù)據(jù)倉庫生成:設(shè)計(jì)接口和數(shù)據(jù)裝入;(6)、數(shù)據(jù)倉庫的使用和維護(hù):建立DSS;不斷理解需求和完善系統(tǒng);維護(hù)DW;OLAP與OLTP的區(qū)別有哪些?它們適合于運(yùn)行在同一個服務(wù)器上嗎?為什么?OLTPOLAP用戶操作人員,低層管理人員決策人員,高級管理人員功能日常操作處理分析決策DB 設(shè)計(jì)面向應(yīng)用面向主題數(shù)據(jù)當(dāng)前的, 最新的細(xì)節(jié)的, 二維的分立的歷史的, 聚集的, 多維的集成的, 統(tǒng)一的存取讀/寫數(shù)十條記錄讀上百萬條記錄工作單位簡單的事務(wù)復(fù)雜的查詢用戶數(shù)上千個上百萬個DB 大小100MBGB100GBTB時(shí)間要求具有實(shí)時(shí)性對時(shí)間的要求不嚴(yán)格主要應(yīng)用數(shù)據(jù)庫數(shù)據(jù)倉庫為什么要進(jìn)行數(shù)據(jù)的預(yù)處理及其方法:(適當(dāng)舉例即可)(1)、在現(xiàn)實(shí)社會中,存在著大量的“臟”數(shù)據(jù)1)、不完整性 :缺少感興趣的屬性;感興趣的屬性缺少部分屬性值;僅僅包含聚合數(shù)據(jù),沒有詳細(xì)數(shù)據(jù);2)、噪音數(shù)據(jù):數(shù)據(jù)中包含錯誤的信息;存在著部分偏離期望值的孤立點(diǎn);3)、不一致性數(shù)據(jù)結(jié)構(gòu)的不一致性;Label的不一致性;數(shù)據(jù)值的不一致性;(2)、數(shù)據(jù)挖掘的數(shù)據(jù)源可能是多個互相獨(dú)立的數(shù)據(jù)源關(guān)系數(shù)據(jù)庫;多維數(shù)據(jù)庫(Data Cube);文件、文檔數(shù)據(jù)庫(3)、數(shù)據(jù)轉(zhuǎn)換為了數(shù)據(jù)挖掘的方便(4)、海量數(shù)據(jù)的處理數(shù)據(jù)歸約(在獲得相同或者相似結(jié)果的前提下)數(shù)據(jù)預(yù)處理的方法:(1)、數(shù)據(jù)清理填入缺失數(shù)據(jù);平滑噪音數(shù)據(jù);確認(rèn)和去除孤立點(diǎn);解決不一致性;(2)、數(shù)據(jù)集成多個數(shù)據(jù)庫、Data Cube和文件系統(tǒng)的集成;(3)、數(shù)據(jù)轉(zhuǎn)換規(guī)范化、聚集等;(4)、數(shù)據(jù)歸約在可能獲得相同或相似結(jié)果的前提下,對數(shù)據(jù)的容量進(jìn)行有效的縮減;(5)、數(shù)據(jù)離散化對于一個特定的連續(xù)屬性,尤其是連續(xù)的數(shù)字屬性,可以把屬性值劃分成若干區(qū)間,以區(qū)間值來代替實(shí)際數(shù)據(jù)值,以減少屬性值的個數(shù)。在現(xiàn)實(shí)世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的。缺點(diǎn):增加系統(tǒng)復(fù)雜度,增加系統(tǒng)培訓(xùn)及維護(hù)費(fèi)用;受操作系統(tǒng)平臺中文件大小的限制,難以達(dá)到TB級(1020G)需要進(jìn)行預(yù)計(jì)算,可能導(dǎo)致數(shù)據(jù)爆炸;無法支持維的動態(tài)變化,缺乏數(shù)據(jù)模型和數(shù)據(jù)訪問的標(biāo)準(zhǔn)。第一代的商務(wù)信息系統(tǒng)只能被諸如業(yè)務(wù)分析人員之類的熟悉數(shù)據(jù)且有相當(dāng)計(jì)算機(jī)經(jīng)驗(yàn)的人員使用。(2)、集合分組分層:通過將給定維或?qū)傩缘闹惦x散化或分組來定義概念分層。最小支持度minsup=20%,最小置信度閾值minconf=65%,求出強(qiáng)關(guān)聯(lián)規(guī)則。 假設(shè)現(xiàn)有如下所示的一個事務(wù)數(shù)據(jù)庫,數(shù)據(jù)庫中有10個事務(wù),即|D|=10。這樣使得DW與操作型環(huán)境的界面變得簡單了。對于每個測試樣本,將已知的類標(biāo)號與該樣本的學(xué)習(xí)模型類預(yù)測比較。缺點(diǎn):一般比MDD相應(yīng)的速度慢;不支持有關(guān)預(yù)計(jì)算的讀寫操作;SQL無法完成部分計(jì)算:無法完
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1