freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計論文-基于數(shù)據(jù)倉庫的學(xué)生成績管理系統(tǒng)的研究(編輯修改稿)

2025-07-08 00:04 本頁面
 

【文章內(nèi)容簡介】 對其進(jìn)行存儲、管理和維護(hù),由于數(shù)據(jù)庫管理系統(tǒng)( database management system,DBMS)的局限性使得它很難滿足人們的需求。 DBMS 的缺陷主要表現(xiàn)為:數(shù)據(jù)量成幾何級數(shù)增長;數(shù)據(jù)來源不同的數(shù)據(jù)難以集成;訪問這些數(shù)據(jù)時的響應(yīng)性能不斷降低。而應(yīng)用決策支持系統(tǒng)( decision support system,DSS),它所需的數(shù)據(jù)必須經(jīng)過提取、轉(zhuǎn)換、過濾等預(yù)處理操作并與其他數(shù) 據(jù)源整合,按主題存放在數(shù)據(jù)庫中??蛻舨樵儠r訪問的是中央數(shù)據(jù)庫( database, DB),因此要想使數(shù)據(jù)能更好地為用戶服務(wù),必須經(jīng)過清洗、轉(zhuǎn)換和加載。這些工作通常都在數(shù)據(jù)倉庫( data warehouse,DW)中完成。 1 數(shù)據(jù)倉庫概念 20 世紀(jì) 50年代中期,“數(shù)據(jù)倉庫之父” WiiliamHhimon 出版的《建立數(shù)據(jù)倉庫》中對數(shù)據(jù)倉庫進(jìn)行了定義,他指出:數(shù)據(jù)倉庫是一個面向主題的、集成的、不可更新的、隨時間變化的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉庫與其他數(shù)據(jù)庫不同,它更像是一種過程,它是對各種業(yè)務(wù)數(shù)據(jù)的 整合、加工和分析。數(shù)據(jù)倉庫用于支持決策,面向的是分析型數(shù)據(jù)處理,所以它并不等同于操作型數(shù)據(jù)庫;數(shù)據(jù)倉庫是通過數(shù)據(jù)清理、變換、集成和定期刷新來構(gòu)造的,這些數(shù)據(jù)一般是歷史的積累數(shù)據(jù),一般不做修改。 2 數(shù)據(jù)倉庫的特點 數(shù)據(jù)倉庫主要有四個特征:面向主題性、集成性、不可更新性、隨時間變化性。 ( 1) 數(shù)據(jù)倉庫是面向主題的 以前的操作型數(shù)據(jù)庫中側(cè)重的是聯(lián)機(jī)事務(wù),各項數(shù)據(jù)的應(yīng)用邏輯是相互組合的,分離 度不高。數(shù)據(jù)倉庫中的數(shù)據(jù)由于是面向主題進(jìn)行組織的,所以能完整地刻畫各項數(shù)據(jù)以及數(shù)據(jù)之間的關(guān)系。 ( 2) 數(shù)據(jù)倉庫中的數(shù)據(jù)是集成的 數(shù)據(jù)倉庫中的數(shù)據(jù)大多數(shù)都是來自不同的外部應(yīng)用系統(tǒng)或者是本系統(tǒng)中不同的使用部門。我們一般把數(shù)據(jù)倉庫中的數(shù)據(jù)分為外部數(shù)據(jù)和內(nèi)部數(shù)據(jù),外部應(yīng)用系統(tǒng)的信息就叫外部數(shù)據(jù),本系統(tǒng)中的信息就叫內(nèi)部數(shù)據(jù)。這些內(nèi)外數(shù)據(jù)的組織結(jié)構(gòu)會有所不同,這就需要對不同的數(shù)據(jù)源數(shù)據(jù)進(jìn)行集成,目的是為了保持?jǐn)?shù)據(jù)的一致性。我們所說的數(shù)據(jù)集成并不是對數(shù) ( 3) )數(shù)據(jù)倉庫中的數(shù)據(jù)是不可更新的 數(shù)據(jù)倉庫中的數(shù)據(jù)記錄的是日積月累的歷史數(shù)據(jù)的內(nèi)容,反映的是不同時間點的數(shù)據(jù)庫快照集合通過數(shù)據(jù)的統(tǒng)計、整合和重組而得 出的數(shù)據(jù)。數(shù)據(jù)倉庫數(shù)據(jù)的不可更新性并不意味著不可以對數(shù)據(jù)進(jìn)行更新操作。當(dāng)我們要進(jìn)行新的分析決策時,這時候就需要對數(shù)據(jù)進(jìn)行更新操作,把數(shù)據(jù)倉庫中那些過時的數(shù)據(jù)刪掉,并將近期的數(shù)據(jù)進(jìn)行集成整合然后添加到數(shù)據(jù)庫中進(jìn)而生成新的記錄。這些修改和重組的任務(wù)是由數(shù)據(jù)倉庫管理員定期后臺實現(xiàn)的,最終用戶不允許參與。 .3 數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu) 數(shù)據(jù)倉庫系統(tǒng)是在數(shù)據(jù)倉庫的基礎(chǔ)上建立的,它通過查詢工具和分析工具提取出滿足用戶的各種需求的數(shù)據(jù)信息。 數(shù)據(jù)倉庫的基本體系結(jié)構(gòu), ( 1)數(shù)據(jù)源 數(shù)據(jù)源是數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)源 泉,為整個系統(tǒng)的分析和使用提供可能。 ( 2)數(shù)據(jù)的抽取、轉(zhuǎn)換、裝載、預(yù)處理 數(shù)據(jù)的抽取是將數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)倉庫統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)和內(nèi)部格式,數(shù)據(jù)的凈化是確保數(shù)據(jù)的有效性并能為決策服務(wù)。數(shù)據(jù)的裝載是將凈化的數(shù)據(jù)加載到數(shù)據(jù)倉庫數(shù)據(jù)庫。數(shù)據(jù)的提取、凈化、轉(zhuǎn)化到加載這四個過程被稱為數(shù)據(jù)分級。 ( 3)元數(shù)據(jù) 元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),是用于描述數(shù)的要素、數(shù)據(jù)集的內(nèi)容、數(shù)據(jù)的覆蓋范圍、數(shù)據(jù)的所有者、數(shù)據(jù)的提供方式、數(shù)據(jù)的質(zhì)量和管理方式等有關(guān)的信息。 (二) 數(shù)據(jù)挖掘 1 數(shù)據(jù)挖掘的概念 數(shù)據(jù)挖掘 (Data Mining, DM)是從大量的、隨機(jī)的、 不完全的、 模糊的、有噪聲的數(shù)據(jù)中,提取出隱含在數(shù)據(jù)中的、隱藏的、但又有潛在使用價值的信息和知識的過程。因此它是一種深層次的信息分析方法。數(shù)據(jù)挖掘出來的內(nèi)容必須是需求者感興趣的信息,因此數(shù)據(jù)挖掘過程就是使用各種挖掘技術(shù)從大型數(shù)據(jù)庫中提取出人們感興趣的信息的過程,提取出來的這些信息和知識用概念、規(guī)則、規(guī)律、模式等形式來表示。在高校中,我們可以使用數(shù)據(jù)挖掘技術(shù)對學(xué)生的成績進(jìn)行全面地分析,找出學(xué)生成績與其它各種因素之間隱藏的內(nèi)在聯(lián)系,定性的從不同的角度精確地展現(xiàn)學(xué)生成績,從而找出影 響學(xué)生成績變化的可能因素,進(jìn)而提出一些教學(xué)建議和改進(jìn)措施,提高學(xué)生學(xué)習(xí)的積極性,讓學(xué)習(xí)效果更好。 2 數(shù)據(jù)挖掘的對象 數(shù)據(jù)挖掘的對象主要包括關(guān)系數(shù)據(jù)庫、事務(wù)數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、數(shù)據(jù)倉庫、文本數(shù)據(jù)源、遺產(chǎn)數(shù)據(jù)庫以及 Web 頁等八個方面。 3 數(shù)據(jù)挖掘的任務(wù) 數(shù)據(jù)挖掘的主要任務(wù)是發(fā)掘數(shù)據(jù)倉庫還沒有被發(fā)現(xiàn)的知識。決策者明確需要了解的信息,我們可以直接使用查詢、 OLAP 技術(shù)或其它工具來得到;而有些隱藏的信息我們就不能直接得到,因而就需要用到數(shù)據(jù)挖掘技術(shù)。在數(shù)據(jù)倉庫中應(yīng)用數(shù)據(jù)挖掘技術(shù)可從 中找出有價值的信息和知識,然后再利用這些信息和知識指導(dǎo)實際操作。 數(shù)據(jù)挖掘的任務(wù)包括關(guān)聯(lián)模式、聚類模式、分類和預(yù)測、偏差檢測與時序模式。 (1)關(guān)聯(lián)模式。關(guān)聯(lián)模式是指數(shù)據(jù)項之間存在的關(guān)聯(lián)規(guī)則,如果兩個或兩個以上數(shù)據(jù)項重復(fù)出現(xiàn)的概率比較高,它們之間就可能存在某種關(guān)系,我們把這種可能的關(guān)系稱之為關(guān)聯(lián)規(guī)則。 (2)聚類模式。按照相似度把數(shù)據(jù)歸并成若干類,要求同一類別中的數(shù)據(jù)相似、數(shù)據(jù)間的距離較小,不同類別中的數(shù)據(jù)相異、數(shù)據(jù)間的距離較大,我們把它稱之為聚類。 (3)分類和預(yù)測。描述和區(qū)分?jǐn)?shù)據(jù)的類或概念的技術(shù)成為分類技術(shù),分好的類或概念模型能夠預(yù)測未知的對象類。 (4)偏差檢測。分類中的反常實例和不滿足規(guī)則的特例不能直接用于數(shù)據(jù)分析,需要經(jīng)過檢查偏差,預(yù)測數(shù)據(jù)庫中數(shù)據(jù)的某些異常問題,為后一步的改正做好鋪墊。 (5)時序模式。時間序列模式是根據(jù)數(shù)據(jù)的發(fā)展趨勢來預(yù)測將來可能出現(xiàn)的值,它是根據(jù)時間序列查詢出事件較高的發(fā)生概率來實現(xiàn)的。 (三)聯(lián)機(jī)分析處理 1 OLAP 的概念 聯(lián)機(jī)分析處理是從信息數(shù)據(jù)的多種可能的角度進(jìn)行觀察分析以得到這些角度對度量值的影響情況, 我們把這些角度稱之為“維”。聯(lián)機(jī)分析處理技術(shù)支持動態(tài)多維分析,所謂動態(tài)多維分析是指跨維,在不同的層次選取成員進(jìn)行計算和建模,在不同的時間段進(jìn)行趨勢分析和預(yù)測分析;對數(shù)據(jù)進(jìn)行切片和切塊等多個方面對數(shù)據(jù)進(jìn)行深入地分析;它還可以用于查詢底層的細(xì)節(jié)數(shù)據(jù),通過旋轉(zhuǎn)對不同維進(jìn)行比較。 OLAP 中的變量是指從現(xiàn)實系統(tǒng)中抽取出來的用來描述數(shù)據(jù)的實際含義;人們從不同的角度來觀察數(shù)據(jù),這些角度就是維度;數(shù)據(jù)的某一個維度有可能存在更細(xì)節(jié)化的描述,我們把它稱作維的層次;維成員是維度中的一個取值。 .2 OLAP 的特性 ( 1) 快速 性 OLAP 能快速的對數(shù)據(jù)進(jìn)行分析,基本上在 5 秒鐘之內(nèi)就能分析出用戶的需求信息。之所以反應(yīng)這么敏捷是因為數(shù)據(jù)存儲格式、高效的硬件設(shè)計等給它的快速運(yùn)行提供了可能。 ( 2) 可分析性 OLAP 系統(tǒng)可處理與應(yīng)用有關(guān)的邏輯分析和統(tǒng)計分析。用戶分析數(shù)據(jù)可以直接在OLAP 平臺進(jìn)行,也可以與其他外部分析工具連接后進(jìn)行,這里的外部分析工具包括時間序列分析工具、成本分配工具、意外報警、數(shù)據(jù)開采等。 ( 3) 多維性 進(jìn)行多維分析的基礎(chǔ)必須要多個維度,用戶應(yīng)在 SQL Server 里創(chuàng)建多維數(shù)據(jù)集
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1