freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

第9章信息系統(tǒng)的應用與發(fā)展-資料下載頁

2025-07-28 07:54本頁面
  

【正文】 如企業(yè)可以用銷售量、銷售金額、成本和利潤指標來衡量銷售狀況。多維數(shù)組是維和變量的組合表示。一個多維數(shù)組可以表示為(維1,維2,…,維n,變量),如三維數(shù)組(時間,地區(qū),產品,銷售額)組織起來的三維立方體,如圖920所示。圖920 多維數(shù)據(jù)立方體數(shù)據(jù)單元(單元格)是指多維數(shù)組的取值。當多維數(shù)組的各個維都選中一個維成員,這些維成員的組合就唯一確定了度量的值。因此數(shù)據(jù)單元就表示為(維1維成員,維2維成員,…,維n維成員,變量的值)。(3)OLAP的基本操作OLAP分析是指對以多維形式組織起來的數(shù)據(jù)采取切片、切塊、旋轉等各種基本操作,以求剖析數(shù)據(jù),使最終用戶能從多個角度、多側面地觀察數(shù)據(jù)倉庫中的數(shù)據(jù),從而更深入地了解包含在數(shù)據(jù)中的信息、內涵。1)切片(Slice)在多維數(shù)組的某一維上選定其維成員的動作稱為切片,即在多維數(shù)組(維1,維2,…維n,度量)中選中某一維,如維i,并取其某一維成員(設為維成員Vi),所得的多維數(shù)組的子集(維1,維2,…維成員Vi,…維n,度量)稱為在維i上的一個切片。上面圖920中按照產品維、地區(qū)維和時間維組織起來的產品銷售數(shù)據(jù),用多維數(shù)組表示為(時間,地區(qū),產品,銷售額)。如果在地區(qū)維上選定維成員(設為“上?!保偷玫搅说貐^(qū)維上的一個切片;在產品維上選定一個維成員(設為“電冰箱”),就得到了產品維上的一個切片,如圖921所示。圖921 切片 圖922 切塊2)切塊(Dice)數(shù)據(jù)切塊就是將完整的數(shù)據(jù)立方體切取一部分數(shù)據(jù)而得到的新的數(shù)據(jù)立方體。選取多維數(shù)組(維1,維2,…,維n,度量)中若干維度(通常是3個維度便于圖形顯示)的取值范圍,從而形成了多維數(shù)據(jù)的子集(維1,維2,…,Ai 維i Bi,…,Bj 維j Bj,…,維度n,度量),這個多維數(shù)據(jù)子集被稱為切塊。例如在圖920所對應的多維數(shù)組中,選中所有的三個維度:產品維、地區(qū)維和時間維,指定時間維的取值為2002至2004年,地區(qū)維指定為(北京,上海),產品維選定為(電視機,電冰箱)。3)下鉆/上卷(Drill Down/Roll Up)維度是有層次性的,如時間維可以由年、季度、月、日等構成,維度的層次實際上反映了數(shù)據(jù)的細節(jié)程度或者綜合程度。維度層次越高,代表的數(shù)據(jù)綜合度就越高,細節(jié)越少,數(shù)據(jù)量越少;維度層次越低,細節(jié)越充分,數(shù)據(jù)量越大。數(shù)據(jù)下鉆是從較高的維度層次下降到較低的層次上來觀察多維數(shù)據(jù)。數(shù)據(jù)上卷是下鉆的逆向操作,是對數(shù)據(jù)進行高層次聚合操作。圖923顯示了一個企業(yè)在不同時間和不同地區(qū)上的銷售額的分布情況。圖中的第一張表,時間層次是“年”,如果選擇時間維度下鉆,得到圖中的第二張表。如果從圖中的第二張表按時間維上卷,則可以獲得綜合度更高的第一張表。因此,上卷和下鉆是互逆的。圖923 下鉆/上卷圖924 不同維度間的旋轉4)旋轉(Rotate)數(shù)據(jù)旋轉是改變維度的位置關系,使最終用戶可以從其他視角來觀察多維數(shù)據(jù)。圖924是把橫向的時間維度和縱向的地區(qū)維度進行了變換,形成了橫向為地區(qū)、縱向為時間的報表。圖925則是在維度的層次之間進行交換,這使得最終用戶能夠更好地對不同年份同時期的數(shù)據(jù)進行比較。圖925 維層次間的旋轉3.知識發(fā)現(xiàn)與數(shù)據(jù)挖掘基于數(shù)據(jù)倉庫和OLAP技術所得到的分析結果通常是運用已有的知識(如業(yè)務規(guī)則和商務規(guī)律)來建立決策分析模型,并通過數(shù)據(jù)倉庫的支持進行多維視角的預測和回溯分析。20世紀90年代以來,隨著計算機技術的飛速發(fā)展以及人工智能、數(shù)據(jù)倉庫、統(tǒng)計分析、專家系統(tǒng)以及數(shù)據(jù)可視化等技術的集成,使得人們可以從另外一個方向去思考決策分析問題:當面臨大量數(shù)據(jù)的時候,人們不是根據(jù)已知的領域的知識和規(guī)則來構造模型,并通過數(shù)據(jù)進行模型檢驗或預測;而是首先考慮基于大量數(shù)據(jù)的領域的知識和模式的發(fā)現(xiàn)與獲取。這需要通過強大的計算能力,對數(shù)據(jù)進行多層次和多角度的處理,從而得到新穎的、具有潛在有用性的知識。由于這些知識是事先未知的,而且也不是通過已有的規(guī)則或模式推斷得到的,如果它反映了商務運作中潛在的某種規(guī)律性,并被及時利用和把握,將有助于獲得競爭優(yōu)勢。面向這種決策知識的發(fā)現(xiàn)是信息創(chuàng)造的更高形式,也是企業(yè)信息化的更高層次,我們稱之為商務智能(Business Intelligence,BI)。商務智能的核心技術是數(shù)據(jù)挖掘(Data Warehousing,DW),目標是從龐大的數(shù)據(jù)中將有價值的知識挖掘出來。(1)知識發(fā)現(xiàn)與數(shù)據(jù)挖掘隨著數(shù)據(jù)庫技術和軟件開發(fā)技術的飛速發(fā)展,企業(yè)決策者在決策過程中經(jīng)常面臨著這樣一個問題:一方面,企業(yè)能夠比較容易地獲得和存儲大量的業(yè)務信息;另外一方面,除了業(yè)績報表和數(shù)據(jù)庫查詢之外,這些信息并沒有被進一步發(fā)掘和使用,更沒有有效地用于分析處理和決策支持。結果出現(xiàn)了“豐富的數(shù)據(jù),貧乏的信息”的現(xiàn)象。為了從數(shù)據(jù)庫中提取有用的信息,人們開始借助人工智能的成果進行數(shù)據(jù)分析。20世紀80年代末,機器學習方法在數(shù)據(jù)分析中的應用導致數(shù)據(jù)庫知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)的產生。1996年,F(xiàn)ayyad等人給出了知識發(fā)現(xiàn)的定義,即知識發(fā)現(xiàn)是從數(shù)據(jù)集中識別有效模式的非平凡過程,該模式是新穎的、有潛在應用價值的和最終可理解的。如圖926所示,知識發(fā)現(xiàn)這個過程具有多個步驟,它包括數(shù)據(jù)選擇和預處理、數(shù)據(jù)轉化、數(shù)據(jù)挖掘、知識解釋和評價、知識應用等過程,并通過反饋不斷自我改進。其中數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的關鍵步驟。圖926 商務智能中的KDD過程20世紀90年代以來,以數(shù)據(jù)挖掘技術為核心的商務智能(知識發(fā)現(xiàn)在商業(yè)的應用)受到了學術界和業(yè)界的廣泛關注。它所得到的模式蘊涵數(shù)據(jù)集當中對象之間的特定關系,揭示了一些有用的信息,可以為經(jīng)營決策、市場策劃、金融預測等提供依據(jù)。傳統(tǒng)的決策分析技術中,都是決策人員事先給出邏輯假設和模型,而后在數(shù)據(jù)中進行檢驗和參數(shù)評估。這樣就可能會喪失對一些潛在的而事先未知的模式進行檢驗的機會,得不到新穎的模式。而數(shù)據(jù)挖掘是數(shù)據(jù)驅動的,它并不是始于一個有待證明的具體邏輯模式,而是始于紛繁復雜的海量數(shù)據(jù),利用強大的數(shù)據(jù)分析工具和特定的知識提取方法,從數(shù)據(jù)出發(fā),挖掘中其中有效的模式,從而獲得潛在的、新穎的以及有用的知識。(2)數(shù)據(jù)挖掘模式數(shù)據(jù)挖掘的方法一般都是基于機器學習、模式識別以及統(tǒng)計方法的。通過對這些方法的綜合與集成,完成在海量數(shù)據(jù)中對決策知識挖掘的工作。一般來說,數(shù)據(jù)挖掘的基本任務是預測(prediction)和描述(description)。預測就是利用數(shù)據(jù)中已知的變量和字段來確定一些感興趣的未知或未來的值,如分類等。而描述則集中于尋找一種人類能夠理解和解釋的模式對數(shù)據(jù)進行刻畫,如聚類、關聯(lián)規(guī)則等。數(shù)據(jù)挖掘常見模式有以下幾類:1)概念描述(歸納或簡約)包括概念的識別與比較。它是通過將數(shù)據(jù)進行一般化、匯總或將可能矛盾的數(shù)據(jù)的特征進行說明,尋求對一個數(shù)據(jù)子集的簡約的描述。對于給定存放在數(shù)據(jù)庫中的大量數(shù)據(jù),能夠以簡潔的形式在更一般的抽象層描述數(shù)據(jù),便于用戶考察數(shù)據(jù)的一般行為。2)分類和預測這種方法有兩個階段。首先給定已有的數(shù)據(jù)和類別,通過分類算法得到描述和區(qū)分數(shù)據(jù)類或概念的模型;然后將上述分類模型應用到要進行測試的數(shù)據(jù)上,對未來或者未知的數(shù)據(jù)進行預測。圖927給出了一個應用分類技術對顧客的信用水平進行分類的例子?!鸫硭鶎氖杖搿獋鶆涨闆r下償還貸款的客戶,代表所對應的收入—債務情況下不償還貸款的客戶。利用歷史數(shù)據(jù)和選擇的分類算法,可以得到判斷客戶是否償還貸款的分類模型。對于申請貸款的新客戶,可以使用該模型根據(jù)客戶的收入—債務情況預測其還款的可能性,進而作為銀行發(fā)放貸款的決策基礎。圖 927 貸款分類模型 圖928 客戶的聚類分析3)聚類聚類是將一個數(shù)據(jù)集按照某個標準分成幾個簇的過程。其結果使得在每個簇內部的數(shù)據(jù)按照該標準具有很高相似性,而簇之間的數(shù)據(jù)的相似性很低。 聚類與分類不同,在分類中,類標記事先給出,然后選擇分類算法對這些類進行劃分,是一種監(jiān)督學習的方法;而聚類則是將數(shù)據(jù)集合按對于特定屬性測度的相似性進行聚合,沒有事先給定類別,屬于一種非監(jiān)督的學習。圖928是聚類的一個例子。通過對數(shù)據(jù)點的相似性進行分析,得到三個聚類。結果顯示,聚類1是債務水平一般的顧客群,聚類2是債務水平比較高的顧客群,聚類3是債務水平比較低的顧客群。4)關聯(lián)規(guī)則自然界中某種事物發(fā)生時其他事物也會發(fā)生的這樣一種聯(lián)系稱之為關聯(lián)。反映事件之間依賴或關聯(lián)的知識稱為關聯(lián)型知識(又稱依賴關系)。 數(shù)據(jù)挖掘中,關聯(lián)是兩個或多個變量取值之間存在的一類重要的可被發(fā)現(xiàn)的某種規(guī)律性。關聯(lián)分析目的是尋找給定數(shù)據(jù)記錄集中數(shù)據(jù)項之間隱藏的關聯(lián)關系,描述數(shù)據(jù)之間的密切度。關聯(lián)分析的結果常有兩種:關聯(lián)規(guī)則和序列模式。關聯(lián)規(guī)則是描述在一個交易中物品之間同時出現(xiàn)的規(guī)律的知識模式,更確切的說,關聯(lián)規(guī)則是通過量化的數(shù)字描述物品X的出現(xiàn)對物品Y的出現(xiàn)有多大的影響;序列模式與此類似,但它尋找的是事件之間時間上的相關性。以零售業(yè)為例,體育用品商場通過對銷售數(shù)據(jù)進行關聯(lián)分析通??梢园l(fā)現(xiàn)這些數(shù)據(jù)中常常隱含形式如下的規(guī)律——“購買籃球的顧客中有70%的人同時購買籃球運動服,所有交易中有40%的人同時購買籃球和籃球運動服”等。(3)數(shù)據(jù)挖掘系統(tǒng)的發(fā)展根據(jù)數(shù)據(jù)挖掘系統(tǒng)的產生和發(fā)展過程,可以劃分為四代:第一代數(shù)據(jù)挖掘系統(tǒng)支持一個或幾個數(shù)據(jù)挖掘算法,這些算法設計用來挖掘向量數(shù)據(jù)(vectorvalued data),這些數(shù)據(jù)模型在挖掘時候,一般一次性調進內存進行處理。許多這樣的系統(tǒng)已商業(yè)化。第二代數(shù)據(jù)挖掘系統(tǒng)支持數(shù)據(jù)庫和數(shù)據(jù)倉庫,和它們具有高性能的接口,具有高的可擴展性。如,第二代系統(tǒng)能夠挖掘大數(shù)據(jù)集、更復雜的數(shù)據(jù)集、以及高維數(shù)據(jù)。這一代系統(tǒng)通過支持數(shù)據(jù)挖掘模式(data mining schema)和數(shù)據(jù)挖掘查詢語言(DMQL)增加系統(tǒng)的靈活性。第三代數(shù)據(jù)挖掘系統(tǒng)的特征是能夠挖掘Internet/Extranet的分布式和高度異質的數(shù)據(jù),并且能夠有效地和操作型系統(tǒng)集成。這一代數(shù)據(jù)挖掘系統(tǒng)關鍵的技術之一是為建立在異質系統(tǒng)上的多個預言模型以及管理這些預言模型的元數(shù)據(jù)提供第一級別(first class)的支持。第四代數(shù)據(jù)挖掘系統(tǒng)能夠挖掘嵌入式系統(tǒng)、移動系統(tǒng)、和普遍存在(ubiquitous)計算設備產生的各種類型的數(shù)據(jù) 。數(shù)據(jù)挖掘系統(tǒng)表現(xiàn)為兩個方面的發(fā)展趨勢,一是集成化,第二代、第三代、以及第四代數(shù)據(jù)挖掘和預言模型系統(tǒng)將與數(shù)據(jù)倉庫合并,以提供一個集成的系統(tǒng)來管理日常的商業(yè)過程;另一方面是嵌入式,第二代、第三代、以及第四代數(shù)據(jù)挖掘技術將不斷發(fā)展和成熟,能夠和各種應用集成,成為一種嵌入式的技術(embedded technology)。 信息系統(tǒng)開發(fā)模式的發(fā)展通常情況下,信息系統(tǒng)的開發(fā)過程包含以下幾個階段:需求分析、設計、編碼、測試、維護等。20世紀60年代提出了結構程序設計方法,解決了編程中的程序正確性問題。到20世紀70年代,為了設計大型軟件系統(tǒng),提出了軟件工程的設計方法,但軟件工程有先天不足,開發(fā)成本高、開發(fā)周期長,并且不能適應系統(tǒng)不斷改進和變化。20世紀80年代提出了采用可重用技術,產生了面向對象技術,對某些大型軟件,能解決軟件工程中的不足之處,但還是不盡人意,原因是:①技術要求較高,一般技術人員(編程人員)很難學會、掌握;②由于概念上不統(tǒng)一,因此很難建立起標準和規(guī)范;③在工程實施中有不少難點沒有解決。因此,只能在某些應用上被少數(shù)技術人員使用。為此,在面向對象方法基礎上出現(xiàn)了構件技術,這種思想來自于汽車制造業(yè)和建筑業(yè),采用流水線生產方式的預制件裝配方式,它的預制件要求并不苛刻,而只要是重用就可以了,所以稱為構件。在這個生產流水線上的各階段,可以由不同專業(yè)人員去完成,社會有了分工,效率和質量都有了提高,這種開發(fā)技術稱為“基于構件/ 構架的開發(fā)技術”。到21世紀的今天,各企事業(yè)單位都己經(jīng)普遍使用了信息技術,建立了各種軟件系統(tǒng),如財務軟件、信息管理系統(tǒng)、CAD、實時工控系統(tǒng)等,可是這些系統(tǒng)都是自身相時獨立的,也就是說,相互之間無法連通。當今社會IT技術發(fā)展日新月異,已經(jīng)進入網(wǎng)絡新時代,企業(yè)的競爭相當激烈,企業(yè)的負責人都要考慮如何整合各種資源,把現(xiàn)有系統(tǒng)連接起來,發(fā)揮資源最大能量,使得機構運轉更暢通。同樣,各企事業(yè)單位,不但要把內部各系統(tǒng)連接起來,還要與上級的系統(tǒng)互連,同時還要與其它單位的信息系統(tǒng)橫向互連??傊?,當前需要把在不同平臺開發(fā)的軟件連起來,迫切需要新的技術。從上世紀末到本世紀初,一些重大的創(chuàng)新軟件技術都是圍繞著軟件互通互連展開的,微軟OLE技術實現(xiàn)了二進制代碼級互連,采用了嵌入和連接兩種技術,有效地將微軟內部的系統(tǒng)連起來,并實現(xiàn)了拖拉等技術,只要是在微軟平臺開發(fā)的軟件,安裝一些接口就可以互通互連了。但是,還有大量軟件不是在微軟平臺上開發(fā)的,就無法實現(xiàn)互連了。于是,世界上各計算機大公司共同組織起來,解決它們之間的軟件互連問題,提出CORBA。這種技術的核心就是提供一種大家公認的代理,即提供一種中間過渡語言,這相當于要求大家向世界語靠攏。接著Sun公司提出將C語言改進后的 Java語言作為互連的通用中間語言。就如同英語可以被很多國家作為母語,卻無法要求全世界人都用英語講話一樣,雖然這種語言實用性強,應用廣泛,但不可能做到被普遍接受。由此面向服務的構架(SOA)應運而生了,而且很快被公眾認可和接受,成為當前解決大型軟件系統(tǒng)互連的最佳開發(fā)方案,SOA的推廣和應用已經(jīng)成為軟件開發(fā)中的頭等大事。其原因主要在于客觀需求和技術成熟度兩個方面:(1)客觀上需要。隨著網(wǎng)絡普及化,越來越迫切地需要集成現(xiàn)有的多個應用系統(tǒng),以實現(xiàn)更強的信息處理功能,如電子商務的供應鏈、智能交通、電子政務、數(shù)字地球等都需要互連技術。(2)技術成熟度?,F(xiàn)在面向對象和構件架構的基礎理論和技術已趨向成熟,發(fā)展到統(tǒng)一建模語言,提供建模工具,并提出了中間件、interbus等技術。瀏覽器技術普及,已成為行業(yè)標準,奠定了SOA的基礎理論和技術規(guī)范
點擊復制文檔內容
黨政相關相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1