freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

aai09知識發(fā)現(xiàn)和數(shù)據(jù)挖掘2高級人工智能史忠植(編輯修改稿)

2024-10-24 20:00 本頁面
 

【文章內(nèi)容簡介】 10/20,24,舉例: L[3]為{{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4}} 經(jīng)過join后,C[4]={{1,2,3,4},{1,3,4,5}} 由于{1,3,4,5}有子集{1,4,5}不在L[3]中, 所以經(jīng)過prune后,得到L[4]={{1,2,3,4}},2024/10/20,25,2024/10/20,26,2024/10/20,27,2024/10/20,28,2024/10/20,29,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)注意的問題,充分理解數(shù)據(jù) 目標明確 數(shù)據(jù)準備工作要做好 選取適當?shù)淖钚〉闹С侄群涂尚哦?很好地理解關(guān)聯(lián)規(guī)則,2024/10/20,30,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)使用步驟,連接數(shù)據(jù),做數(shù)據(jù)準備 給定最小支持度和最小可信度,利用知識發(fā)現(xiàn)工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則 可視化顯示、理解、評估關(guān)聯(lián)規(guī)則,2024/10/20,31,關(guān)聯(lián)規(guī)則在保險業(yè)務中的應用,最小支持度1%,最小可信度為50%,2024/10/20,32,2024/10/20,33,2024/10/20,34,2024/10/20,35,數(shù)據(jù)倉庫,在過去幾十年,數(shù)據(jù)庫技術(shù),特別是OLTP(聯(lián)機事務處理),主要是為自動化生產(chǎn)、精簡工作任務和高速采集數(shù)據(jù)服務。它是事務驅(qū)動的、面向應用的。 20世紀80年代,人們要利用現(xiàn)有的數(shù)據(jù),進行分析和推理,從而為決策提供依據(jù)。這種需求既要求聯(lián)機服務,又涉及大量用于決策的數(shù)據(jù)。而傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)已無法滿足這種需求:,所需歷史數(shù)據(jù)量很大,而傳統(tǒng)數(shù)據(jù)庫一般只存儲短期數(shù)據(jù)。 涉及許多部門的數(shù)據(jù),而不同系統(tǒng)的數(shù)據(jù)難以集成。 對大量數(shù)據(jù)的訪問性能明顯下降,2024/10/20,36,數(shù)據(jù)倉庫的定義,信息處理技術(shù)的發(fā)展趨勢是:從大量的事務型數(shù)據(jù)庫中抽取數(shù)據(jù),并將其清理、轉(zhuǎn)換為新的存儲格。隨著此過程的發(fā)展和完善,這種九十年代初出現(xiàn)的支持決策的、特殊的數(shù)據(jù)存儲即被稱為數(shù)據(jù)倉庫(Data Warehouse)。 Inmon將數(shù)據(jù)倉庫明確定義為: 數(shù)據(jù)倉庫(Data Warehouse)是面向主題的,集成的,內(nèi)容相對穩(wěn)定的、不同時間的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。,2024/10/20,37,數(shù)據(jù)倉庫的特征(1),數(shù)據(jù)倉庫中的數(shù)據(jù)是面向主題的 與傳統(tǒng)數(shù)據(jù)庫面向應用相對應的。主題是一個在較高層次將數(shù)據(jù)歸類的標準,每一個主題基本對應一個宏觀的分析領(lǐng)域 數(shù)據(jù)倉庫中的數(shù)據(jù)是集成的 在數(shù)據(jù)進入數(shù)據(jù)倉庫之前,必然要經(jīng)過加工與集成。要統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,還要進行數(shù)據(jù)綜合和計算,2024/10/20,38,數(shù)據(jù)倉庫的特征(2),數(shù)據(jù)倉庫中的數(shù)據(jù)是穩(wěn)定的 數(shù)據(jù)倉庫的數(shù)據(jù)主要供決策分析之用,所涉及的操作主要是數(shù)據(jù)查詢,一般不進行修改操作 數(shù)據(jù)倉庫中的數(shù)據(jù)又是隨時間不斷變化的 數(shù)據(jù)倉庫的數(shù)據(jù)不是實時更新的,但并不是永遠不變的,也要隨著時間的變化不斷地更新、增刪和重新綜合。 更新周期,2024/10/20,39,元數(shù)據(jù),元數(shù)據(jù)(Metadata)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、編碼、索引等內(nèi)容。傳統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)字典是一種元數(shù)據(jù),但在數(shù)據(jù)倉庫中,元數(shù)據(jù)的內(nèi)容比數(shù)據(jù)庫中的數(shù)據(jù)字典更加豐富和復雜。設計一個描述能力強、內(nèi)容完善的元數(shù)據(jù),是有效管理數(shù)據(jù)倉庫的具有決定意義的重要前提,2024/10/20,40,元數(shù)據(jù)的重要性,數(shù)據(jù)倉庫使用者往往將使用元數(shù)據(jù)作為分析的第一步。元數(shù)據(jù)如同數(shù)據(jù)指示圖,指出了數(shù)據(jù)倉庫內(nèi)各種信息的位置和含義 從操作型數(shù)據(jù)環(huán)境到數(shù)據(jù)倉庫的數(shù)據(jù)轉(zhuǎn)換是復雜的、多方面的,是數(shù)據(jù)倉庫建設的關(guān)鍵性步驟,元數(shù)據(jù)要包含對這種轉(zhuǎn)換的清晰描述,保證這種轉(zhuǎn)換是正確、適當和合理的,并且是靈活可變的 元數(shù)據(jù)還管理粒度的劃分、索引的建立以及抽取更新的周期等,以便管理好數(shù)據(jù)倉庫中的大規(guī)模數(shù)據(jù),2024/10/20,41,數(shù)據(jù)倉庫的相關(guān)概念,事實表(Fact):存儲用戶需要查詢分析的數(shù)據(jù),事實表中一般包含多個維(Dimension)和度量(Measurement)。 維:代表了用戶觀察數(shù)據(jù)的特定視角,如:時間維、地區(qū)維、產(chǎn)品維等。每一個維可劃分為不同的層次來取值,如時間維的值可按年份、季度、月份來劃分,描述了不同的查詢層次。 度量:是數(shù)據(jù)的實際意義,描述數(shù)據(jù)“是什么”,即一個數(shù)值的測量指標,如:人數(shù)、單價、銷售量等。,2024/10/20,42,數(shù)據(jù)倉庫
點擊復制文檔內(nèi)容
化學相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1