freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘簡(jiǎn)介(專業(yè)版)

  

【正文】 例如,通過(guò)多維聚類分析,可以將具有相同儲(chǔ)蓄和貸款償還行為的客戶分為一組。盡管數(shù)據(jù)挖掘是整個(gè)過(guò)程的中心,但它通常只占整個(gè)過(guò)程 15%~ 25%的工作量。 ? 數(shù)據(jù)挖掘中規(guī)則的發(fā)現(xiàn)主要基于大樣本的統(tǒng)計(jì)規(guī)律 ,發(fā)現(xiàn)的規(guī)則不必適用于所有數(shù)據(jù),當(dāng)達(dá)到某一 閾值 時(shí)便可認(rèn)為有此規(guī)律。兩個(gè)模式的主要不同是維表。 多維數(shù)據(jù)模型 ? 星型模式 (star schema): 是數(shù)據(jù)倉(cāng)庫(kù)最常見的數(shù)據(jù)模型,其中包括: ? (1)事實(shí)表: 包含大批數(shù)據(jù)和不含冗余的中心表; ? (2)一組小的附屬表 ( 維表 ),每一維一個(gè)。 多維數(shù)據(jù)模型 ? 主題 : 多維數(shù)據(jù)模型圍繞中心主題 (例如 sales)組織。 操作數(shù)據(jù)庫(kù) 是為已知的任務(wù)和負(fù)載設(shè)計(jì)的,如使用主關(guān)鍵字索引,檢索特定的記錄和優(yōu)化查詢; 數(shù)據(jù)倉(cāng)庫(kù) 的查詢通常是復(fù)雜的,涉及大量數(shù)據(jù)在匯總級(jí)的計(jì)算,可能需要特殊的數(shù)據(jù)組織、存取方法和基于多維視圖的實(shí)現(xiàn)方法。例如: (上海, 2023年 2月,批發(fā), 2188) OLTP和 OLAP的主要 區(qū)別 服務(wù) 對(duì)象 : OLTP是 面向顧客 的,用于辦事員、客戶和信息技術(shù)專業(yè)人員的事務(wù)和查詢處理。 操作型數(shù)據(jù)庫(kù)系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別 ? 操作型數(shù)據(jù)庫(kù)系統(tǒng) 的主要任務(wù)是 執(zhí)行聯(lián)機(jī)事務(wù)和查詢處理 ,稱為聯(lián)機(jī)事務(wù)處理 (OLTP) 系統(tǒng)。 (2) DW關(guān)注決策者的 數(shù)據(jù)建模與分析 ,而傳統(tǒng)數(shù)據(jù)庫(kù)是面向應(yīng)用的,集中于組織機(jī)構(gòu)的日常操作和事務(wù)處理。 (3) DW排除對(duì)于決策無(wú)用的數(shù)據(jù), 提供特定主題的簡(jiǎn)明視圖 。它涵蓋了一個(gè)組織的大部分日常操作,如采購(gòu)、制造、庫(kù)存、銷售、財(cái)務(wù)、銀行等事務(wù)。 OLAP是 面向市場(chǎng) 的,用于經(jīng)理、主管和信息分析人員的數(shù)據(jù)分析。 是分離的 ? ? 操作型數(shù)據(jù)庫(kù): 支持多事務(wù)的并行處理,需要加鎖和日志等并行控制和恢復(fù)機(jī)制,以確保數(shù)據(jù)的一致性和完整性。 主題 用 事實(shí)表 表示。維表圍繞中心表顯示在連線上。 ? 星型模型中的 item的單個(gè)維表在雪花模型中被規(guī)范化,導(dǎo)致新的 item表和 supplier供應(yīng)商 表。 數(shù)據(jù)挖掘的分類 根據(jù) 所開采的數(shù)據(jù)庫(kù)類型、發(fā)現(xiàn)的知識(shí)類型、采用的技術(shù)類型,數(shù)據(jù)挖掘有不同的分類方法。 ? 知識(shí)發(fā)現(xiàn) 是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)的全部過(guò)程,而 數(shù)據(jù)挖掘 則是此全過(guò)程的一個(gè)特定的關(guān)鍵步驟 數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的聯(lián)系 KDD的步驟: 1 熟悉應(yīng)用領(lǐng)域、背景知識(shí)及用戶的 KDD任務(wù)性質(zhì); 2 數(shù)據(jù)的選擇 : 確定與發(fā)現(xiàn)任務(wù)相關(guān)的數(shù)據(jù)集合; 3 數(shù)據(jù)清理和預(yù)處理,包括除去錯(cuò)誤和冗余數(shù)據(jù)、處 理丟失數(shù)據(jù)、更新數(shù)據(jù)和時(shí)序信息并將其準(zhǔn)備成數(shù)據(jù)挖掘工具所需的表達(dá)式; 4 數(shù)據(jù)縮減和投影,尋找依賴于發(fā)現(xiàn)目標(biāo)的、表達(dá)數(shù) 據(jù)的有用特征, 通過(guò)降低維數(shù)和數(shù)據(jù)轉(zhuǎn)換 以縮減數(shù)據(jù)規(guī)模; 降低數(shù)據(jù)復(fù)雜性; 5 確定 KDD目標(biāo),選擇合適的算法如聚集、分類、線性回歸等; 數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的聯(lián)系 6 選擇數(shù)據(jù)挖掘算法,選擇適當(dāng)?shù)哪P秃蛥?shù); 7 執(zhí)行數(shù)據(jù)挖掘過(guò)程,發(fā)現(xiàn)模式并表達(dá)成易理解的 形式如分類規(guī)則等; 8 評(píng)價(jià)和解釋發(fā)現(xiàn)的模式,必要時(shí)反復(fù)執(zhí)行步驟 1到 7; 9 將模式提交給用戶或應(yīng)用到系統(tǒng)中。有效的聚類和協(xié)同過(guò)濾方法有助于識(shí)別客戶組,將新客戶關(guān)聯(lián)到適合的客戶組,以及推動(dòng)目標(biāo)市場(chǎng)。 (3)對(duì)目標(biāo)市場(chǎng)客戶的分類與聚類 : 分類與聚類的方法可用于用戶群體的識(shí)別和目標(biāo)市場(chǎng)分析。 ? KDD的整個(gè)過(guò)程包括在指定的數(shù)據(jù)庫(kù)中用數(shù)據(jù)挖掘算法提取模型,以及圍繞數(shù)據(jù)挖掘進(jìn)行的預(yù)處理和結(jié)果表達(dá)等一系列的計(jì)算步驟。 ? 數(shù)據(jù)挖掘既要發(fā)現(xiàn)潛在規(guī)則,還要管理和維護(hù)規(guī)則。這里, sales事實(shí)表與上面的星型模型相同。這種模型有 星型模式 、 雪花模式 等。這些維使得商店能夠記錄商品的月銷售,銷售商品的分店和地點(diǎn)。 OLTP系統(tǒng)和 OLAP系統(tǒng)的比較表 特 性 OLTP OLAP ? 特征 操作處理 信息處理 ? 面向 事務(wù) 分析 ? 用戶 辦事員、客戶、數(shù)據(jù)庫(kù)專業(yè)人員 經(jīng)理、主管、分析員 ? 功能 日常操作 長(zhǎng)期信息需求,決策支持 ? DB設(shè)計(jì) 基于 ER,面向應(yīng)用 星型 /雪花,面向主題 ? 數(shù)據(jù) 當(dāng)前的,確保最新 歷史的,跨時(shí)間維護(hù) ? 匯總 原始的,高度詳細(xì) 匯總的,統(tǒng)一的 ? 視圖 詳細(xì),一般關(guān)系 匯總的,多維的 ? 工作單位 短的,簡(jiǎn)單事務(wù) 復(fù)雜查詢 ? 存取 讀 /寫 大多為讀 ? 關(guān)注 數(shù)據(jù)輸入、存儲(chǔ) 信息輸出 ? 操作 主關(guān)鍵字上索引 /散列 大量掃描 ? 訪問(wèn)記錄數(shù)量 數(shù)十個(gè) 數(shù)百萬(wàn) ? 用戶數(shù) 數(shù)千 數(shù)百 ? DB規(guī)模 100MB到 GB 100GB到 TB ? 優(yōu)先
點(diǎn)擊復(fù)制文檔內(nèi)容
職業(yè)教育相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1