freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)分析與挖掘習(xí)題-資料下載頁

2025-03-25 02:56本頁面
  

【正文】 經(jīng)理、主管、和分析人員)的數(shù)據(jù)分析。 數(shù)據(jù)內(nèi)容:OLTP 系統(tǒng)管理當(dāng)前數(shù)據(jù)。通常,這種數(shù)據(jù)太瑣碎,難以方便地用于決策。OLAP 系統(tǒng)管理大量歷史數(shù)據(jù),提供匯總和聚集機(jī)制,并在不同的粒度級別上存儲(chǔ)和管理信息。這些特點(diǎn)使得數(shù)據(jù)容易用于見多識(shí)廣的決策。數(shù)據(jù)庫設(shè)計(jì):通常,OLTP 系統(tǒng)采用實(shí)體聯(lián)系(ER)模型和面向應(yīng)用的數(shù)據(jù)庫設(shè)計(jì)。而OLAP 系統(tǒng)通常采用星形或雪花模型和面向主題的數(shù)據(jù)庫設(shè)計(jì)。視圖:OLTP 系統(tǒng)主要關(guān)注一個(gè)企業(yè)或部門內(nèi)部的當(dāng)前數(shù)據(jù),而不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù)。相比之下,由于組織的變化,OLAP 系統(tǒng)常常跨越數(shù)據(jù)庫模式的多個(gè)版本。OLAP 系統(tǒng)也處理來自不同組織的信息,由多個(gè)數(shù)據(jù)存儲(chǔ)集成的信息。由于數(shù)據(jù)量巨大,OLAP 數(shù)據(jù)也存放在多個(gè)存儲(chǔ)介質(zhì)上。 訪問模式:OLTP 系統(tǒng)的訪問主要由短的、原子事務(wù)組成。這種系統(tǒng)需要并行控制和恢復(fù)機(jī)制。然而,對OLAP 系統(tǒng)的訪問大部分是只讀操作(由于大部分?jǐn)?shù)據(jù)倉庫存放歷史數(shù)據(jù),而不是當(dāng)前數(shù)據(jù)),盡管許多可能是復(fù)雜的查詢。 第三章 作業(yè)1. 根據(jù)你的觀察,描述一種可能的知識(shí)類型,它需要由數(shù)據(jù)挖掘方法發(fā)現(xiàn),但未在本章中列出。它需要一種不同于本章列舉的數(shù)據(jù)挖掘技術(shù)嗎?信息評價(jià),用來反映信息的及時(shí)性,有效性,信息量關(guān)于一類的大量信息的綜合指標(biāo),可以運(yùn)用數(shù)據(jù)挖掘中的分類算法來實(shí)現(xiàn)最初的信息分類,在分好的類別中運(yùn)用信息熵的計(jì)算方法來計(jì)算,信源熵:H(x)=E[I(xi)]=E[log2 1/p(xi)]=ξp(xi)log2 p(xi)(i=1,2,..n)信息量= (p1*log p1 + p2 * log p2 + ...?。玴32 *log p32),   其中,p1,p2 ,?。?,p32 分別是這 32 個(gè)球隊(duì)奪冠的概率。香農(nóng)把它稱為“信息熵” (Entropy),一般用符號 H 表示,單位是比特。2. 聚類作為數(shù)據(jù)挖掘中的重要技術(shù)之一,在實(shí)際應(yīng)用中有廣泛的應(yīng)用,請針對用聚類來做數(shù)據(jù)預(yù)處理工具以支持其后的其他數(shù)據(jù)挖掘任務(wù)的實(shí)際應(yīng)用的例子。再做數(shù)據(jù)預(yù)處理時(shí),可以用聚類做用在市場細(xì)分、目標(biāo)顧客定位、業(yè)績評估、生物群種劃分等方面。如在商務(wù)上,聚類分析可以幫助市場分析人員從客戶基本庫中發(fā)現(xiàn)不同的客戶群,在對已經(jīng)分類的客戶群進(jìn)行后續(xù)數(shù)據(jù)的挖掘算法,如關(guān)聯(lián)規(guī)則或者分類方法等,從而對客戶隨后的數(shù)據(jù)挖掘過程中提高效率,增加正確率,并且用購買模式來刻畫不同的客戶群的特征。3. 如表1所示,某數(shù)據(jù)庫有四條交易記錄。假設(shè)最小支持度為60%,最小可信度為80%。TIDDateItems_boughtT10010/15/99{K、A、D、B}T20010/15/99{D、A、C、E、B}T30010/19/99{C、A、B、E}T40010/22/99{B、A、D}(1)運(yùn)用Apriori算法找出所有的頻繁項(xiàng)集;{A,B,D} {A,B} {A,D} {B,D} {A} {B} {D}(2)列出所得到的強(qiáng)關(guān)聯(lián)規(guī)則,并且這些強(qiáng)關(guān)聯(lián)規(guī)則必須符合下面的超規(guī)則,其中X代表客戶變量,itemi指所購買的商品(如“A”、“B”等): 任意的X屬于交易集,buys(X,item1)^ buys(X,item2)= buys(X,item3)[s,c] 強(qiáng)關(guān)聯(lián)規(guī)則 {A}→{B} {B}→{A} {D}→{A} {D}→{B} {D}→{A,B} {A,D}→{B} {B,D}→{A}超規(guī)則 {A,D}→{B} {B,D}→{A}
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1