freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘(陳志泊)——習(xí)題答案(編輯修改稿)

2025-07-25 13:58 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的數(shù)據(jù)總是歷史的數(shù)據(jù),需要時(shí)間維來(lái)區(qū)別。第3章 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)1. 在線分析處理(OLAP) 分析。2. 信息包圖法,維度,類(lèi)別,度量。3. 邏輯模型。4. 事務(wù)事實(shí),快照事實(shí),線性項(xiàng)目事實(shí)。5. 聚合。6. 時(shí)間,區(qū)域。7. 退化維。8. 無(wú)變化,緩慢變化,劇烈變化。9. 索引。10. 反向規(guī)范化,引入冗余。11. 答:信息包圖法,也叫用戶信息需求表,就是在一張平面表格上描述元素的多維性,其中的每一個(gè)維度用平面表格的一列表示,通常的維度如時(shí)間、地點(diǎn)、產(chǎn)品和顧客等;而細(xì)化本列的對(duì)象就是類(lèi)別,例如時(shí)間維度的類(lèi)別可以細(xì)化到年、月、日,甚至小時(shí);平面表格的最后一行(代表超立方體中的單元格)即為指標(biāo)度量值,例如,某年在某銷(xiāo)售點(diǎn)的某類(lèi)產(chǎn)品的實(shí)際銷(xiāo)售額。創(chuàng)建信息包圖時(shí)需要確定最高層和最低層的信息需求,以便最終設(shè)計(jì)出包含各個(gè)層次需要的數(shù)據(jù)倉(cāng)庫(kù)總之,信息包圖法是一種自上而下的數(shù)據(jù)建模方法,即從用戶的觀點(diǎn)開(kāi)始設(shè)計(jì)(用戶的觀點(diǎn)是通過(guò)與用戶交流得到的),站在管理者的角度把焦點(diǎn)集中在企業(yè)的一個(gè)或幾個(gè)主題上,著重分析主題所涉及數(shù)據(jù)的多維特性,這種自上而下的方法幾乎考慮了所有的信息源,以及這些信息源影響業(yè)務(wù)活動(dòng)的方式。12. 答:收集、分析和確認(rèn)業(yè)務(wù)分析需求,分析和理解主題和元數(shù)據(jù)、事實(shí)及其量度、粒度和維度的選擇與設(shè)計(jì)、數(shù)據(jù)倉(cāng)庫(kù)的物理存儲(chǔ)方式的設(shè)計(jì)等。13. 答:(1)收集和分析業(yè)務(wù)需求;(2)建立數(shù)據(jù)模型和數(shù)據(jù)倉(cāng)庫(kù)的物理設(shè)計(jì);(3)定義數(shù)據(jù)源; (4)選擇數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和平臺(tái); (5)從操作型數(shù)據(jù)庫(kù)中抽取、清洗及轉(zhuǎn)換數(shù)據(jù)到數(shù)據(jù)倉(cāng)庫(kù); (6)選擇訪問(wèn)和報(bào)表工具,選擇數(shù)據(jù)庫(kù)連接軟件,選擇數(shù)據(jù)分析和數(shù)據(jù)展示軟件;(7)更新數(shù)據(jù)倉(cāng)庫(kù)。14. 答:。第4章 關(guān)聯(lián)規(guī)則1. apriori,fpgrowth,fpgrowth。2. {{abc}{abd}{acd}},{{abc}{abd}}。3. {{a}{c}},{ac}。4. 答:,用來(lái)發(fā)現(xiàn)超級(jí)市場(chǎng)中用戶購(gòu)買(mǎi)的商品之間的隱含關(guān)聯(lián)關(guān)系,并用規(guī)則的形式表示出來(lái),稱為關(guān)聯(lián)規(guī)則(Association Rule)。關(guān)聯(lián)規(guī)則除了可以發(fā)現(xiàn)超市購(gòu)物中隱含的關(guān)聯(lián)關(guān)系之外,還可以應(yīng)用于其他很多領(lǐng)域。關(guān)聯(lián)規(guī)則的應(yīng)用還包括文本挖掘、商品廣告郵寄分析、網(wǎng)絡(luò)故障分析等。5. 答:關(guān)聯(lián)規(guī)則的分類(lèi): (1)基于規(guī)則中涉及到的數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分為單維的和多維的。(2)基于規(guī)則中數(shù)據(jù)的抽象層次,可以分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則。(3)基于規(guī)則中處理的變量的類(lèi)型不同,關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。關(guān)聯(lián)規(guī)則挖掘的步驟:(1)找出交易數(shù)據(jù)庫(kù)中所有大于或等于用戶指定的最小支持度的頻繁項(xiàng)集;(2)利用頻繁項(xiàng)集生成所需要的關(guān)聯(lián)規(guī)則,根據(jù)用戶設(shè)定的最小可信度進(jìn)行取舍,產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。6. 答:規(guī)則:c=a,a=c。7. 答:第5章 數(shù)據(jù)分類(lèi)1. 獲取數(shù)據(jù),預(yù)處理,分類(lèi)器設(shè)計(jì),分類(lèi)決策。2. 劃分?jǐn)?shù)據(jù)集,分類(lèi)器構(gòu)造,分類(lèi)器測(cè)試。3. 精確度,查全率和查準(zhǔn)率,F(xiàn)measure,幾何均值。4. 多項(xiàng)式核函數(shù),徑向基核函數(shù),S型核函數(shù)。5. 答:分類(lèi)是指把數(shù)據(jù)樣本映射到一個(gè)事先定義的類(lèi)中的學(xué)習(xí)過(guò)程,即給定一組輸入的屬性向量及其對(duì)應(yīng)的類(lèi),用基于歸納的學(xué)習(xí)算法得出分類(lèi)。分類(lèi)問(wèn)題是數(shù)據(jù)挖掘領(lǐng)域中研究和應(yīng)用最為廣泛的技術(shù)之一,許多分類(lèi)算法被包含在統(tǒng)計(jì)分析工具的軟件包中,作為專門(mén)的分類(lèi)工具來(lái)使用。分類(lèi)問(wèn)題在商業(yè)、銀行業(yè)、醫(yī)療診斷、生物學(xué)、文本挖掘、因特網(wǎng)篩選等領(lǐng)域都有廣泛應(yīng)用。例如,在銀行業(yè)中,分類(lèi)方法可以輔助工作人員將正常信用卡用戶和欺詐信用卡用戶進(jìn)行分類(lèi),從而采取有效措施減小銀行的損失;在醫(yī)療診斷中,分類(lèi)方法可以幫助醫(yī)療人員將正常細(xì)胞和癌變細(xì)胞進(jìn)行分類(lèi),從而及時(shí)制定救治方案,挽救病人的生命;在因特網(wǎng)篩選中,分類(lèi)方法可以協(xié)助網(wǎng)絡(luò)工作人員將正常郵件和垃圾郵件進(jìn)行分類(lèi),從而制定有效的垃圾郵件過(guò)濾機(jī)制,防止垃圾郵件干擾人們的正常生活。6. 答:。7. 答:計(jì)算x與x1~x7的歐氏距離,可以知道x的最近鄰是x4,x的前3個(gè)近鄰是x4,x1,x2,所以,利用最近鄰分類(lèi)方法對(duì)x進(jìn)行分類(lèi)時(shí)x的類(lèi)標(biāo)號(hào)是y=1,利用k近鄰分類(lèi)方法(k=3)對(duì)x進(jìn)行分類(lèi)時(shí)x的類(lèi)標(biāo)號(hào)是y=+1。第6章 數(shù)據(jù)聚類(lèi)1. 連續(xù)型,二值離散型,多值離散型,混合類(lèi)型。2. 歐氏距離,曼哈頓距離,明考斯基距離。3. 選定某種距離作為數(shù)據(jù)樣本間的相似性度量,選擇評(píng)價(jià)聚類(lèi)性能的準(zhǔn)則函數(shù),選擇某個(gè)初始分類(lèi),之后用迭代的方法得到聚類(lèi)結(jié)果,使得評(píng)價(jià)聚類(lèi)的準(zhǔn)則函數(shù)取得
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1