freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘考試習(xí)題匯總(留存版)

  

【正文】 的聚類算法 等。確定了數(shù)據(jù)倉(cāng)庫(kù)的粒度模型以后,為提高數(shù)據(jù)倉(cāng)庫(kù)的使用性能,還需要根據(jù)擁護(hù)需求設(shè)計(jì)聚合模型。因此,我們要求ETL過(guò)程產(chǎn)生的數(shù)據(jù)(即調(diào)和數(shù)據(jù)層)是詳細(xì)的、歷史的、規(guī)范的、可理解的、即時(shí)的和質(zhì)量可控制的。多維分析是指以“維”形式組織起來(lái)的數(shù)據(jù)(多維數(shù)據(jù)集)采取切片、切塊、鉆取和旋轉(zhuǎn)等各種分析動(dòng)作,以求剖析數(shù)據(jù),使擁護(hù)能從不同角度、不同側(cè)面觀察數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),從而深入理解多維數(shù)據(jù)集中的信息。維度表一般又主鍵、分類層次和描述屬性組成。第四章關(guān)聯(lián)規(guī)則的經(jīng)典算法包括Apriori算法和FPgrowth算法,其中FPgrownth算法的效率更高?!飫澐?jǐn)?shù)據(jù)集,分類器構(gòu)造,分類器測(cè)試1 什么是數(shù)據(jù)清洗?P33★數(shù)據(jù)清洗是一種使用模式識(shí)別和其他技術(shù),在將原始數(shù)據(jù)轉(zhuǎn)換和移到數(shù)據(jù)倉(cāng)庫(kù)之前來(lái)升級(jí)原始數(shù)據(jù)質(zhì)量的技術(shù)。粒度低,細(xì)節(jié)程度高,回答查詢的種類多 ??Apriori算法的基本操作步驟P93★C Apriori使用一種稱作逐層搜索的迭代方法,K項(xiàng)集用于探索K+1項(xiàng)集。信息增益的缺點(diǎn)是傾向于選擇取值較多的屬性,在有些情況下這類屬性可能不會(huì)提供太多有價(jià)值的信息。它于事實(shí)表并無(wú)關(guān)系,但有時(shí)在查詢限制條件(如訂單號(hào)碼、出貨單編號(hào)等)中需要用到。粒度是對(duì)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的綜合程度高低的一個(gè)衡量。第一章數(shù)據(jù)倉(cāng)庫(kù)就是一個(gè)面向主題的、集成的、相對(duì)穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合。粒度越小,細(xì)節(jié)程度越高,綜合程度越低,回答查詢的種類越多。維度可以根據(jù)其變化快慢分為元變化維度、緩慢變化維度和劇烈變化維度三類。(2)ID3算法只能對(duì)描述屬性為離散型屬性的數(shù)據(jù)集構(gòu)造決策樹。C 該方法是基于候選的策略,降低候選數(shù)C Apriori剪枝原則:若任何項(xiàng)集是非頻繁的,則其超集必然是非頻繁的(不用產(chǎn)生和測(cè)試超集)C 該原則基于以下支持度的特性:CE 項(xiàng)集的支持度不會(huì)超過(guò)其子集E 支持度的反單調(diào)特性(antimonotone):如果一個(gè)集合不能通過(guò)測(cè)試,則它的所有超集也都不能通過(guò)相同的測(cè)試。P30ETL軟件的主
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1