freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)第七章(存儲(chǔ)版)

  

【正文】 科學(xué)”專(zhuān)業(yè),年齡在 26— 30 之間, GPA為良,而只有 % 的本科生具有這種性質(zhì)。 注意, qa也可能覆蓋 對(duì)比類(lèi) 的某些元組,因?yàn)槲覀兲幚淼氖?比較描述 。 2. 概念比較描述的表示 (續(xù) ) 一個(gè)確定目標(biāo)類(lèi)的比較描述的 量化區(qū)分規(guī)則 記作: X, target_class(X) condition(X) [d:d_weight] ? ? 2. 概念比較描述的表示 (續(xù) ) ?例 5: 根據(jù)前表中的概化元組和計(jì)數(shù)分布,一個(gè)對(duì)研究生的 量化區(qū)分規(guī)則 可表示如下: X, 學(xué)生類(lèi) (X) =“研究生” 專(zhuān)業(yè) (X)=“科學(xué)” ∧ 年齡區(qū)間 (X)= “ 2125” ∧ GPA(X)=“良” [d: 30%] ? ? 2. 概念比較描述的表示 (續(xù) ) ?注:一個(gè)對(duì)比規(guī)則提供了一個(gè)充分條件,但它不是一個(gè)必要條件。 即是:如果 一個(gè)學(xué)生專(zhuān)業(yè)是科學(xué),年齡在 21和 25之間,GPA為良,則根據(jù)給定的數(shù)據(jù),他是研究生的概率為 30%, 是本科生的概率為70%。 設(shè) qa是一個(gè)概化元組, Cj是目標(biāo)類(lèi)。 ?(4)最后, 結(jié)果概念對(duì)比描述 以表、圖或規(guī)則的形式表示。但目標(biāo)類(lèi)和對(duì)比類(lèi)必須是可比較的,即它們具有相似的維或?qū)傩浴? ?( 2) 用保守的屬性概化閾值進(jìn)行基于屬性的歸納,通過(guò)屬性刪除和屬性概化進(jìn)行預(yù)相關(guān)分析(分析過(guò)程如 例 1)。使用保守AOI得到的關(guān)系稱(chēng)作 候選關(guān)系 。 (續(xù)) 設(shè) S 是訓(xùn)練樣本的集合,其中每個(gè)樣本的 類(lèi)標(biāo)號(hào) 已知,共有 m個(gè)不同類(lèi)別 ,則 S 包含 si個(gè) Ci類(lèi)樣本, i=1, … , m。前面在挖掘 概念特征 時(shí),只有一個(gè)被特征化的類(lèi),即沒(méi)有說(shuō)明對(duì)比類(lèi)。 (續(xù)) ? 包含屬性(維)相關(guān)分析的 類(lèi)特征化 稱(chēng)為 解析特征化 ; ? 包含屬性(維)相關(guān)分析的 類(lèi)比較 稱(chēng)為解析比較 。如果元組已在 P中,則簡(jiǎn)單地增加它的計(jì)數(shù)值并相應(yīng)處理其他聚集值;否則,將它插入 P。這樣可包含較少的不同值。 (續(xù)) ? 4)出生地: 該屬性有大量不同值,因此應(yīng)當(dāng)概化它。如果概化關(guān)系中不同元組的個(gè)數(shù)超過(guò)該閾值,則應(yīng)當(dāng)進(jìn)一步概化;否則,不再進(jìn)一步概化。控制將屬性概化到多高的抽象層通常是相當(dāng)主觀的。為了對(duì)出生地進(jìn)行概化處理,就必須將出生地概化所涉及到的其它屬性包含進(jìn)來(lái)。 (續(xù)) ?例 1: 從一個(gè)大學(xué)數(shù)據(jù)庫(kù)的學(xué)生數(shù)據(jù)中挖掘出研究生的一般特征。對(duì)大量數(shù)據(jù)進(jìn)行有效靈活的概化方法主要有兩種: ?數(shù)據(jù)立方體方法 ?基于屬性的歸納方法 利用 數(shù)據(jù)立方體方法 進(jìn)行數(shù)據(jù)概化,被分析的數(shù)據(jù)存放在一個(gè)多維數(shù)據(jù)庫(kù)中,通過(guò)對(duì)多維數(shù)據(jù)立方進(jìn)行上卷或下鉆操作,可完成數(shù)據(jù)概化和數(shù)據(jù)細(xì)化工作。允許數(shù)據(jù)集在多個(gè)抽象層概化,便于考察數(shù)據(jù)的一般行為。此外,用戶希望方便靈活地以不同的粒度和從不同的角度描述數(shù)據(jù)集。 概念描述: 是描述式數(shù)據(jù)挖掘最基本形式,它以簡(jiǎn)潔匯總的形式描述給定數(shù)據(jù)集,提供數(shù)據(jù)的有趣的一般特性。 概念描述基本知識(shí)(續(xù)) 大型數(shù)據(jù)庫(kù)的概念描述和數(shù)據(jù)倉(cāng)庫(kù)的 OLAP有何差別? ?概念描述可處理復(fù)雜的數(shù)據(jù)類(lèi)型和聚集。如:描述中應(yīng)作用哪些維?概化過(guò)程應(yīng)進(jìn)行到哪個(gè)抽象層次上?這些問(wèn)題均是由用戶負(fù)責(zé)提供答案的。 (續(xù)) 由于數(shù)據(jù)挖掘查詢通常只涉及 DB的一部分,選擇相關(guān)的數(shù)據(jù)集不僅使得挖掘更有效,而且與在整個(gè) DB挖掘相比,能產(chǎn)生更有意義的規(guī)則。 姓名 性別 專(zhuān)業(yè) 出生地 出生日 居住地 電話 GPA 王東海 男 CS 合肥市 合肥市金寨 路 65號(hào) 05513665678 李哲 男 CS 合肥市 合肥市蕪湖 路 186號(hào) 05513656012 汪燕 女 PH 上海市 上海市高安 路 1250號(hào) 02162381960 初始工作關(guān)系:任務(wù)相關(guān)數(shù)據(jù)的集合 (續(xù)) 對(duì)已經(jīng)準(zhǔn)備好的數(shù)據(jù),如何進(jìn)行基于屬性歸納? ?AOI方法的第二步: 進(jìn)行數(shù)據(jù)概化操作,可用兩種方法之一進(jìn)行: 屬性刪除 , 屬性概化 。 若屬性概化沒(méi)有達(dá)到“足夠高的層次”,則“亞概化”也同樣可能使得到的規(guī)則變得失去意義。 (續(xù)) 例 1(續(xù)): 對(duì)前面得到的 初始工作關(guān)系的每個(gè)屬性,概化過(guò)程如下: ? 1)姓名: 由于姓名存在大量不同值,并且其上沒(méi)有定義概念分層,該屬性被刪除。但如果假定國(guó)家的取值個(gè)數(shù)小于概化閾值,則出生地應(yīng)當(dāng)概化到出生國(guó)家。 (續(xù)) 概化過(guò)程會(huì)產(chǎn)生一系列內(nèi)容相同的數(shù)據(jù)行,相同內(nèi)容的數(shù)據(jù)行被合并成一個(gè),并累計(jì)它們的計(jì)數(shù)值。概化元組的插入通過(guò)對(duì)應(yīng)的數(shù)組元素上的度量聚集進(jìn)行。 此外,即使在同一個(gè)維內(nèi),對(duì)于區(qū)分一個(gè)類(lèi)與其他類(lèi),在不同的概念層也可能有很不相同的能力。 ? 屬性相關(guān)分析的基本思想: 計(jì)算某種度量,用于量化屬性與給定類(lèi)或概念的相關(guān)性。 其中Sj 包含屬性 A取同一值 aj的數(shù)據(jù)行; Sj包含類(lèi) Ci的 sij個(gè)樣本。其結(jié)果為 初始目標(biāo)類(lèi)(對(duì)比類(lèi))工作關(guān)系。 為計(jì)算每個(gè)屬性的信息增益,首先用公式 ()計(jì)算對(duì)給定的樣本分類(lèi)所需要的
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1