freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫第七章-資料下載頁

2025-03-09 09:06本頁面
  

【正文】 ?概念 比較的一般過程如下: ( 1)數(shù)據(jù)收集 ( 2)屬性相關(guān)分析 ( 3)同步概化 ( 4)挖掘結(jié)果表示 (續(xù)) ?例 3: 在大學(xué)數(shù)據(jù)庫中挖掘研究生與本科生概念對(duì)比描述知識(shí)。給定了 屬性:姓名 , 性別 , 專業(yè) , 出生地 , 出生日 ,居住地 , 電話 和 GPA。 ?(1)根據(jù)挖掘任務(wù),產(chǎn)生兩條 DB查詢命令,分別用于從 DB中獲取 初始目標(biāo)數(shù)據(jù)集 (研究生)和 初始對(duì)比數(shù)據(jù)集 (本科生)。 (續(xù)) ?(2)對(duì)兩個(gè)不同類別數(shù)據(jù)集進(jìn)行屬性相關(guān)分析,消除無關(guān)和弱屬性。如 姓名 ,性別 , 出生地 , 居住地 和 電話 ,只留下與挖掘任務(wù)密切相關(guān)的屬性供后面的分析使用。 ?(3)進(jìn)行同步概化:在 目標(biāo)數(shù)據(jù)集 和 對(duì)比數(shù)據(jù)集 上 進(jìn)行,概化到用戶指定的閾值控制的層,得到下面兩張表: 專業(yè) 年齡區(qū)間 GPA 累計(jì)數(shù) % 科學(xué) 21— 25 良 % 科學(xué) 26— 30 良 % 科學(xué) 30 優(yōu) % … … … … 商學(xué) 30 優(yōu) % 目標(biāo)類的 主概化 關(guān)系 (研究生 ) 對(duì)比類主概化關(guān)系 (本科生 ) 專業(yè) 年齡區(qū)間 GPA 累計(jì)數(shù) % 科學(xué) 16— 20 及格 % 科學(xué) 16— 20 良 % 科學(xué) 26— 30 良 % … … … … 商學(xué) 30 優(yōu) % (續(xù)) 由表可看出,與本科生相比,研究生一般趨向于年齡稍大, GPA較高。 ?(4)最后, 結(jié)果概念對(duì)比描述 以表、圖或規(guī)則的形式表示。這種可視化表示包括 對(duì)比度量 (如累計(jì)數(shù) % ),以突出目標(biāo)類 和 比較類 之間存在的差異。例如, % 的研究生選擇“科學(xué)”專業(yè),年齡在 26— 30 之間, GPA為良,而只有 % 的本科生具有這種性質(zhì)。 2. 概念比較描述的表示 概念比較描述 的可視化, 可以采用概化關(guān)系、交叉表、條型圖、餅圖、曲線和規(guī)則。除邏輯規(guī)則外,其他形式與概念 特征化 所用形式相同。這里討論用規(guī)則的形式顯示概念比較。 2. 概念比較描述的表示 (續(xù) ) 比較描述中的 目標(biāo)類 和 對(duì)比類 的區(qū)分特性,可以用 量化區(qū)分規(guī)則 量化地描述。量化區(qū)分規(guī)則對(duì)描述中每個(gè)概化元組附上一個(gè)統(tǒng)計(jì)興趣度度量 d權(quán) 。 設(shè) qa是一個(gè)概化元組, Cj是目標(biāo)類。其中, qa覆蓋 目標(biāo)類 的某些元組。 注意, qa也可能覆蓋 對(duì)比類 的某些元組,因?yàn)槲覀兲幚淼氖?比較描述 。 2. 概念比較描述的表示 (續(xù) ) qa的 d權(quán) 是 初始目標(biāo)類工作關(guān)系 中被qa覆蓋的 元組數(shù) 與 初始目標(biāo)類和對(duì)比類工作關(guān)系中 被 qa覆蓋的 總元組數(shù) 的比。形式上, qa關(guān)于 Cj的 d權(quán) 定義為: ? ? ? ???? ???miJJa Cqcou ntCqcou ntweigh td a1 2. 概念比較描述的表示 (續(xù) ) 其中, m是目標(biāo)類和對(duì)比類的總數(shù), Cj在 {C1,…,C m}中 ,而 count(qa∈ Cj)是類Cj中被 qa覆蓋的元組數(shù)。 d權(quán) 的取值范圍在 [0,1](或 [0%,100%])區(qū)間內(nèi)。 高 d權(quán) 的目標(biāo)類表明被概化元組代表的 概念主要從目標(biāo)類導(dǎo)出 ;而 低 d權(quán)表明 概念主要從對(duì)比類導(dǎo)出 。 2. 概念比較描述的表示 (續(xù) ) ?例 4: 在 例 3中假定對(duì)概化元組計(jì)數(shù),由前面兩張表得到概化元組: 專業(yè) =“科學(xué)” , 年齡區(qū)間 =“ 2125” , GPA=“ 良”的計(jì)數(shù)分布,如表所示: 學(xué)生類 專業(yè) 年齡區(qū)間 GPA 計(jì)數(shù) 研究生 科學(xué) 21— 25 良 90 本科生 科學(xué) 21— 25 良 210 概化元組研究生和本科生的計(jì)數(shù)分布 2. 概念比較描述的表示 (續(xù) ) 給定概化元組的 d權(quán) 關(guān)于 目標(biāo)類 是 90/(90+210)=30%, 關(guān)于 對(duì)比類 是210/(90+210)=70% 。 即是:如果 一個(gè)學(xué)生專業(yè)是科學(xué),年齡在 21和 25之間,GPA為良,則根據(jù)給定的數(shù)據(jù),他是研究生的概率為 30%, 是本科生的概率為70%。 類似的,也可以導(dǎo)出其他概化元組的 d權(quán) 。 2. 概念比較描述的表示 (續(xù) ) 一個(gè)確定目標(biāo)類的比較描述的 量化區(qū)分規(guī)則 記作: X, target_class(X) condition(X) [d:d_weight] ? ? 2. 概念比較描述的表示 (續(xù) ) ?例 5: 根據(jù)前表中的概化元組和計(jì)數(shù)分布,一個(gè)對(duì)研究生的 量化區(qū)分規(guī)則 可表示如下: X, 學(xué)生類 (X) =“研究生” 專業(yè) (X)=“科學(xué)” ∧ 年齡區(qū)間 (X)= “ 2125” ∧ GPA(X)=“良” [d: 30%] ? ? 2. 概念比較描述的表示 (續(xù) ) ?注:一個(gè)對(duì)比規(guī)則提供了一個(gè)充分條件,但它不是一個(gè)必要條件。例如上面的規(guī)則蘊(yùn)含:若 X滿足條件,則 X是 研究生的概率為 30%; 但決不表示 研究生有 30%可能 滿足這一條件。 演講完畢,謝謝觀看!
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1