freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘數(shù)據(jù)挖掘∶概念和技術(shù)-資料下載頁(yè)

2025-08-22 09:03本頁(yè)面

【導(dǎo)讀】從交易數(shù)據(jù)庫(kù)中挖掘一維的布爾形關(guān)聯(lián)規(guī)則。在交易數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)中挖掘多維關(guān)聯(lián)規(guī)則。底層的項(xiàng)通常支持度也低。某些特定層的規(guī)則可能更。自上而下,深度優(yōu)先的方法:。再找他們底層的“弱”規(guī)則:。多層關(guān)聯(lián)規(guī)則的變種。層次交叉的關(guān)聯(lián)規(guī)則:。復(fù)旦面包房黃面包。不同種分層方法間的關(guān)聯(lián)規(guī)則:。+一個(gè)最小支持度閾值.如果一個(gè)項(xiàng)集的父項(xiàng)集不具有。–底層項(xiàng)不會(huì)成為頻繁集,如果支持度。生成太多的高層關(guān)聯(lián)規(guī)則。用項(xiàng)進(jìn)行可控跨層過(guò)濾。我們稱第一個(gè)規(guī)則是第二個(gè)規(guī)則的祖先。挖掘操作的代價(jià)可能高或低,結(jié)果可能細(xì)致或粗糙。在速度和質(zhì)量之間折衷:逐步精化。預(yù)存儲(chǔ)所有正面答案—允許進(jìn)一步正確性驗(yàn)證,而不必。然后在減少后的候選集上進(jìn)行計(jì)算量大的算法(Koperski. 有限個(gè)值,值之間無(wú)順序關(guān)系。如:{age,occupation,buys}是一個(gè)3-維詞集合。按照對(duì)age處理方式的不同,分為:。數(shù)值被替換為區(qū)間范圍。關(guān)系數(shù)據(jù)庫(kù)中,要找到所有頻繁k-維詞需要k或k+1次表掃。適宜使用數(shù)據(jù)立方體。動(dòng)態(tài)離散化數(shù)值屬性

  

【正文】 ed, yellow, blue, green四種狀態(tài)。有兩種計(jì)算相異度的方法: ? 方法 1: 簡(jiǎn)單匹配方法 ? M是匹配的數(shù)目 , p是全部變量的數(shù)目 ? 方法 2: 使用二元變量 ? 為每一個(gè)狀態(tài)創(chuàng)建一個(gè)新的二元變量,可以用非對(duì)稱的二元變量來(lái)編碼標(biāo)稱變量。 p mpjid ??),(2020116 數(shù)據(jù)挖掘:概念和技術(shù) 41 序數(shù)型變量 ? 一個(gè)序數(shù)型變量可以是離散的也可以是連續(xù)的 ? 離散的序數(shù)型變量類似于標(biāo)稱變量,除了它的 M個(gè)狀態(tài)是以有意義的序列排序的,比如職稱 ? 連續(xù)的序數(shù)型變量類似于區(qū)間標(biāo)度變量,但是它沒有單位,值的相對(duì)順序是必要的,而其實(shí)際大小并不重要。 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 42 序數(shù)型變量 ? 相異度的計(jì)算 與區(qū)間標(biāo)度變量的計(jì)算方法相類似 ? 將 xif 用它對(duì)應(yīng)的秩代替 ? 將每個(gè)變量的值域映射到 [, ]上,使得每個(gè)變量都有相同的權(quán)重。這通過(guò)用 zif來(lái)替代 rif來(lái)實(shí)現(xiàn) ? 用前面所述的區(qū)間標(biāo)度變量的任一種距離計(jì)算方法來(lái)計(jì)算 11???fifif Mrz},...,1{ fif Mr ?2020116 數(shù)據(jù)挖掘:概念和技術(shù) 43 比例標(biāo)度型變量( Ratioscaled variable) ? 比例標(biāo)度型變量 : 總是取正的度量值,有一個(gè)非線性的標(biāo)度,近似的遵循指數(shù)標(biāo)度,比如 AeBt or AeBt ? 計(jì)算相異度的方法 : ? 采用與處理區(qū)間標(biāo)度變量相同的方法 — 不是一個(gè)好的選擇 ? 進(jìn)行對(duì)數(shù)變換,對(duì)變換得到的值在采用與處理區(qū)間標(biāo)度變量相同的方法 yif = log(xif) ? 將其作為連續(xù)的序數(shù)型數(shù)據(jù),將其秩作為區(qū)間標(biāo)度的值來(lái)對(duì)待。 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 44 混合類型的變量 ? 一個(gè)數(shù)據(jù)庫(kù)可能包含了所有這 6中類型的變量 用以下公式計(jì)算對(duì)象 i, j之間的相異度 . 其中, p為對(duì)象中的變量個(gè)數(shù) 如果 xif或 xjf 缺失(即對(duì)象 i或?qū)ο?j沒有變量 f的值),或者 xif = xjf =0, 且變量 f是不對(duì)稱的二元變量,則指示項(xiàng) δij(f)=0; 否則δij(f)=1 )(1)()(1),(fijpffijfijpf djid???????2020116 數(shù)據(jù)挖掘:概念和技術(shù) 45 混合類型的變量 ? f 是二元變量或標(biāo)稱變量 : if xif = xjf dij(f) = 0, else dij(f) = 1 ? f 是區(qū)間標(biāo)度變量 : dij(f) = | xifxjf |/maxhxhfminhxhf 其中 h遍取變量 f的所有非空缺對(duì)象 ? f 是序數(shù)型或比例標(biāo)度型 ? 計(jì)算秩 rif ? 計(jì)算 zif并將其作為區(qū)間標(biāo)度變量值對(duì)待 11???fifMrz if2020116 數(shù)據(jù)挖掘:概念和技術(shù) 46 Chapter 8. Cluster Analysis ? 什么是聚類分析 ? ? 聚類分析中的數(shù)據(jù)類型 ? 主要聚類分析方法分類 ? 劃分方法( Partitioning Methods) ? 分層方法 ? 基于密度的方法 ? 基于表格的方法 ? 基于模型( ModelBased) 的聚類方法 ? 異常分析 ? 總結(jié) 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 47 Major Clustering Approaches ? Partitioning algorithms: Construct various partitions and then evaluate them by some criterion ? Hierarchy algorithms: Create a hierarchical deposition of the set of data (or objects) using some criterion ? Densitybased: based on connectivity and density functions ? Gridbased: based on a multiplelevel granularity structure ? Modelbased: A model is hypothesized for each of the clusters and the idea is to find the best fit of that model to each other 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 48 Thank you !!
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1