freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘數(shù)據(jù)挖掘∶概念和技術(shù)-資料下載頁

2025-08-22 09:03本頁面

【導(dǎo)讀】從交易數(shù)據(jù)庫中挖掘一維的布爾形關(guān)聯(lián)規(guī)則。在交易數(shù)據(jù)庫和數(shù)據(jù)倉庫中挖掘多維關(guān)聯(lián)規(guī)則。底層的項通常支持度也低。某些特定層的規(guī)則可能更。自上而下,深度優(yōu)先的方法:。再找他們底層的“弱”規(guī)則:。多層關(guān)聯(lián)規(guī)則的變種。層次交叉的關(guān)聯(lián)規(guī)則:。復(fù)旦面包房黃面包。不同種分層方法間的關(guān)聯(lián)規(guī)則:。+一個最小支持度閾值.如果一個項集的父項集不具有。–底層項不會成為頻繁集,如果支持度。生成太多的高層關(guān)聯(lián)規(guī)則。用項進(jìn)行可控跨層過濾。我們稱第一個規(guī)則是第二個規(guī)則的祖先。挖掘操作的代價可能高或低,結(jié)果可能細(xì)致或粗糙。在速度和質(zhì)量之間折衷:逐步精化。預(yù)存儲所有正面答案—允許進(jìn)一步正確性驗證,而不必。然后在減少后的候選集上進(jìn)行計算量大的算法(Koperski. 有限個值,值之間無順序關(guān)系。如:{age,occupation,buys}是一個3-維詞集合。按照對age處理方式的不同,分為:。數(shù)值被替換為區(qū)間范圍。關(guān)系數(shù)據(jù)庫中,要找到所有頻繁k-維詞需要k或k+1次表掃。適宜使用數(shù)據(jù)立方體。動態(tài)離散化數(shù)值屬性

  

【正文】 ed, yellow, blue, green四種狀態(tài)。有兩種計算相異度的方法: ? 方法 1: 簡單匹配方法 ? M是匹配的數(shù)目 , p是全部變量的數(shù)目 ? 方法 2: 使用二元變量 ? 為每一個狀態(tài)創(chuàng)建一個新的二元變量,可以用非對稱的二元變量來編碼標(biāo)稱變量。 p mpjid ??),(2020116 數(shù)據(jù)挖掘:概念和技術(shù) 41 序數(shù)型變量 ? 一個序數(shù)型變量可以是離散的也可以是連續(xù)的 ? 離散的序數(shù)型變量類似于標(biāo)稱變量,除了它的 M個狀態(tài)是以有意義的序列排序的,比如職稱 ? 連續(xù)的序數(shù)型變量類似于區(qū)間標(biāo)度變量,但是它沒有單位,值的相對順序是必要的,而其實際大小并不重要。 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 42 序數(shù)型變量 ? 相異度的計算 與區(qū)間標(biāo)度變量的計算方法相類似 ? 將 xif 用它對應(yīng)的秩代替 ? 將每個變量的值域映射到 [, ]上,使得每個變量都有相同的權(quán)重。這通過用 zif來替代 rif來實現(xiàn) ? 用前面所述的區(qū)間標(biāo)度變量的任一種距離計算方法來計算 11???fifif Mrz},...,1{ fif Mr ?2020116 數(shù)據(jù)挖掘:概念和技術(shù) 43 比例標(biāo)度型變量( Ratioscaled variable) ? 比例標(biāo)度型變量 : 總是取正的度量值,有一個非線性的標(biāo)度,近似的遵循指數(shù)標(biāo)度,比如 AeBt or AeBt ? 計算相異度的方法 : ? 采用與處理區(qū)間標(biāo)度變量相同的方法 — 不是一個好的選擇 ? 進(jìn)行對數(shù)變換,對變換得到的值在采用與處理區(qū)間標(biāo)度變量相同的方法 yif = log(xif) ? 將其作為連續(xù)的序數(shù)型數(shù)據(jù),將其秩作為區(qū)間標(biāo)度的值來對待。 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 44 混合類型的變量 ? 一個數(shù)據(jù)庫可能包含了所有這 6中類型的變量 用以下公式計算對象 i, j之間的相異度 . 其中, p為對象中的變量個數(shù) 如果 xif或 xjf 缺失(即對象 i或?qū)ο?j沒有變量 f的值),或者 xif = xjf =0, 且變量 f是不對稱的二元變量,則指示項 δij(f)=0; 否則δij(f)=1 )(1)()(1),(fijpffijfijpf djid???????2020116 數(shù)據(jù)挖掘:概念和技術(shù) 45 混合類型的變量 ? f 是二元變量或標(biāo)稱變量 : if xif = xjf dij(f) = 0, else dij(f) = 1 ? f 是區(qū)間標(biāo)度變量 : dij(f) = | xifxjf |/maxhxhfminhxhf 其中 h遍取變量 f的所有非空缺對象 ? f 是序數(shù)型或比例標(biāo)度型 ? 計算秩 rif ? 計算 zif并將其作為區(qū)間標(biāo)度變量值對待 11???fifMrz if2020116 數(shù)據(jù)挖掘:概念和技術(shù) 46 Chapter 8. Cluster Analysis ? 什么是聚類分析 ? ? 聚類分析中的數(shù)據(jù)類型 ? 主要聚類分析方法分類 ? 劃分方法( Partitioning Methods) ? 分層方法 ? 基于密度的方法 ? 基于表格的方法 ? 基于模型( ModelBased) 的聚類方法 ? 異常分析 ? 總結(jié) 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 47 Major Clustering Approaches ? Partitioning algorithms: Construct various partitions and then evaluate them by some criterion ? Hierarchy algorithms: Create a hierarchical deposition of the set of data (or objects) using some criterion ? Densitybased: based on connectivity and density functions ? Gridbased: based on a multiplelevel granularity structure ? Modelbased: A model is hypothesized for each of the clusters and the idea is to find the best fit of that model to each other 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 48 Thank you !!
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1