freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

時(shí)間序列挖掘聚類(完整版)

2025-03-28 18:37上一頁面

下一頁面
  

【正文】 初始狀態(tài)下所有時(shí)間序列數(shù)據(jù)自成一簇,每條時(shí)間序列數(shù)據(jù)為各自的簇中心,初始化距離矩陣,計(jì)算任意兩條時(shí)間序列數(shù)據(jù)間的距離,循環(huán) 2)到 5)。 基亍 LB_Hust 距離矩陣的層次聚類 ? 基于距離矩陣的層次聚類算法是以犧牲空間換取時(shí)間的算法,存放 n 條記錄兩兩之間的距離,在距離函數(shù)計(jì)算具有對稱性的情況下,實(shí)際的矩陣只需存放上三角或下三角 n*(n+1)/2 個(gè)數(shù)據(jù)。即 LB_Hust (X,Y) =LB_Hust (Y,X)。即 LB_Keogh(X,Y) ? LB_Keogh(Y,X)。(可能在隨機(jī)抽樣時(shí)錯(cuò)過最佳中心點(diǎn)而永遠(yuǎn)找不到最佳聚類) kmediods時(shí)間序列聚類 基于 k中心點(diǎn)方法的時(shí)間序列聚類 見 基亍 LB_Hust 距離的時(shí)間序列聚類 ? 層次聚類方法對給定數(shù)據(jù)對象集合進(jìn)行層次分解。 基亍模型的時(shí)間序列聚類 ? 基于模型的聚類的基本思想是把原始時(shí)間序列轉(zhuǎn)換成模型的幾個(gè)參數(shù),比如 AR模型或 HMM模型等,然后用模型參數(shù)進(jìn)行聚類 (Jie and Qiang, 2023,Camastra and Verri, 2023, Xiong and Yeung, 2023, Panuccio et al., 2023)。 ? 8) 可解釋性和可用性: 知識發(fā)現(xiàn)過程中,聚類結(jié)果總是需要表現(xiàn)為一定的知識,這就要求聚類結(jié)果可解釋,易理解。但是一個(gè)簇可能是任意形狀的, 提出能發(fā)現(xiàn)任意形狀簇的算法是很重要的 。所謂聚類,是指將物理或抽象對象的集合 分組 成為由 類似的對象 組成的多個(gè)類的過程 。 ? 2) 處理丌同類型屬性的能力: 除了通常處理的數(shù)值型數(shù)據(jù),應(yīng)用當(dāng)中可能要求聚類其它類型的數(shù)據(jù),如:二元類型,分類 /標(biāo)稱類型,序數(shù)型, 時(shí)間序列 、圖數(shù)據(jù)或者丌同數(shù)據(jù)類型的混合。一些聚類算法對亍這樣的數(shù)據(jù)敏感,導(dǎo)致聚類質(zhì)量 丌高。 基亍特征數(shù)據(jù)的時(shí)間序列聚類 ? 基于特征的表示方法是 把原始時(shí)間序列轉(zhuǎn)換到一個(gè)低維的特征空間,然后用傳統(tǒng)的聚類方法對特征向量進(jìn)行聚類 (Yang et al., 2023, Xiaozhe et al., 2023,Keogh et al., 2023, Chen, 2023, Zhang et al., 2023, Wang et al., 2023, Costa Santos et al., 2023, Wang et al., 2023, Bagnall and Janacek, 2023, Domeniconi et al., 2023)。 ?實(shí)現(xiàn):圍繞中心點(diǎn)劃分( Partitioning Around Medoids, PAM)算法 ?算法 :k中心點(diǎn)。 ? 層次方法的缺陷在于,一旦一個(gè)步驟完成,就不能夠被撤銷。 CK}; LB_Keogh: 一種考慮彎曲路徑限制的 DTW 計(jì)算方法 ? 對于彎曲路徑限制為 w 的時(shí)間序列 DTW 距離計(jì)算,定義兩個(gè)序列 U 和 L,其中對于第 i 個(gè)元素我們有如下的上下界定義: ? U 和 L 作為在 2w 時(shí)間窗內(nèi),對于原時(shí)間序列的每個(gè)元素所對應(yīng)的上下界,表現(xiàn)在圖形上實(shí)際上是形成了一個(gè)帶狀的域?qū)⒃紩r(shí)間序列包裹在這個(gè)域中,如圖 34 所示。距離產(chǎn)生方式如圖 35 所示。 ? 3) 計(jì)算兩兩簇之間的距離,記錄具有最小距離的兩個(gè)簇,將兩個(gè)簇歸并,根據(jù)歸并算法更新聚類中心。 ? 對于上述采用距離矩陣的層次聚類,相比前面算法,每一層合并時(shí),距離計(jì)算次數(shù)為 c(n,2)次,其中 n 表示當(dāng)前層中的簇?cái)?shù),時(shí)間復(fù)雜度為 o(n2),采用距離矩陣方法則每次僅需計(jì)算 n 次距離。在提取的數(shù)據(jù)中發(fā)現(xiàn),股票數(shù)據(jù)存在如下兩個(gè)特點(diǎn): 一、由于股市的休市,股票數(shù)據(jù)存在空值 ;二、股票之間的收盤價(jià)存在很大差異 。 股票數(shù)據(jù)聚類:數(shù)據(jù)的歸一化 ? 針對股票數(shù)據(jù)間的股價(jià)差距大的問題,采用歸一化處理,歸一化處理主要解決比較數(shù)據(jù)間量綱不統(tǒng)一的問題,在對股票進(jìn)行聚類分析中,股票的相似性集中于股價(jià)變化趨勢的相似性,而非股價(jià)之間的相似性,所以采用以下公式 對數(shù)據(jù)進(jìn)行歸一化處理。 ? 流數(shù)據(jù)聚類算法通常會維護(hù)一個(gè) “ 概要數(shù)據(jù)結(jié)構(gòu) ” ,用來保存數(shù)據(jù)的摘要信息,當(dāng)需要輸出聚類結(jié)果時(shí),以概要數(shù)據(jù)結(jié)構(gòu)中保存的信息作為目標(biāo)對象集合,生成所需要的結(jié)果。 ? 其次,這些數(shù)據(jù)均 按照時(shí)間順序連續(xù)到達(dá) 。 流數(shù)據(jù)聚類問題模型 ? 3)流數(shù)據(jù)算法的目標(biāo)集合是數(shù)據(jù)流中截取的某一個(gè)時(shí)間段 (時(shí)間窗 )的對象集合。 ? SmallSpace 算法正是這類算法的典型代表。 雙層流數(shù)據(jù)聚類 ? J. Han 提出雙層結(jié)構(gòu)算法 CluStream[12] ? 雙層聚類算法將處理工作分為兩個(gè)層面:在線層算法負(fù)責(zé)對數(shù)據(jù)進(jìn)行粗糙但快速的處理,并負(fù)責(zé)保存中間結(jié)果;離線層算法在中間結(jié)果的基礎(chǔ)上進(jìn)行精確而復(fù)雜的分析,此時(shí)目標(biāo)集合已成為靜態(tài)集合,因此通常情況下不必考慮數(shù)據(jù)流速的影響,并得到最終結(jié)果。易見用戶對最近數(shù)據(jù)更感興趣。 ( 3)調(diào)整階段 一個(gè)給定劃分的新種子被定義成那個(gè)劃分中帶權(quán)重的微簇中心。 :31:0018:31:00March 23, 2023 ? 1他鄉(xiāng)生白發(fā),舊國見青山。 :31:0018:31Mar2323Mar23 ? 1世間成事,不求其絕對圓滿,留一份不足,可得無限完美。 , March 23, 2023 ? 閱讀一切好書如同和過去最杰出的人談話。 2023年 3月 23日星期四 6時(shí) 31分 0秒 18:31:0023 March 2023 ? 1一個(gè)人即使已登上頂峰,也仍要自強(qiáng)不息。 :31:0018:31Mar2323Mar23 ? 1越是無能的人,越喜歡挑剔別人的錯(cuò)兒。 :31:0018:31:00March 23, 2023 ? 1意志堅(jiān)強(qiáng)的人能把世界放在手中像泥塊一樣任意揉捏。 。能夠發(fā)掘數(shù)據(jù)流潛在的演化特性。這些快照保存在外存上,作為離線算法的輸入,可以用來進(jìn)行數(shù)據(jù)流演化分析。每個(gè)微簇用五元組(SS, LS, ST, LT, N)來表示,其中 N 為微簇中包含的數(shù)據(jù)點(diǎn)個(gè)數(shù),若數(shù)據(jù)維度為 d,則 LS,與 SS 均為 d 維向量, LS 為微簇中數(shù)據(jù)點(diǎn)的線性加和, SS 為微簇中數(shù)據(jù)點(diǎn)的平方和, LT 為各個(gè)數(shù)據(jù)點(diǎn)時(shí)間標(biāo)簽的線性加和, ST 為各個(gè)數(shù)據(jù)點(diǎn)時(shí)間標(biāo)簽的平方和。 ? 2) 重復(fù)上述步驟,當(dāng)處理 m2/ O(k)個(gè)原始數(shù)據(jù)點(diǎn)時(shí),將得到 m 個(gè) 1級中心點(diǎn)。算法的目標(biāo)集合即由落入窗口 W(t, h)的數(shù)據(jù)對象組成。 流數(shù)據(jù)聚類問題模型 ? 假設(shè)流數(shù)據(jù)由一系列按照時(shí)間順序連續(xù)到達(dá)的數(shù)據(jù)點(diǎn) X1,...,Xi...構(gòu)成,其中,每個(gè)數(shù)據(jù)點(diǎn)擁有 d 個(gè)屬性,用 d 維向量的形式來表示: ? 那么流數(shù)據(jù)聚類問題,就是將數(shù)據(jù)流中的某個(gè)特定的子對象集合 {
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1