freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基礎第3章數(shù)據(jù)預處理(趙志升)-文庫吧資料

2025-03-13 09:10本頁面
  

【正文】 其每個內(nèi)部節(jié)點表示一個屬性上的測試,每個分枝(非樹葉)對應于測試的一個輸出;每個外部節(jié)點(樹葉)表示一個判定類。 說明:以上三種方法可以使用一個閾值來確定是否停止屬性選擇。 逐步向后刪除 :由整個屬性集開始,每一步刪除掉尚在屬性集中的最壞的屬性。 第四節(jié) 數(shù)據(jù)歸約 維歸約 屬性子集選擇的基本啟發(fā)式方法包括的技術有: ? 逐步向前選擇 ? 逐步向后刪除 ? 向前選擇和向后刪除的結合 ? 判定樹歸納 第四節(jié) 數(shù)據(jù)歸約 維歸約 逐步向前選擇 :由空集開始,選擇屬性集中最好的屬性,并將其添加到該集合中。其含義是由局部最優(yōu)選擇,期望由此導致全局最優(yōu)選擇。 屬性子集選擇的目標是找出最小屬性集,使得數(shù)據(jù)類的概率分布盡可能地接近使用所有屬性的原分布。 維歸約 通過刪除不相關的屬性(或維)減少數(shù)據(jù)量。 ? 方體的格:數(shù)據(jù)立方體可以看作方體的格。 ? 頂點方體:最高層抽象的數(shù)據(jù)立方體。16238 165。5700 年 銷售額 2023 2023 2023 165。4430 165。 第四節(jié) 數(shù)據(jù)歸約 數(shù)據(jù)歸約的策略有: ? 數(shù)據(jù)立方體聚集: ? 維歸約 ? 數(shù)據(jù)壓縮 ? 數(shù)值壓縮 ? 離散化和概念分層生成 第四節(jié) 數(shù)據(jù)歸約 數(shù)據(jù)立方體聚集 年 =2023 年 =2023 年 =2023 季度 銷售額 Q1 Q2 Q3 Q4 165。 第四節(jié) 數(shù)據(jù)歸約 數(shù)據(jù)歸約 技術可以用來得到數(shù)據(jù)集的歸約表示,雖然它很小,但仍接近于保持原數(shù)據(jù)的完整性。 ? 規(guī)范化:將屬性數(shù)據(jù)按比例縮放,使之落入一個小的特 定區(qū)間。 ? 聚集:對數(shù)據(jù)進行匯總和聚集。 ? 數(shù)據(jù)值沖突的檢測與處理:不同數(shù)據(jù)源的屬 性值不同。 第三節(jié) 數(shù)據(jù)集成與變換 數(shù)據(jù)集成 ? 模式集成:可以通過元數(shù)據(jù)避免錯誤。 第三節(jié) 數(shù)據(jù)集成與變換 數(shù)據(jù)挖掘經(jīng)常需要: ? 數(shù)據(jù)集成:由多個數(shù)據(jù)存儲合并數(shù)據(jù) ? 數(shù)據(jù)轉換:將數(shù)據(jù)轉換成適于挖掘的形式 第三節(jié) 數(shù)據(jù)集成與變換 數(shù)據(jù)集成 數(shù)據(jù)集成 是將多個數(shù)據(jù)源中的數(shù)據(jù)結合起來存放在一個一致的數(shù)據(jù)存儲中。 ? 多線性回歸:是線性回歸的擴展,它涉及多于 兩個變量,數(shù)據(jù)要適合一個多維面。 第二節(jié) 數(shù)據(jù)清理 噪聲數(shù)據(jù) 回歸 :通過讓數(shù)據(jù)適合一個函數(shù)(回歸函數(shù))來平滑數(shù)據(jù)。 ? 按箱平均值平滑 ? 按箱中值平滑 ? 按箱邊界平滑 第二節(jié) 數(shù)據(jù)清理 噪聲數(shù)據(jù) 聚類 :孤立點可以被聚類檢測。 對于噪聲通常采用數(shù)據(jù)平滑技術去除噪聲。 數(shù)據(jù)清理 例程試圖填充空缺的值,識別孤立點
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1