freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘基礎(chǔ)第3章數(shù)據(jù)預(yù)處理(趙志升)-資料下載頁(yè)

2025-03-09 09:10本頁(yè)面
  

【正文】 據(jù)元組視為對(duì)象。它將對(duì)象劃分為 群 或 聚類 ,使得在一個(gè)聚類中的對(duì)象“類似”,但與其他聚類中的對(duì)象“不類似”。通常,類似性基于距離,用對(duì)象在空間中的“接近”程度定義。 聚類 的“ 質(zhì)量 ”可以用“直徑”表示,直徑是一個(gè)聚類中兩個(gè)任意對(duì)象的最大距離。 第四節(jié) 數(shù)據(jù)歸約 數(shù)值歸約 ? 聚類 質(zhì)心距離 是聚類質(zhì)量的另一種度量,它定義為聚類質(zhì)心到每個(gè)聚類對(duì)象的平均距離。 ? 在數(shù)據(jù)歸約時(shí),用數(shù)據(jù)的 聚類表示 替換實(shí)際數(shù)據(jù)。 ? 在數(shù)據(jù)庫(kù)系統(tǒng)中, 多維索引樹 主要用于提供對(duì)數(shù)據(jù)的快速訪問;也可用于分層數(shù)據(jù)歸約,提供數(shù)據(jù)的多維聚類;也可用于提供查詢的近似回答。 第四節(jié) 數(shù)據(jù)歸約 數(shù)值歸約 ? 選樣 選樣是用數(shù)據(jù)的較小隨機(jī)樣本(子集)表示大的數(shù)據(jù)集,它可以作為一種數(shù)據(jù)歸約技術(shù)使用。 第四節(jié) 數(shù)據(jù)歸約 數(shù)值歸約 ? 選樣 假定大的數(shù)據(jù)集 D包含 N個(gè)元組,則對(duì) D的選樣有: ? 簡(jiǎn)單選擇 n個(gè)樣本,不回放 ? 簡(jiǎn)單選擇 n個(gè)樣本,回放 ? 聚類選樣 ? 分層選樣 第四節(jié) 數(shù)據(jù)歸約 數(shù)值歸約 ? 選樣 采用選樣進(jìn)行數(shù)據(jù)歸約的優(yōu)點(diǎn):可以得到樣本的花費(fèi)正比例于樣本的大小 n,而不是數(shù)據(jù)的大小 N。因此選樣的復(fù)雜性子線性于數(shù)據(jù)的大小。 用于數(shù)據(jù)歸約時(shí),選樣最常用來回答聚集查詢。在指定的誤差范圍內(nèi),可以用中心極限定理確定估計(jì)一個(gè)給定的函數(shù)的指定誤差范圍內(nèi)所需的樣本大小。 第五節(jié) 離散化和概念分層生成 通過將屬性域劃分為區(qū)間, 離散化 技術(shù)可以用來減少給定的連續(xù)屬性值的個(gè)數(shù)。區(qū)間的標(biāo)號(hào)可以替代實(shí)際的數(shù)據(jù)值。 許多離散化技術(shù)都可以遞歸使用,以便提供屬性值的分層或多分解劃分,即 概念分層 。 第五節(jié) 離散化和概念分層生成 數(shù)值數(shù)據(jù)的離散化和概念分層生成 對(duì)于數(shù)值屬性,由于數(shù)據(jù)的可能取值范圍的多樣性和數(shù)據(jù)值的更新頻繁,進(jìn)行概念分層比較困難。數(shù)值屬性的概念分層可以根據(jù)數(shù)據(jù)分布分析自動(dòng)地構(gòu)造,基本方法主要有: 第五節(jié) 離散化和概念分層生成 數(shù)值數(shù)據(jù)的離散化和概念分層生成 ? 分箱 ? 直方圖分析 ? 聚類分析 ? 基于熵的離散化 ? 通過自然劃分分段 第五節(jié) 離散化和概念分層生成 分類數(shù)據(jù)的概念分層生成 分類數(shù)據(jù)是離散數(shù)據(jù)。一個(gè)分類屬性具有有限(但可能很多)不同值,值之間無序。 ? 由用戶或?qū)<以谀J郊?jí)顯式地說明屬性的部分序 ? 通過顯式數(shù)據(jù)分組說明分層結(jié)構(gòu)的一部分 ? 說明屬性集,但不說明它們的偏序 ? 只說明部分屬性集 思考問題: 數(shù)據(jù)預(yù)處理的意義是什么?其基本方法主要有哪些? 什么是數(shù)據(jù)清理?其基本方法主要有哪些? 什么是數(shù)據(jù)集成?數(shù)據(jù)集成主要涉及哪些問題? 數(shù)據(jù)變換主要涉及哪些內(nèi)容? 數(shù)據(jù)歸約的策略主要有哪些? 簡(jiǎn)述維歸約及其屬性子集選擇的基本啟發(fā)式方法。 什么是數(shù)據(jù)壓縮?典型的數(shù)據(jù)壓縮技術(shù)有哪些? 什么是數(shù)值歸約?其主要包括哪些歸約技術(shù)? 演講完畢,謝謝觀看!
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1