freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

統(tǒng)計分析聚類分析ppt課件(已修改)

2025-01-27 08:14 本頁面
 

【正文】 167。 10 聚類分析( Cluster Analysis) [引例 101] 167。 10 聚類分析( Cluster Analysis) [引例 101] 167。 10 聚類分析( Cluster Analysis) ? 167。 概述 ? 167。 統(tǒng)計量 ? 167。 系統(tǒng)聚類(層次聚類) ? 167。 快速聚類 ?167。 概述 ? 問題的提出 ? 基本思想 ? 主要步驟 ? 基本原則 ? 主要分類 167。 概述 167。 概述 ? 問題的提出 聚類分析又稱群分析、點群分析、簇群分析等,是研究分類問題 (樣本或指標 )的一種多元統(tǒng)計方法。 與其它多元統(tǒng)計分析方法相比,聚類分析方法比較粗糙,理論上尚不完善,目前正處于發(fā)展階段。 但由于這種方法能解決許多實際問題,應用比較方便,因此越來越受到人們的重視。 167。 概述 ? 問題的提出 ? 基本思想 ? 假定研究對象之間存在不同程度的相似性(親疏程度)。 ? 根據(jù)觀測樣本,找出并計算一些能夠度量相似程度的統(tǒng)計量(相似系數(shù)、相關系數(shù)、距離等)。 ? 按照相似性統(tǒng)計量,將相似程度大的聚合到一類,關系疏遠的聚合到另一類,直到把所有樣本都聚合完畢,形成一個由小到大的分類系統(tǒng)。 ? 最后將分類系統(tǒng)直觀地用 圖形表示出來,即譜系圖。 167。 概述 ? 主要分類 ? R型聚類分析 對變量進行聚類分析(比較:主成分、公因子) ? Q型聚類分析 對樣本進行聚類分析(比較:主成分得分、因子得分) 167。 概述 ? 主要分類 ? 系統(tǒng)聚類( hierarchical cluster) 不指定最終的類數(shù),結論將在聚類過程中尋求,這種聚類稱為系統(tǒng)聚類 可以對變量和樣本進行聚類分析 ? 快速聚類( Kmeans cluster) 事先指定用于聚類分析的類數(shù) 只對樣本進行聚類分析,適合大樣本數(shù)據(jù) 167。 概述 ? 統(tǒng)計量 ? 為了將樣本 (或變量 )進行分類,需要研究其關系。 ? 目前用得最多的方法有兩個:一種方法是用 相似系數(shù) ,比較相似的樣本歸為一類,不怎么相似的樣本歸為不同的類。 ? 另一種方法是將一個樣本看作 P維空間的一個點,并在空間定義 距離 ,距離越近的點歸為一類,距離較遠的點歸為不同的類。 ? 對樣本進行聚類( Q型聚類),常用的統(tǒng)計量為距離; 對變量進行聚類( R 型聚類),常用的統(tǒng)計量為相似系數(shù)。 167。 統(tǒng)計量 相似系數(shù)是指衡量全部樣本或全部變量中任何兩部分相似程 度的指標。主要有內(nèi)積系數(shù)、匹配系數(shù)等幾項指標,其中內(nèi) 積系數(shù)( inner product coefficient)是普通應用于數(shù)量數(shù)據(jù)的 相似性指標。 兩個同維向量 與 的各分量依次相乘再相加,稱為兩向 量的內(nèi)積( inner product)。 內(nèi)積的數(shù)值可以作為一種反映兩向量相似程度的指標,稱為 相似系數(shù)。 1pij i jiQ x x???? ?? 統(tǒng)計量-相似系數(shù) ? 相 似 系數(shù) ( similarity coefficient) 167。 統(tǒng)計量 ijxx 為了消除量綱的影響,對內(nèi)積進行模標準化處理,經(jīng)過模標準 化處理后的內(nèi)積正好是兩個向量在原點處的夾角余弦 。 12211 0 1 piji j i jppijxxCo s Co sxx????????????? ? ???? 1 1 0 0 ijijijiji j Co sCo si j Co sCo s?????????ijijijij當 時 , , 說 明 兩 個 指 標 ( 樣 品 ) x 與 x 完 全 相 似 ;當 , 說 明 兩 個 指 標 ( 樣 品 ) x 與 x 相 似 密 切 ;當 與 正 交 時 , , 說 明 兩 個 指 標 ( 樣 品 ) x 與 x 完 全 不 一 樣 ;當 , 說 明 兩 個 指 標 ( 樣 品 ) x 與 x 差 別 很 大 。? 統(tǒng)計量-相似系數(shù) ? 夾角余弦( Cosine) ijCos?167。 統(tǒng)計量 為了消除量綱的影響,對原始數(shù)據(jù)進行離差標準化處理,經(jīng)過 離差標準化處理后的內(nèi)積正好是兩個向量的相關系數(shù) 。 ..122..11( ) ( ) ( ) ( )pi i j jijppi i j jx x x xrx x x x?????????????????? 1 1 0 0 ijijijiji j rij?????ijijijij當 時 , , 說 明 兩 個 變 量 ( 樣 本 ) x 與 x 完 全 相 似 ;當 r , 說 明 兩 個 變 量 ( 樣 本 ) x 與 x 相 似 密 切 ;當 與 正 交 時 , r , 說 明 變 量 ( 樣 本 ) x 與 x 完 全 不 一 樣 ;當 r , 說 明 變 量 ( 樣 本 ) x 與 x 差 別 很 大 。? 統(tǒng)計量-相似系數(shù) ? 相關系數(shù) ( Correlation coefficient) ijr167。 統(tǒng)計量 計算任何兩個樣本(指標) 與 之間的相關系數(shù) ,其值 越大表示樣本(指標)間接近程度越大,值越小表示接近程 度越小。 可以根據(jù)相似系數(shù)矩陣對樣本(指標)進行分類。 1 1 12 1 21Rnnn n nrrrrrr?????????????? 統(tǒng)計量-相似系數(shù) ? 相關系數(shù)矩陣 167。 統(tǒng)計量 ijxx? 統(tǒng)計量-相似系數(shù) 167。 統(tǒng)計量 距離實質(zhì)上反映的是兩個向量相異的指標,它與相似是互補 的概念。 距離系數(shù)的種類很多,但都有一個共同的特征,即當兩 個向量完全相同時取最小值,完全不同時取最大值。 ?統(tǒng)計量-距離 ? 距離 167。 統(tǒng)計量 點與點之間的距離: 把每一個樣本視為 p維空間中的一個 點,則兩個樣本之間的距離可以定義為 p維空間中兩個點之 間的距離。 類與類之間的距離: 類間距離是基于點間距離定義的,比 如兩類之間最近點之間的距離可以作為這兩類之間的距離,也
點擊復制文檔內(nèi)容
教學課件相關推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1