freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

統(tǒng)計(jì)分析聚類分析ppt課件(已修改)

2025-01-27 08:14 本頁面
 

【正文】 167。 10 聚類分析( Cluster Analysis) [引例 101] 167。 10 聚類分析( Cluster Analysis) [引例 101] 167。 10 聚類分析( Cluster Analysis) ? 167。 概述 ? 167。 統(tǒng)計(jì)量 ? 167。 系統(tǒng)聚類(層次聚類) ? 167。 快速聚類 ?167。 概述 ? 問題的提出 ? 基本思想 ? 主要步驟 ? 基本原則 ? 主要分類 167。 概述 167。 概述 ? 問題的提出 聚類分析又稱群分析、點(diǎn)群分析、簇群分析等,是研究分類問題 (樣本或指標(biāo) )的一種多元統(tǒng)計(jì)方法。 與其它多元統(tǒng)計(jì)分析方法相比,聚類分析方法比較粗糙,理論上尚不完善,目前正處于發(fā)展階段。 但由于這種方法能解決許多實(shí)際問題,應(yīng)用比較方便,因此越來越受到人們的重視。 167。 概述 ? 問題的提出 ? 基本思想 ? 假定研究對(duì)象之間存在不同程度的相似性(親疏程度)。 ? 根據(jù)觀測(cè)樣本,找出并計(jì)算一些能夠度量相似程度的統(tǒng)計(jì)量(相似系數(shù)、相關(guān)系數(shù)、距離等)。 ? 按照相似性統(tǒng)計(jì)量,將相似程度大的聚合到一類,關(guān)系疏遠(yuǎn)的聚合到另一類,直到把所有樣本都聚合完畢,形成一個(gè)由小到大的分類系統(tǒng)。 ? 最后將分類系統(tǒng)直觀地用 圖形表示出來,即譜系圖。 167。 概述 ? 主要分類 ? R型聚類分析 對(duì)變量進(jìn)行聚類分析(比較:主成分、公因子) ? Q型聚類分析 對(duì)樣本進(jìn)行聚類分析(比較:主成分得分、因子得分) 167。 概述 ? 主要分類 ? 系統(tǒng)聚類( hierarchical cluster) 不指定最終的類數(shù),結(jié)論將在聚類過程中尋求,這種聚類稱為系統(tǒng)聚類 可以對(duì)變量和樣本進(jìn)行聚類分析 ? 快速聚類( Kmeans cluster) 事先指定用于聚類分析的類數(shù) 只對(duì)樣本進(jìn)行聚類分析,適合大樣本數(shù)據(jù) 167。 概述 ? 統(tǒng)計(jì)量 ? 為了將樣本 (或變量 )進(jìn)行分類,需要研究其關(guān)系。 ? 目前用得最多的方法有兩個(gè):一種方法是用 相似系數(shù) ,比較相似的樣本歸為一類,不怎么相似的樣本歸為不同的類。 ? 另一種方法是將一個(gè)樣本看作 P維空間的一個(gè)點(diǎn),并在空間定義 距離 ,距離越近的點(diǎn)歸為一類,距離較遠(yuǎn)的點(diǎn)歸為不同的類。 ? 對(duì)樣本進(jìn)行聚類( Q型聚類),常用的統(tǒng)計(jì)量為距離; 對(duì)變量進(jìn)行聚類( R 型聚類),常用的統(tǒng)計(jì)量為相似系數(shù)。 167。 統(tǒng)計(jì)量 相似系數(shù)是指衡量全部樣本或全部變量中任何兩部分相似程 度的指標(biāo)。主要有內(nèi)積系數(shù)、匹配系數(shù)等幾項(xiàng)指標(biāo),其中內(nèi) 積系數(shù)( inner product coefficient)是普通應(yīng)用于數(shù)量數(shù)據(jù)的 相似性指標(biāo)。 兩個(gè)同維向量 與 的各分量依次相乘再相加,稱為兩向 量的內(nèi)積( inner product)。 內(nèi)積的數(shù)值可以作為一種反映兩向量相似程度的指標(biāo),稱為 相似系數(shù)。 1pij i jiQ x x???? ?? 統(tǒng)計(jì)量-相似系數(shù) ? 相 似 系數(shù) ( similarity coefficient) 167。 統(tǒng)計(jì)量 ijxx 為了消除量綱的影響,對(duì)內(nèi)積進(jìn)行模標(biāo)準(zhǔn)化處理,經(jīng)過模標(biāo)準(zhǔn) 化處理后的內(nèi)積正好是兩個(gè)向量在原點(diǎn)處的夾角余弦 。 12211 0 1 piji j i jppijxxCo s Co sxx????????????? ? ???? 1 1 0 0 ijijijiji j Co sCo si j Co sCo s?????????ijijijij當(dāng) 時(shí) , , 說 明 兩 個(gè) 指 標(biāo) ( 樣 品 ) x 與 x 完 全 相 似 ;當(dāng) , 說 明 兩 個(gè) 指 標(biāo) ( 樣 品 ) x 與 x 相 似 密 切 ;當(dāng) 與 正 交 時(shí) , , 說 明 兩 個(gè) 指 標(biāo) ( 樣 品 ) x 與 x 完 全 不 一 樣 ;當(dāng) , 說 明 兩 個(gè) 指 標(biāo) ( 樣 品 ) x 與 x 差 別 很 大 。? 統(tǒng)計(jì)量-相似系數(shù) ? 夾角余弦( Cosine) ijCos?167。 統(tǒng)計(jì)量 為了消除量綱的影響,對(duì)原始數(shù)據(jù)進(jìn)行離差標(biāo)準(zhǔn)化處理,經(jīng)過 離差標(biāo)準(zhǔn)化處理后的內(nèi)積正好是兩個(gè)向量的相關(guān)系數(shù) 。 ..122..11( ) ( ) ( ) ( )pi i j jijppi i j jx x x xrx x x x?????????????????? 1 1 0 0 ijijijiji j rij?????ijijijij當(dāng) 時(shí) , , 說 明 兩 個(gè) 變 量 ( 樣 本 ) x 與 x 完 全 相 似 ;當(dāng) r , 說 明 兩 個(gè) 變 量 ( 樣 本 ) x 與 x 相 似 密 切 ;當(dāng) 與 正 交 時(shí) , r , 說 明 變 量 ( 樣 本 ) x 與 x 完 全 不 一 樣 ;當(dāng) r , 說 明 變 量 ( 樣 本 ) x 與 x 差 別 很 大 。? 統(tǒng)計(jì)量-相似系數(shù) ? 相關(guān)系數(shù) ( Correlation coefficient) ijr167。 統(tǒng)計(jì)量 計(jì)算任何兩個(gè)樣本(指標(biāo)) 與 之間的相關(guān)系數(shù) ,其值 越大表示樣本(指標(biāo))間接近程度越大,值越小表示接近程 度越小。 可以根據(jù)相似系數(shù)矩陣對(duì)樣本(指標(biāo))進(jìn)行分類。 1 1 12 1 21Rnnn n nrrrrrr?????????????? 統(tǒng)計(jì)量-相似系數(shù) ? 相關(guān)系數(shù)矩陣 167。 統(tǒng)計(jì)量 ijxx? 統(tǒng)計(jì)量-相似系數(shù) 167。 統(tǒng)計(jì)量 距離實(shí)質(zhì)上反映的是兩個(gè)向量相異的指標(biāo),它與相似是互補(bǔ) 的概念。 距離系數(shù)的種類很多,但都有一個(gè)共同的特征,即當(dāng)兩 個(gè)向量完全相同時(shí)取最小值,完全不同時(shí)取最大值。 ?統(tǒng)計(jì)量-距離 ? 距離 167。 統(tǒng)計(jì)量 點(diǎn)與點(diǎn)之間的距離: 把每一個(gè)樣本視為 p維空間中的一個(gè) 點(diǎn),則兩個(gè)樣本之間的距離可以定義為 p維空間中兩個(gè)點(diǎn)之 間的距離。 類與類之間的距離: 類間距離是基于點(diǎn)間距離定義的,比 如兩類之間最近點(diǎn)之間的距離可以作為這兩類之間的距離,也
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1