freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多元統(tǒng)計(jì)分析聚類分析講義-wenkub

2022-09-11 16:58:24 本頁(yè)面
 

【正文】 來(lái), Ward法與前七種方法有較大的差異,但 如果將pG與qG的距離定義為 2pq r p qD S S S? ? ? 其中r p qG G G?, rS 為 rG 的離差平方和。 ( 3)例子: P83續(xù)例 1。 ( 3)例子: P81續(xù)例 1。 6.可變類平均距離法 由于類平均法公式中沒(méi)有反映 pG 與 qG 之間距離 pqD 的影響,所以給出可變類平均法。 ( 3)例子: P79續(xù)例 1。 ② 式中采用平方距離是為了上機(jī)的方便,也可以完全不采用平方距離。 設(shè) pG 與 qG 合并成新類 rG ,它們分別含有 pn 、 qn 和 ()r r p qn n n n?? 個(gè)樣本點(diǎn),它們的重心分別為: px 、qx 和 rx 。 ( 2)基本步驟 基本步驟完全等同于最短距離法。只是距離是按照最遠(yuǎn)樣本點(diǎn)計(jì)算,但聚類仍然按照距離最小的并為一類。如此下去,直到所有的元素并成一類為止 ① 。初始時(shí),每個(gè)樣本點(diǎn)自成一類,易見(jiàn) pq pqDd? 。 一、 類與類之間的距離 我們先就樣品聚類的情形予以討論,并為簡(jiǎn)單起見(jiàn),以 i,j等分別表示樣品 ,ijxx,以 ijd 簡(jiǎn)記樣品 i與 j之間的距離 ? ?,ijd x x, 用 pG 和 qG 表示兩個(gè)類,它們所包含的樣品個(gè)數(shù)分別記為 pn 和 qn ,類 pG 與 qG 之間的距離用 ? ?,pqDG G表示。利用這種分類思想,譜系聚類法首先視各樣品(或變量)自成一類,然后把最相似的樣品(或變量)聚為 小類,再將已聚合的小類按其相似性再聚合,隨著相似性的減弱,最后將一切子類都聚合到一個(gè)大類,從而得到一個(gè)按相似性大小聚結(jié)起來(lái)的一個(gè)譜系關(guān)系。有關(guān)該方法的研究?jī)?nèi)容相當(dāng)豐富,而且許多統(tǒng)計(jì)軟件(如 SPSS、 STATISTICA、 SAS)中都有專門的程序。 A B C D 第 頁(yè) 5 NOTE:① ( , 1, 2, , )ijr i j p?其實(shí)就是 ? ?12, , , pX X X X ??的樣本相關(guān)矩陣中的各元素; ②ijr就是零均值化后向量的夾角余弦; ③如果將原始數(shù)據(jù)標(biāo)準(zhǔn)化,則 0ix? 且 0jx?,這時(shí)有 cosij ijr ??。 2.相關(guān)系數(shù)(相似系數(shù)) 從統(tǒng)計(jì)角度看,兩個(gè)隨機(jī)變量的相關(guān)系數(shù)是描述這兩個(gè)變量關(guān)聯(lián)性(線性關(guān)系)強(qiáng)弱的一個(gè)很有用的特征數(shù)字。 二、 變量間的“關(guān)聯(lián)性”度量 —— 相似系數(shù) 當(dāng)對(duì) p 個(gè)指標(biāo)(或變量)進(jìn)行聚類時(shí),用相似系數(shù)衡量變量間的關(guān)聯(lián)程度。實(shí)際應(yīng)用中,若 2k? 與 ? 未知,可用觀測(cè)數(shù)據(jù)對(duì)其估計(jì),一般用 2?k? 和樣本協(xié)方差陣 S 作為其估計(jì)。 ② 在聚類分析中,有時(shí)所用的距離并不滿足第三條,我們?cè)趶V義的角度上仍稱它為距離。 設(shè) ( , )ijdx x 為樣品 ix 與 jx 之間的距離,則一般要求它滿足下列三個(gè)條件 ② : 下 面介紹幾種聚類分析中的常用距離。 對(duì)樣品進(jìn)行分類的方法稱為 Q型聚類法,所用的統(tǒng)計(jì)量用“距離”這一術(shù)語(yǔ)描述;對(duì)變量進(jìn)行分類的方法,稱為 R型聚類法,所用的統(tǒng)計(jì)量用“相似系數(shù)”描述。 2 聚類統(tǒng)計(jì) 量 聚類分析所研究的內(nèi)容包括兩個(gè)方面 , 一是對(duì)樣品進(jìn)行分類,設(shè) n個(gè)樣品,每個(gè)樣品均用 p個(gè)指標(biāo)的觀測(cè)向量 ( 1,2, , )ix i n? 來(lái)表 征,要根據(jù) ix 間某種相似性度量,將這 n個(gè)樣品進(jìn)行分類。目前,聚類統(tǒng)計(jì)量種類繁多,聚類方法也五花八門,但由于聚類分析方法能廣泛地應(yīng)用于解決實(shí)際問(wèn)題,它和回歸分析,判別分析一起被稱為多元分析的三大實(shí)用方法。 二、 聚類分析方法 值得一提的是聚類分析和第 三 章的判別分析都是研究分類問(wèn)題,但二者有本質(zhì)的區(qū)別。 2.基本思想 哲學(xué)理念:物以類聚、人以群分 聚類分析的基本思想是,從一批樣品的多個(gè)指標(biāo)變量中,定義能度量樣品間或變量間 相似程度(或親疏關(guān)系)的統(tǒng)計(jì)量,在此基礎(chǔ)上求出各樣品(或變量)之間的相似程度度量值,按相似程度的大小,把樣品(或變量)逐一分類,關(guān)系密切的類聚集到一個(gè)小的分類單位,關(guān)系疏遠(yuǎn)的類聚集到一個(gè)大的分類單位,直到所有的樣品或變量都聚集完畢,把不同的類型一一劃分出來(lái),形成一個(gè)親疏關(guān)系譜系圖,用以更直觀地顯示分類對(duì)象(樣品或變量)的差異和聯(lián)系。有人稱按照觀測(cè)值對(duì)變量的分類為 R型聚類,而稱按照變量對(duì)觀測(cè)值的分類稱為 Q型聚類。 對(duì)于一個(gè)數(shù)據(jù),人們既可以按照觀測(cè)值對(duì)變量(或指標(biāo))進(jìn)行分類 (相當(dāng)于對(duì)數(shù)據(jù)中的列分類 ),也可以按照變量對(duì)觀測(cè)值(事件,樣品)來(lái)分類(相當(dāng)于對(duì)數(shù)據(jù)中的行分類)。但什么是分類的根據(jù)呢?比如,要想把中國(guó)的縣分成若干類,就有很多種分類法;可以按照自然條件來(lái)分,比如考慮降水、土地、日照、濕度等各方面;也可以考慮收入、教育水準(zhǔn)、醫(yī)療條件、基礎(chǔ)設(shè)施等指標(biāo);既可以用某一項(xiàng)來(lái)分類,也可以同時(shí)考慮多項(xiàng)指標(biāo)來(lái)分類。 1 概述 一、 什么是 聚類 分析 1.研究背景 在實(shí)際問(wèn)題中,經(jīng)常要遇到分類的問(wèn)題。Equation Chapter 1 Section 1 《 多 元 統(tǒng) 計(jì) 分 析 》 Multivariate Statistical Analysis 主講:統(tǒng)計(jì)學(xué) 院 統(tǒng)計(jì) 學(xué)院 應(yīng)用統(tǒng)計(jì)學(xué)教研室 School of Statistics 注意電子文檔使用范圍 第 頁(yè) 1 第 二 章 聚類分析 【教學(xué)目的】 1. 讓學(xué)生了解 聚類 分析 的背景、基本思想 ; 2. 掌握聚類分析的基本原理與方法 ; 3. 掌握聚類分析的操作步驟和基本過(guò)程 ; 4. 學(xué)會(huì)應(yīng)用聚類分析解決實(shí)際問(wèn)題 。例如,在考古學(xué)中,要將某些古生物化石進(jìn)行科學(xué)的分類;在生物學(xué)中,要根據(jù)各生物體的綜合特征進(jìn)行分類;在經(jīng)濟(jì)學(xué)中 ,為了研究不同地區(qū)城鎮(zhèn)居民的收入及消費(fèi)情況,往往需要?jiǎng)澐譃椴煌念愋腿パ芯?;在產(chǎn)品質(zhì)量管理中,也要根據(jù)各產(chǎn)品的某些重要指標(biāo)而將其分為一等品,二等品等等。 隨著人類社會(huì)的 發(fā)展與科學(xué)技術(shù)的進(jìn)步,對(duì)分類學(xué)的要求也越來(lái)越高。比如利用學(xué)生成績(jī)數(shù)據(jù)就可以對(duì)學(xué)生按照理科或文科成績(jī)(或者綜合考慮各科成績(jī))分類。這兩種聚類在數(shù)學(xué)上是對(duì)稱的,沒(méi)有什么不同。 一開(kāi)始將要?dú)w類的 n 個(gè)變量(或個(gè)體)各自看成一類,然后按事先規(guī)定好的方法計(jì)算各類之間的歸類指標(biāo)(如某種距離或相似系數(shù)),根據(jù)指 標(biāo)值大小衡量?jī)蓛芍g關(guān)系的密切程度,將關(guān)系最密切的兩類并第 頁(yè) 2 成一類,其余不變,即得 1n? 類;又按事先規(guī)定的方法重新計(jì)算各類之間的歸類指標(biāo)(仍為某種距離或相似系數(shù)),又將關(guān)系密切的兩類并成一類,其余不變,即得 2n? 類;如此進(jìn)行下去,每次歸類都減少一類,直到最后, n 個(gè)變量(或個(gè)體)都?xì)w成一類為止。聚類分析一般上尋求客觀分類的方法,事先對(duì)總體到底有幾種類型無(wú)所知曉,而判別分析則是在總體類型劃分已知,在各總體分布或來(lái)自各總體訓(xùn)練樣本的基礎(chǔ)上,對(duì)當(dāng)前的新樣品用統(tǒng)計(jì)的方法判定它們屬于哪個(gè)總體。 本章將重點(diǎn)介紹一些常見(jiàn)的分類統(tǒng)計(jì)量和目前使用
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1