freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多元統(tǒng)計(jì)分析課件(聚類分析)-展示頁(yè)

2025-05-27 01:36本頁(yè)面
  

【正文】 式 例 1 設(shè)抽取五個(gè)樣品 , 每個(gè)樣品只側(cè)一個(gè)指標(biāo) , 他們是 1, 2, , 7, 9, 試用最短距離法對(duì)五個(gè)樣品進(jìn)行分類 。 相似系數(shù)常用的有:夾角余弦與相關(guān)系數(shù) 對(duì)指標(biāo)(變量)分類( R型) 相似系數(shù)的定義 夾角余弦( Cosine) 相似矩陣 變量間相似矩陣 相關(guān)系數(shù) ? ??? ???????n njjiinjjiiijxxxxxxxx1 1221])(][)([))((? ???????相似矩陣 第三節(jié) 八種系統(tǒng)聚類方法 ( hierarchical clustering method) ?將 n個(gè)樣品各作為一類 系統(tǒng)聚類法是諸聚類分析方法中使用最多的一種,按下列步驟進(jìn)行: ?計(jì)算 n個(gè)樣品兩兩之間的距離,構(gòu)成距離矩陣 ?合并距離最近的兩類為一新類 ?計(jì)算新類與當(dāng)前各類的距離。性別中的男與女,職業(yè)的分類。 變量的類型 變量按測(cè)量尺度的不同可以分為以下三類: 間隔尺度變量(數(shù)值型變量) 用連續(xù)的數(shù)量來(lái)度量,如長(zhǎng)度、重量、產(chǎn)值、成本 有序尺度變量(有序變量)如一、二、三等品 不能用明確的數(shù)量度量,用等級(jí)表示,有次序關(guān)系。 聚類分析內(nèi)容 系統(tǒng)聚類 動(dòng)態(tài)聚類 模糊聚類 圖論聚類 第二節(jié)距離和相似系數(shù) 描述親疏程度有兩個(gè)途徑: 把每個(gè)樣品看成 p維(變量的個(gè)數(shù)為 p個(gè))空間的一個(gè)點(diǎn),在 p維坐標(biāo)中, 定義點(diǎn)與點(diǎn)之間的 距離 。 應(yīng)聘者得分如下 應(yīng)聘者 1 2 3 4 5 6 7 8 9 10 X 28 18 11 21 26 20 16 14 24 22 Y 29 23 22 23 29 23 22 23 29 27 Z 28 18 16 22 26 22 22 24 24 24 例如 ,對(duì)上市公司的經(jīng)營(yíng)業(yè)績(jī)進(jìn)行分類; 例如,根據(jù)經(jīng)濟(jì)信息和市場(chǎng)行情,客觀地對(duì)不同商品、不同用戶及時(shí)地進(jìn)行分類。 3項(xiàng)指標(biāo) X, Y和 Z分別表示數(shù)學(xué)推理能力,空間想象能力和語(yǔ)言理解能力。與多元分析的其他方法相比,該方法理論上還不完善,但由于它能解決許多實(shí)際問(wèn)題,很受人們的重視,應(yīng)用方面取得了很大成功。 Cluster Analysis 第五章聚類分析 第一節(jié) 什么是聚類分析 聚類分析也是一種分類技術(shù)。是研究“物以類聚”的一種方法。 舉 例 對(duì) 10位應(yīng)聘者做智能檢驗(yàn)。其得分如下,選擇合適的統(tǒng)計(jì)方法對(duì)應(yīng)聘者進(jìn)行分類。 例如 ,當(dāng)我們對(duì)企業(yè)的經(jīng)濟(jì)效益進(jìn)行評(píng)價(jià)時(shí),建立了一個(gè)由多個(gè)指標(biāo)組成的指標(biāo)體系,由于信息的重疊,一些指標(biāo)之間存在很強(qiáng)的相關(guān)性,所以需要將相似的指標(biāo)聚為一類,從而達(dá)到簡(jiǎn)化指標(biāo)體系的目的。 用某種 相似系數(shù) 來(lái)描述樣品之間的親 疏程度。 名義尺度變量 用一些類來(lái)表示。 聚類的種類 根據(jù)分類的對(duì)象可將聚類分析分為: ( 1) Q型(即樣品的聚類 clustering for individuals) ( 2) R型(即變量或指標(biāo)的聚類clustering for variables) 對(duì)樣品分類( Q型) 常用的距離與相似系數(shù)的定義 樣本資料矩陣 樣本資料矩陣 ( 1)距離 假使每個(gè)樣品有 p個(gè)變量,則每個(gè)樣品都可以看成 p維空間中的一個(gè)點(diǎn), n個(gè)樣品就是 p維空間中的 n個(gè)點(diǎn),則第 i樣品與第 j樣品之間的距離記為 dij 定義距離的準(zhǔn)則 定義第 i個(gè)和第 j個(gè)樣品間的距離要求滿足如下四個(gè)條件 ( 距離可以自己定義,只要滿足距離的條件): 距離矩陣 樣品間距離矩陣 明氏( Minkowski )距離 qpqjiij xxd11)||( ???????絕對(duì)值距離 絕對(duì)值距離 實(shí)例 歐式( Euclidian )距離 )()()(12jijipjiijXXXXxxd?????? ?????二維空間歐式距離 歐氏 Euclidian距離 實(shí)例 切比雪夫距離 變量標(biāo)準(zhǔn)化 標(biāo)準(zhǔn)化 歐式距離 馬氏 Mahalanobis 距離 )()(2 ji1ji xxxx ???? ?Sd ijMahalanobis 距離實(shí)例 蘭氏 Canberra距離 距離矩陣 樣品間距離矩陣 例 題 學(xué)生的身高與體重資料 樣品 1 2 3 4 5 6 7 8 9 身高X1 160 159 160 157 169 162 165 154 160 體重X2 49 46 53 41 49 50 48 43 45 ( 2)相似系數(shù) 研究樣品間的關(guān)系 常用 距
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1