freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第9章-聚類和判別分析-展示頁

2024-08-30 23:50本頁面
  

【正文】 電子工業(yè)出版社 11 二階聚類 SPSS實例分析 【 例 91】 某機構(gòu)為了調(diào)查學生性別和所學專業(yè)與畢業(yè)后初始工資的情況,調(diào)查抽取了 60個學生的數(shù)據(jù),如表 (其中“性別” 1代表男性, 0代表女性;“學科” 1代表農(nóng)學, 2代表建筑, 3代表地質(zhì), 4代表商務, 5代表林學, 6代表教育, 7代表工程, 8代表藝術(shù)),試根據(jù)樣本指標進行聚類分析。這個過程稱為構(gòu)建一個分類的特征樹( CF)。 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 10 二階聚類 基本概念及統(tǒng)計原理 ( 3)分析步驟 第 1步 預聚類: 對每個觀測變量考察一遍,確定類中心。他在聚類過程中除了使用傳統(tǒng)的歐氏距離外,為了處理分類變量和連續(xù)變量,它用似然距離測度,它要求模型中的變量是獨立的,分類變量是多項式分布,連續(xù)變量是正態(tài)分布的。該過程主要有以下幾個特點: ? 分類變量和連續(xù)變量均可以參與二階聚類分析; ? 該過程可以自動確定分類數(shù); ? 可以高效率地分析大數(shù)據(jù)集; ? 用戶可以自己定制用于運算的內(nèi)存容量。 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 7 主要內(nèi)容 聚類與判別分析概述 二階聚類 K均值聚類 系統(tǒng) 聚類 判別分析 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 8 二階聚類 基本概念及統(tǒng)計原理 ( 1)基本概念 二階聚類( TwoStep Cluster)(也稱為兩步聚類)是一個探索性的分析工具(),為揭示自然的分類或分組而設計,是數(shù)據(jù)集內(nèi)部的而不是外觀上的分類。如果一個樣本包含不同數(shù)量的變量,則應先對變量進行標準化處理,而后再進行聚類。 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 6 聚類與判別分析概述 說明: ? 聚類分析的目的是找到樣本中數(shù)據(jù)的特點,因此應注意所選擇的變量是否已經(jīng)能夠反應所要聚類樣本的主要特點。 ( 公式見教材表 ) (2)順序變量的樣本間距離常用度量 常用的有 統(tǒng)計量 ( Chisquare measure) 和 統(tǒng)計量 (Phisquare measure) 。 (2) 判別分析 判別分析是判別樣本所屬類型的一種統(tǒng)計方法 。SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 1 第九章 聚類和判別分析 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 2 主要內(nèi)容 聚類與判別分析概述 二階聚類 K均值聚類 系統(tǒng) 聚類 判別分析 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 3 聚類與判別分析概述 基本概念 (1) 聚類分析 聚類分析的基本思想是找出一些能夠度量樣本或指標之間相似程度的統(tǒng)計量 , 以這些統(tǒng)計量為劃分類型的依據(jù) , 把一些相似程度較大的樣本 ( 或指標 ) 聚合為一類 , 把另外一些彼此之間相似程度較大的樣本又聚合為一類 。 根據(jù)分類對象的不同, 聚類分析可分為對 樣本的聚類 和對 變量的聚類 兩種 。 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 4 聚類與判別分析概述 樣本間親疏關(guān)系的度量 (1)連續(xù)變量的樣本間距離常用度量 主要方法有歐氏距離 ( Euclidean Distance) 、 歐氏平方距離 ( Squared Euclidean Distance) 、 切比雪夫距離 (Chebychev Distance) 、 明可斯基距離 ( Minkowski Distance) 、 用戶自定義距離 ( Customize Distance) 、 Pearson相關(guān)系數(shù) 、 夾角余弦 ( Cosine) 等 。 ( 公式見教材表 ) 2?2?SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 5 聚類與判別分析概述 基本概念 (3) 二者區(qū)別 不同之處在于 , 判別分析是在已知研究對象分為若干類型 ( 或組別 ) 并已取得各種類型的一批已知樣本的觀測量數(shù)據(jù)的基礎(chǔ)上 , 根據(jù)某些準則建立判別式 , 然后對未知類型的樣本進行差別分析 。 ? 聚類分析時應注意所選擇的變量是否存在數(shù)量級上的差別。 ? 變量間的關(guān)系度量模型與樣本間相類似,只不過一個用矩陣的行進行計算,另一個用矩陣的列進行計算。它是一種新型的分層聚類算法( Hierarchical Algorithms) ,目前主要應用到數(shù)據(jù)挖掘( Data Mining)和多元數(shù)據(jù)統(tǒng)計的交叉領(lǐng)域 ——模式分類中。 SPSS 19(中文版 )統(tǒng)計分析實用教程 電子工業(yè)出版社 9 二階聚類 基本概念及統(tǒng)計原理 ( 2) 統(tǒng)計原理 兩步法的功能非常強大,而原理又較為復雜。分類變量和連續(xù)變量均可以參與兩步聚類分析。根據(jù)相近者為同一類的原則,計算距離并把與類中心距離最小的觀測量分到相應的各類中去。 第 2步 正式聚類: 使用凝聚算法對特征樹的葉節(jié)點分組,凝聚算法可用來產(chǎn)生一個結(jié)果范圍。 ( 數(shù)據(jù)參見教材 P206) 第 1步 分析: 由于自變量中不僅有連續(xù)屬性,也有分類變量
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1