正文內(nèi)容

統(tǒng)計學(xué)第四版聚類分析20xx年(存儲版)

2025-10-10 12:28上一頁面

下一頁面

　　

【正文】 e】框中選擇否對原始數(shù)據(jù)進行標準化處理 (本例選擇了【 Z scores】 )。這類消費者主要為退休人員，約占該類型人員的 2/3，剩下的主要為國營企業(yè)員工。家庭月平均收入一般在 1800元左右。 —— Thomas Kuhn 統(tǒng)計名言第 13 章聚類分析聚類分析的基本原理層次聚類 K均值聚類 13 4 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 學(xué)習(xí)目標 ? 聚類分析的基本思想和原理 ? 層次聚類和 K均值聚類的基本過程 ? 解釋聚類的結(jié)果 ? 層次聚類和 K均值聚類的差異及應(yīng)用條件 ? 聚類分析的注意事項 ? 用 SPSS進行聚類分析 13 5 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 怎樣把消費者分類？ ? 南京雅興市場研究有限公司在 A城市的 14個城區(qū)抽取 3000個15歲以上具有獨立購買能力的消費者樣本，研究消費者的生活方式。這些人的平均受教育程度較低，中年人的比例較高，平均年齡在44歲左右，家庭月收入較低，平均在 1600元左右，國營企業(yè)員工以及離退休人員的比例較高。職業(yè)上的顯著特征是： 1/3為學(xué)生，三資企業(yè)員工的比例達 1/10。在性別上，男性稍高于女性 13 8 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 在現(xiàn)實生活中，分類問題是十分常見的 ? 根據(jù)經(jīng)濟發(fā)展水平把各個國家分成發(fā)達國家、中等發(fā)達國家、發(fā)展中國家 ? 按照消費者的特征對消費者分類，按照產(chǎn)品特征對產(chǎn)品分類 ? 這些分類中，有的事先并不知道存在什么類別，完全按照反映對象特征的數(shù)據(jù)把對象進行分類，這在統(tǒng)計上稱為聚類分析；有的則是在事先有了某種分類標準之后，判定一個新的研究對象應(yīng)該歸屬到哪一類別，這在統(tǒng)計上則稱為判別分析 (discriminant analysis) ? 本章主要介紹聚類分析方法聚類分析 (cluster analysis) 聚類分析的基本原理什么是聚類分析 ? 相似性的度量第 13 章聚類分析什么是聚類分析？聚類分析的思想和原理 13 11 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 把 “ 對象 ” 分成不同的類別 ? 這些類不是事先給定的，而是直接根據(jù)數(shù)據(jù)的特征確定的 ? 把相似的東西放在一起，從而使得類別內(nèi)部的 “ 差異 ” 盡可能小，而類別之間的 “ 差異” 盡可能大 ? 聚類分析就是按照對象之間的 “ 相似 ” 程度把對象進行分類什么是聚類分析？ (cluster analysis) 13 12 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 聚類分析的 “ 對象 ” 可以是所觀察的多個樣本，也可以是針對每個樣本測得的多個變量 ? 按照變量對所觀察的樣本進行分類稱為 Q型聚類 ? 按照多項經(jīng)濟指標 (變量 )對不同的地區(qū) (樣本 )進行分類 ? 按照樣本對多個變量進行分類，則稱為 R型聚類 ? 按照不同地區(qū)的樣本數(shù)據(jù)對多個經(jīng)濟變量進行分類 ? 兩種聚類沒有什么本質(zhì)區(qū)別，實際中人們更感興趣的通常是根據(jù)變量對樣本進行分類 (Q型聚類 ) 什么是聚類分析？ (兩種分類方式 ) 13 13 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 按對象的 “ 相似 ” 程度分類 ? 根據(jù)樣本的觀測數(shù)據(jù)測度變量之間的相似性程度可以使用夾角余弦、 Pearson相關(guān)系數(shù)等工具，也稱為相似系數(shù) ? 變量間的相似系數(shù)越大，說明它們越相近 ? 根據(jù)變量來測度樣本之間的相似程度則使用“ 距離 ” ? 把離得比較近的歸為一類，而離得比較遠的放在不同的類什么是聚類分析？ (按什么分類 ) 相似性的度量聚類分析的思想和原理 13 15 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 聚類分析中是用 “ 距離 ” 或 “ 相似系數(shù) ” 來度量對象之間的相似性 ? 在第 13章例， 31個地區(qū)的人均 GDP數(shù)據(jù)就是直線上的 31個點，每一個點對應(yīng)一個地區(qū) ? 如果按照人均 GDP對它們進行分類，就可以把在直線上離得比較近的那些點歸為一類。距離按從小到大排列，越早合并的類距離越近。將需要標準化的變量選入【 Variable(s)】 ? 【 Save standardized values as variables】 ? 【 OK】 ) K— 均值聚類 13 51 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 K均值聚類的應(yīng)用 (實例分析 ) 分成 4類的初始聚類中心 ? 該表列出每一類別的初始聚類中心，本例的這些中心是由 SPSS自動生成的，它實際上就是數(shù)據(jù)集中的某一條記錄。分類的結(jié)果沒有對錯之分，只是分類標準不同而已 ? 使用聚類方法時，首先要明確分類的目的，再考慮選擇哪些變量 (或數(shù)據(jù) )參與分類，最后才需要考慮方法的選擇。如果是對樣本分類，三種方法都可用；如果是對變量分類則應(yīng)選擇層次聚類法 (至少 SPSS的程序是這樣 ) 聚類分析的注意事項 13 62 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 注意對分類結(jié)果的檢驗 ? 分類結(jié)果是否合理取決于它是否 “ 有用 ”，但分類結(jié)果是否可靠和穩(wěn)定，則需要反復(fù)聚類和比較 ? 一般來說，在所分的類別中，各類所包含的對象 (樣本或變量 )的數(shù)量應(yīng)該大致相當。從表中可以看出，分類后各變量在不同類別之間的差異都是顯著的 (P值均接近 0) 13 55 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 K均值聚類的應(yīng)用 (實例分析 ) 分成 4類時每一類的地區(qū)數(shù)量 ? 由該表可以看出，第一類包括 2個地區(qū) ，第二類包括 11個地區(qū) ，第三類包括 4個地區(qū) ，第四類包括 14個地區(qū) 13 56 統(tǒng)計學(xué)STA

點擊復(fù)制文檔內(nèi)容

試題試卷相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

統(tǒng)計學(xué)第四版聚類分析20xx年(存儲版)

人大高鴻業(yè)第四版宏觀-資料下載頁

pfmea(通用)第四版-資料下載頁

ppap第四版簡介-資料下載頁

msa第四版講議-資料下載頁

[精選](ppap)第四版-資料下載頁

計學(xué)基礎(chǔ)習(xí)題及答案第四版-資料下載頁

財務(wù)分析第四版第9章營運能力分析-資料下載頁

[精選]市場營銷學(xué)(第四版)-資料下載頁

[精選]現(xiàn)代推銷學(xué)第四版2-資料下載頁

[精選]現(xiàn)代推銷學(xué)第四版3-資料下載頁

傳熱學(xué)第四版ppt課件-資料下載頁

市場營銷學(xué)第四版答案-資料下載頁

保險學(xué)第四版習(xí)題庫答案-資料下載頁

20xx-20xx-1統(tǒng)計學(xué)第四章-資料下載頁

msa測量系統(tǒng)分析(第四版)-資料下載頁

統(tǒng)計學(xué)第四版聚類分析20xx年-文庫吧資料

統(tǒng)計學(xué)第四版聚類分析20xx年-展示頁

統(tǒng)計學(xué)第四版聚類分析20xx年-在線瀏覽

統(tǒng)計學(xué)第四版聚類分析20xx年-閱讀頁

統(tǒng)計學(xué)第四版聚類分析20xx年(文件)