freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

統(tǒng)計學(xué)第四版聚類分析20xx年(存儲版)

2025-10-10 12:28上一頁面

下一頁面
  

【正文】 e】 框中 選擇否對原始數(shù)據(jù)進行標準化處理 (本例選擇了 【 Z scores】 )。 這類消費者主要為退休人員 , 約占該類型人員的 2/3, 剩下的主要為國營企業(yè)員工 。 家庭月平均收入一般在 1800元左右 。 —— Thomas Kuhn 統(tǒng)計名言 第 13 章 聚類分析 聚類分析的基本原理 層次聚類 K均值聚類 13 4 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 學(xué)習(xí)目標 ? 聚類分析的基本思想和原理 ? 層次聚類和 K均值聚類的基本過程 ? 解釋聚類的結(jié)果 ? 層次聚類和 K均值聚類的差異及應(yīng)用條件 ? 聚類分析的注意事項 ? 用 SPSS進行聚類分析 13 5 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 怎樣把消費者分類? ? 南京雅興市場研究有限公司在 A城市的 14個城區(qū)抽取 3000個15歲以上具有獨立購買能力的消費者樣本 , 研究消費者的生活方式 。 這些人的平均受教育程度較低 , 中年人的比例較高 , 平均年齡在44歲左右 , 家庭月收入較低 , 平均在 1600元左右 , 國營企業(yè)員工以及離退休人員的比例較高 。 職業(yè)上的顯著特征是: 1/3為學(xué)生 , 三資企業(yè)員工的比例達 1/10。 在性別上 , 男性稍高于女性 13 8 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 在現(xiàn)實生活中 , 分類問題是十分常見的 ? 根據(jù)經(jīng)濟發(fā)展水平把各個國家分成發(fā)達國家 、 中等發(fā)達國家 、 發(fā)展中國家 ? 按照消費者的特征對消費者分類 , 按照產(chǎn)品特征對產(chǎn)品分類 ? 這些分類中 , 有的事先并不知道存在什么類別 , 完全按照反映對象特征的數(shù)據(jù)把對象進行分類 , 這在統(tǒng)計上稱為聚類分析;有的則是在事先有了某種分類標準之后 , 判定一個新的研究對象應(yīng)該歸屬到哪一類別 , 這在統(tǒng)計上則稱為判別分析 (discriminant analysis) ? 本章主要介紹聚類分析方法 聚類分析 (cluster analysis) 聚類分析的基本原理 什么是聚類分析 ? 相似性的度量 第 13 章 聚類分析 什么是聚類分析? 聚類分析的思想和原理 13 11 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 把 “ 對象 ” 分成不同的類別 ? 這些類不是事先給定的 , 而是直接根據(jù)數(shù)據(jù)的特征確定的 ? 把相似的東西放在一起 , 從而使得類別內(nèi)部的 “ 差異 ” 盡可能小 , 而類別之間的 “ 差異” 盡可能大 ? 聚類分析就是按照對象之間的 “ 相似 ” 程度把對象進行分類 什么是聚類分析? (cluster analysis) 13 12 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 聚類分析的 “ 對象 ” 可以是所觀察的多個樣本 ,也可以是針對每個樣本測得的多個變量 ? 按照變量對所觀察的樣本進行分類稱為 Q型聚類 ? 按照多項經(jīng)濟指標 (變量 )對不同的地區(qū) (樣本 )進行分類 ? 按照樣本對多個變量進行分類 , 則稱為 R型聚類 ? 按照不同地區(qū)的樣本數(shù)據(jù)對多個經(jīng)濟變量進行分類 ? 兩種聚類沒有什么本質(zhì)區(qū)別 , 實際中人們更感興趣的通常是根據(jù)變量對樣本進行分類 (Q型聚類 ) 什么是聚類分析? (兩種分類方式 ) 13 13 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 按對象的 “ 相似 ” 程度分類 ? 根據(jù)樣本的觀測數(shù)據(jù)測度變量之間的相似性程度可以使用 夾角余弦 、 Pearson相關(guān)系數(shù)等工具 , 也稱為 相似系數(shù) ? 變量間的相似系數(shù)越大 , 說明它們越相近 ? 根據(jù)變量來測度樣本之間的相似程度則使用“ 距離 ” ? 把離得比較近的歸為一類 , 而離得比較遠的放在不同的類 什么是聚類分析? (按什么分類 ) 相似性的度量 聚類分析的思想和原理 13 15 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 聚類分析中是用 “ 距離 ” 或 “ 相似系數(shù) ” 來度量對象之間的相似性 ? 在第 13章例 , 31個地區(qū)的人均 GDP數(shù)據(jù)就是直線上的 31個點 , 每一個點對應(yīng)一個地區(qū) ? 如果按照人均 GDP對它們進行分類 , 就可以把在直線上離得比較近的那些點歸為一類 。 距離按從小到大排列 , 越早合并的類距離越近 。將需要標準化的變量選入 【 Variable(s)】 ? 【 Save standardized values as variables】 ? 【 OK】 ) K— 均值聚類 13 51 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 K均值聚類的應(yīng)用 (實例分析 ) 分成 4類的初始聚類中心 ? 該表列出每一類別的初始聚類中心 , 本例的這些中心是由 SPSS自動生成的 , 它實際上就是數(shù)據(jù)集中的某一條記錄 。 分類的結(jié)果沒有對錯之分 , 只是分類標準不同而已 ? 使用聚類方法時 , 首先要明確分類的目的 , 再考慮選擇哪些變量 (或數(shù)據(jù) )參與分類 , 最后才需要考慮方法的選擇。 如果是對樣本分類 , 三種方法都可用;如果是對變量分類則應(yīng)選擇層次聚類法 (至少 SPSS的程序是這樣 ) 聚類分析的注意事項 13 62 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 ? 注意對分類結(jié)果的檢驗 ? 分類結(jié)果是否合理取決于它是否 “ 有用 ”, 但分類結(jié)果是否可靠和穩(wěn)定 , 則需要反復(fù)聚類和比較 ? 一般來說 , 在所分的類別中 , 各類所包含的對象 (樣本或變量 )的數(shù)量應(yīng)該大致相當。 從表中可以看出 , 分類后各變量在不同類別之間的差異都是顯著的 (P值均接近 0) 13 55 統(tǒng)計學(xué)STATISTICS (第四版 ) 2020105 K均值聚類的應(yīng)用 (實例分析 ) 分成 4類時每一類的地區(qū)數(shù)量 ? 由該表可以看出 , 第一類包括 2個地區(qū) , 第二類包括 11個地區(qū) ,第三類包括 4個地區(qū) , 第四類包括 14個地區(qū) 13 56 統(tǒng)計學(xué)STA
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1