freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

統(tǒng)計(jì)學(xué)第四版聚類(lèi)分析20xx年-資料下載頁(yè)

2025-08-21 12:28本頁(yè)面

【導(dǎo)讀】聚類(lèi)分析的基本思想和原理。層次聚類(lèi)和K-均值聚類(lèi)的基本過(guò)程。聚類(lèi)分析的注意事項(xiàng)。南京雅興市場(chǎng)研究有限公司在A城市的14個(gè)城區(qū)抽取3000個(gè)。調(diào)查中采用一系列關(guān)于對(duì)社會(huì)活動(dòng)、價(jià)值觀念等內(nèi)容。的陳述,請(qǐng)消費(fèi)者根據(jù)自己的情況做出評(píng)價(jià)。對(duì)調(diào)查結(jié)果先通過(guò)因子分析將一系列的測(cè)試語(yǔ)句進(jìn)行綜合,根。根據(jù)每一類(lèi)消費(fèi)者的因子的特征,最終將消費(fèi)者的生活方式分。時(shí)尚型:這類(lèi)消費(fèi)者約占樣本量的約21%,主要特征為:年齡相對(duì)較。散程度最高的,表明喜愛(ài)時(shí)尚并不是高收入者的專(zhuān)利。離退休人員的比例較高。女性的比例高于男性。教育程度處于社會(huì)平均水平,主要為中。已婚比例是各類(lèi)消費(fèi)者。中最高的,這似乎表明有穩(wěn)定的家庭也是成為領(lǐng)袖的一個(gè)條件。平均年齡在50歲以上,生活沒(méi)有規(guī)律,而其他指標(biāo)則均處于中間狀態(tài)。育程度一般,家庭月平均收入在1900元左右。把相似的東西放在一起,從而使得類(lèi)別內(nèi)部。根據(jù)變量來(lái)測(cè)度樣本之間的相似程度則使用。聚類(lèi)分析中是用“距離”或“相似系數(shù)”來(lái)度量對(duì)象

  

【正文】 】 ,點(diǎn)擊 【 Continue】 回到主對(duì)話框;點(diǎn)擊 【 Options】 并選擇 【 Initial cluster centers】 和 【 ANOVA table】(本項(xiàng)可根據(jù)需要選擇 )。點(diǎn)擊 【 OK】 (注: 若聚類(lèi)前需要對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化,操作為: 【 Analyze】 ?【 Descriptive Statistics】 ? 【 Descriptives】 ?主對(duì)話框。將需要標(biāo)準(zhǔn)化的變量選入 【 Variable(s)】 ? 【 Save standardized values as variables】 ? 【 OK】 ) K— 均值聚類(lèi) 13 51 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 K均值聚類(lèi)的應(yīng)用 (實(shí)例分析 ) 分成 4類(lèi)的初始聚類(lèi)中心 ? 該表列出每一類(lèi)別的初始聚類(lèi)中心 , 本例的這些中心是由 SPSS自動(dòng)生成的 , 它實(shí)際上就是數(shù)據(jù)集中的某一條記錄 。 聚類(lèi)中心的選擇原則是中心點(diǎn)距離其他點(diǎn)盡可能遠(yuǎn) 。 例如 , 第一類(lèi)的聚類(lèi)中心是 , 這實(shí)際上就是上海的人均 GDP標(biāo)準(zhǔn)化后的值 。 第二類(lèi)聚類(lèi)中心是 的標(biāo)準(zhǔn)化人均 GDP, 等等 13 52 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 K均值聚類(lèi)的應(yīng)用 (實(shí)例分析 ) 分成 4類(lèi)的迭代過(guò)程 ? 該表 從表中可以看出每次迭代過(guò)程中類(lèi)別中心的變化 , 隨著迭代次數(shù)的增加 , 類(lèi)別中心點(diǎn)的變化越來(lái)越小 。 本例只 4次就已經(jīng)收斂了 13 53 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 K均值聚類(lèi)的應(yīng)用 (實(shí)例分析 ) 分成 4類(lèi)的最終聚類(lèi)中心 ? 表中的數(shù)據(jù)表示各個(gè)類(lèi)別在各變量上的平均值 。 如 , 第一類(lèi)的 表示被分到第一類(lèi)的地區(qū) (北京和上海 )標(biāo)準(zhǔn)化后的人均 GDP平均值 13 54 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 K均值聚類(lèi)的應(yīng)用 (實(shí)例分析 ) 分類(lèi)后各個(gè)變量在類(lèi)別之間的方差分析表 ? 利用方差分析表可以判斷所分的類(lèi)別是否合理 。 從表中可以看出 , 分類(lèi)后各變量在不同類(lèi)別之間的差異都是顯著的 (P值均接近 0) 13 55 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 K均值聚類(lèi)的應(yīng)用 (實(shí)例分析 ) 分成 4類(lèi)時(shí)每一類(lèi)的地區(qū)數(shù)量 ? 由該表可以看出 , 第一類(lèi)包括 2個(gè)地區(qū) , 第二類(lèi)包括 11個(gè)地區(qū) ,第三類(lèi)包括 4個(gè)地區(qū) , 第四類(lèi)包括 14個(gè)地區(qū) 13 56 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 K均值聚類(lèi)的應(yīng)用 (實(shí)例分析 ) 分成4類(lèi)時(shí)每個(gè)地區(qū)所屬的類(lèi)別 13 57 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 K均值聚類(lèi)的應(yīng)用 (分類(lèi)匯總 ) 類(lèi)別 地區(qū) 地區(qū)個(gè)數(shù) 第一類(lèi) 上海,北京 2 第二類(lèi) 天津,內(nèi)蒙古,吉林,海南,重慶,貴州,西藏,甘肅,青海,寧夏,新疆 11 第三類(lèi) 江蘇,浙江,山東,廣東 4 第四類(lèi) 河北,山西,遼寧,黑龍江,安徽,福建,江西,河南,湖北,湖南,廣西,四川,云南,陜西 14 使用聚類(lèi)方法的注意事項(xiàng) K均值 聚類(lèi) 13 59 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 除分層聚類(lèi)法和 K均值聚類(lèi)法外 , 1996年還提出一種新的聚類(lèi)方法 , 即兩步聚類(lèi)法 (TwoStep Cluster)(SPSS提供了該聚類(lèi)方法的程序 ) ? 無(wú)論那種分類(lèi)方法 , 最終要分成多少類(lèi)別 , 并不是完全由方法本身來(lái)決定 , 研究者應(yīng)結(jié)合具體問(wèn)題而定 ? 聚類(lèi)分析是一種探索性的數(shù)據(jù)分析方法 。 相同的數(shù)據(jù)采用不同的分類(lèi)方法 , 也會(huì)的得到不同的分類(lèi)結(jié)果 。 分類(lèi)的結(jié)果沒(méi)有對(duì)錯(cuò)之分 , 只是分類(lèi)標(biāo)準(zhǔn)不同而已 ? 使用聚類(lèi)方法時(shí) , 首先要明確分類(lèi)的目的 , 再考慮選擇哪些變量 (或數(shù)據(jù) )參與分類(lèi) , 最后才需要考慮方法的選擇。 至于分類(lèi)結(jié)果是否合理 , 該如何解釋 , 更多取決于研究者對(duì)所研究問(wèn)題的了解程度 、 相關(guān)的背景知識(shí)和經(jīng)驗(yàn) 聚類(lèi)分析的注意事項(xiàng) 13 60 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 從數(shù)據(jù)要求上看 ? 參與分類(lèi)的變量首先應(yīng)符合要求 ? 各變量的取值不應(yīng)有數(shù)量級(jí)上的過(guò)大差異 , 否則會(huì)對(duì)分類(lèi)結(jié)果產(chǎn)生較大影響 。 這時(shí)需要對(duì)變量進(jìn)行標(biāo)準(zhǔn)化處理 (SPSS提供的層次聚類(lèi)法中在聚類(lèi)時(shí)可以選擇對(duì)變量做標(biāo)準(zhǔn)化處理 , 而 K均值聚類(lèi)法則需要單獨(dú)做標(biāo)準(zhǔn)化處理 , 爾后再進(jìn)行聚類(lèi) ) ? 各變量間不應(yīng)有較強(qiáng)的相關(guān)關(guān)系 。 若兩個(gè)強(qiáng)相關(guān)的變量同時(shí)參與聚類(lèi)分析 , 在測(cè)度距離時(shí) , 就加大了它們的貢獻(xiàn) , 而其他變量則相對(duì)被削弱 聚類(lèi)分析的注意事項(xiàng) 13 61 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 從聚類(lèi)方法的選擇上 ? 首先看數(shù)據(jù)的類(lèi)型 , 如果參與分類(lèi)的變量是連續(xù)變量 , 層次聚類(lèi)法 、 K均值聚類(lèi)法 、 以及兩步聚類(lèi)法都是適用的 。 如果變量中包括離散變量 (計(jì)數(shù)變量 ), 則需要將先對(duì)離散變量進(jìn)行連續(xù)化處理 , 否則應(yīng)該使用兩步聚類(lèi)法 。 當(dāng)數(shù)據(jù)量較少時(shí) (比如小于100), 三種方法都可以選用 , 當(dāng)數(shù)據(jù)量較多時(shí) (比如大于 1000), 則應(yīng)該考慮選用 K均值聚類(lèi)法或兩步聚類(lèi)法 ? 要看分類(lèi)的對(duì)象 。 如果是對(duì)樣本分類(lèi) , 三種方法都可用;如果是對(duì)變量分類(lèi)則應(yīng)選擇層次聚類(lèi)法 (至少 SPSS的程序是這樣 ) 聚類(lèi)分析的注意事項(xiàng) 13 62 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 注意對(duì)分類(lèi)結(jié)果的檢驗(yàn) ? 分類(lèi)結(jié)果是否合理取決于它是否 “ 有用 ”, 但分類(lèi)結(jié)果是否可靠和穩(wěn)定 , 則需要反復(fù)聚類(lèi)和比較 ? 一般來(lái)說(shuō) , 在所分的類(lèi)別中 , 各類(lèi)所包含的對(duì)象 (樣本或變量 )的數(shù)量應(yīng)該大致相當(dāng)。 至少這從表面上看更漂亮一些 聚類(lèi)分析的注意事項(xiàng) 13 63 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 本章小節(jié) ? 聚類(lèi)分析的基本思想和原理 ? 層次聚類(lèi)和 K均值聚類(lèi)的基本過(guò)程 ? 解釋聚類(lèi)的結(jié)果 ? 層次聚類(lèi)和 K均值聚類(lèi)的差異及應(yīng)用條件 ? 聚類(lèi)分析的注意事項(xiàng) ? 用 SPSS進(jìn)行聚類(lèi)分析 結(jié) 束
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1