freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

廈門(mén)大學(xué)應(yīng)用多元統(tǒng)計(jì)分析第05章_聚類(lèi)分析-資料下載頁(yè)

2025-05-09 02:48本頁(yè)面
  

【正文】 Dendrogram復(fù)選框和 Icicle欄中的 None單選按鈕,即只給出聚類(lèi)樹(shù)形圖,而不給出冰柱圖。單擊 Continue按鈕,返回主界面。 圖 Plots子對(duì)話(huà)框 ? 4. 點(diǎn)擊 Method按鈕,設(shè)置系統(tǒng)聚類(lèi)的方法選項(xiàng)。 Cluster Method下拉列表用于指定聚類(lèi)的方法,包括組間連接法、組內(nèi)連接法、最近距離法、最遠(yuǎn)距離法等; Measure欄用于選擇對(duì)距離和相似性的測(cè)度方法;剩下的 Transform Values和 Transform Measures欄用于選擇對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的方法。這里我們?nèi)匀痪赜孟到y(tǒng)默認(rèn)選項(xiàng)。單擊 Continue按鈕,返回主界面。 圖 Method子對(duì)話(huà)框 ? 5. 點(diǎn)擊 Save按鈕,指定保存在數(shù)據(jù)文件中的用于表明聚類(lèi)結(jié)果的新變量。 None表示不保存任何新變量; Single solution表示生成一個(gè)分類(lèi)變量,在其后的矩形框中輸入要分成的類(lèi)數(shù); Range of solutions表示生成多個(gè)分類(lèi)變量。這里我們選擇 Range of solutions,并在后面的兩個(gè)矩形框中分別輸入 2和 4,即生成三個(gè)新的分類(lèi)變量,分別表明將樣品分為 2類(lèi)、3類(lèi)和 4類(lèi)時(shí)的聚類(lèi)結(jié)果。點(diǎn)擊 Continue,返回主界面。 圖 Save子對(duì)話(huà)框 6. 點(diǎn)擊 OK按鈕,運(yùn)行系統(tǒng)聚類(lèi)過(guò)程。 ? (二)主要運(yùn)行結(jié)果解釋 ? 1. 在結(jié)果輸出窗口中我們可以看到聚類(lèi)樹(shù)形圖( Dendrogram)。 ? 從樹(shù)形圖 ,若將 20個(gè)樣品分為兩類(lèi), 則樣品 1 和樣品 1為一類(lèi),其余的為另一類(lèi);若將樣品分為三類(lèi),則樣品 4從第二類(lèi)中分離出來(lái),自成一類(lèi);依此類(lèi)推。 2 6 19 7 18 1 8 9 4 3 5 12 20 16 14 10 11 15 17 13 CA S E La b e l N u m 0 5 1 0 1 5 2 0 2 5 R e s c ale d D i s t an c e C l u st e r C om b i n e 圖 系統(tǒng)聚類(lèi)法樹(shù)形圖 ? 2. 由于我們已經(jīng)在 Save子對(duì)話(huà)框中設(shè)置了在數(shù)據(jù)文件中生成新的分類(lèi)變量,所以,在數(shù)據(jù)編輯窗口中,我們可以看到生成的三個(gè)表示分類(lèi)結(jié)果的新變量。變量名為 clu4_ clu3_1和 clu21的三個(gè)分類(lèi)變量分別表明了把樣品分成 4類(lèi)、 3類(lèi)和 2類(lèi)的分類(lèi)情況。 圖 生成三個(gè)新的分類(lèi)變量 二、在 SPSS中利用 K均值法進(jìn)行聚類(lèi)分析 ? 我國(guó)各地區(qū)2021年三次產(chǎn)業(yè)產(chǎn)值如表,試根據(jù)三次產(chǎn)業(yè)產(chǎn)值利用 K均值法對(duì)我國(guó) 31個(gè)省、自治區(qū)和直轄市進(jìn)行聚類(lèi)分析。 表 5. 17 我國(guó)各地區(qū)三次產(chǎn)業(yè)產(chǎn)值(單位:億元) 地區(qū) 第一產(chǎn)業(yè)1X 第二產(chǎn)業(yè)2X 第三產(chǎn)業(yè)3X 地區(qū) 第一產(chǎn)業(yè)1X 第二產(chǎn)業(yè)2X 第三產(chǎn)業(yè)3X 北京 95. 64 1311 . 86 2255 . 60 湖北 798 . 35 2580 . 58 2022 . 78 天津 89. 66 1245 . 29 1112 . 71 湖南 886 . 47 1794 . 21 1958 . 05 河北 1064 . 33 3657 . 19 2377 . 04 廣東 1093 . 52 7307 . 08 5225 . 27 山西 215 . 19 1389 . 33 852 . 07 廣西 652 . 28 1007 . 96 1074 . 89 內(nèi)蒙古 420 . 10 973 . 94 756 . 38 海南 248 . 33 151 . 16 271 . 44 遼寧 615 . 80 2898 . 89 2487 . 85 重慶 336 . 36 977 . 30 936 . 90 吉林 486 . 90 1143 . 39 892 . 33 四川 1128 . 61 2266 . 06 2061 . 65 黑龍江 500 . 80 2532 . 45 1396 . 75 貴州 298 . 37 579 . 31 478 . 43 上海 90. 64 31 30 . 72 3029 . 45 云南 502 . 84 1069 . 29 893 . 16 江蘇 1106 . 35 6787 . 11 4567 . 37 西藏 40. 62 47. 99 95. 89 浙江 728 . 00 4941 . 00 3726 . 00 陜西 320 . 03 1133 . 56 944 . 99 安徽 732 . 81 1780 . 60 1458 . 97 甘肅 236 . 61 607 . 62 460 . 37 福建 692 . 94 2492 . 73 2046 . 50 青海 46. 15 184 . 26 159 . 80 江西 560 . 00 1227 . 38 1043 . 08 寧夏 55. 50 192 . 00 137 . 84 山東 1480 . 67 6656 . 85 4298 . 41 新疆 412 . 90 796 . 84 667 . 87 河南 1239 . 70 3551 . 94 2256 . 95 ? 當(dāng)要聚成的類(lèi)數(shù)確定時(shí),使用 K均值法可以很快將觀測(cè)量分到各類(lèi)中去,而且該方法處理速度快,占用內(nèi)存少,尤其適用于大樣本的聚類(lèi)分析。 ? (一)操作步驟 ? 1. 在 SPSS窗口中選擇 Analyze→Classify→K Means Cluster,調(diào)出 K均值聚類(lèi)分析主界面,并將變量 — 移入 Variables框中,將標(biāo)志變量 Region移入 Label Case by框中。在 Method框中選擇 Iterate classify,即使用 Kmeans算法不斷計(jì)算新的類(lèi)中心,并替換舊的類(lèi)中心(若選擇 Classify only,則根據(jù)初始類(lèi)中心進(jìn)行聚類(lèi),在聚類(lèi)過(guò)程中不改變類(lèi)中心)。在Number of Cluster后面的矩形框中輸入想要把樣品聚成的類(lèi)數(shù),這里我們輸入 3,即將 31個(gè)地區(qū)分為 3類(lèi)。至于 Centers按鈕,則用于設(shè)置迭代的初始類(lèi)中心。如果不手工設(shè)置,則系統(tǒng)會(huì)自動(dòng)設(shè)置初始類(lèi)中心,這里我們不作設(shè)置。 圖 K均值聚類(lèi)分析主界面 2. 點(diǎn)擊 Iterate按鈕,對(duì)迭代參數(shù)進(jìn)行設(shè)置。 Maximum Iterations參數(shù)框用于設(shè)定 Kmeans算法迭代的最大次數(shù),Convergence Criterion參數(shù)框用于設(shè)定算法的收斂判據(jù),其值應(yīng)該介于 0和 1之間。例如判據(jù)設(shè)置為 ,則當(dāng)一次完整的迭代不能使任何一個(gè)類(lèi)中心距離的變動(dòng)與原始類(lèi)中心距離的比小于 2時(shí),迭代停止。設(shè)置完這兩個(gè)參數(shù)之后,只要在迭代的過(guò)程中先滿(mǎn)足了其中的參數(shù),則迭代過(guò)程就停止。這里我們選擇系統(tǒng)默認(rèn)的標(biāo)準(zhǔn)。單擊 Continue,返回主界面。 圖 Iterate子對(duì)話(huà)框 3. 點(diǎn)擊 Save按鈕,設(shè)置保存在數(shù)據(jù)文件中的表明聚類(lèi)結(jié)果的新變量。其中 Cluster membership選項(xiàng)用于建立一個(gè)代表聚類(lèi)結(jié)果的變量,默認(rèn)變量名為 qcl_1; Distance from cluster center選項(xiàng)建立一個(gè)新變量,代表各觀測(cè)量與其所屬類(lèi)中心的歐氏距離。我們將兩個(gè)復(fù)選框都選中,單擊 Continue按鈕返回。 圖 Save子對(duì)話(huà)框 4. 點(diǎn)擊 Options按鈕,指定要計(jì)算的統(tǒng)計(jì)量。選中 Initial cluster centers和 Cluster information for each case復(fù)選框。這樣,在輸出窗口中將給出聚類(lèi)的初始類(lèi)中心和每個(gè)觀測(cè)量的分類(lèi)信息,包括分配到哪一類(lèi)和該觀測(cè)量距所屬類(lèi)中心的距離。單擊 Continue返回。 5. 點(diǎn)擊 OK按鈕,運(yùn)行 K均值聚類(lèi)分析程序。 圖 Options子對(duì)話(huà)框 (二)主要運(yùn)行結(jié)果解釋 1. Initial Cluster Centers(給出初始類(lèi)中心) 2. Iteration History(給出每次迭代結(jié)束后類(lèi)中心的變動(dòng)) 從表 。由于我們?cè)?Iterate子對(duì)話(huà)框中使用系統(tǒng)默認(rèn)的選項(xiàng)(最大迭代次數(shù)為 10和收斂判據(jù)為 0),所以在第三次迭代后,類(lèi)中心的變化為 0,從而迭代停止。 3. Cluster Membership(給出各觀測(cè)量所屬的類(lèi)及與所屬類(lèi)中心的距離) 表 Cluster列給出了觀測(cè)量所屬的類(lèi)別, Distance列給出了觀測(cè)量與所屬類(lèi)中心的距離。(出于排版要求,此表經(jīng)過(guò)加工,因此與原始輸出表形態(tài)有一定差異)。 I t e r a t i o n H i s t o r y6 7 0 . 0 5 9 9 8 1 . 6 9 1 1 0 6 5 . 6 5 05 6 4 . 3 7 7 . 0 0 0 2 4 0 . 2 2 7. 0 0 0 . 0 0 0 . 0 0 0I t e r a t i o n1231 2 3C h a n g e i n C l u s t e r C e n t e r s表 迭代過(guò)程中類(lèi)中心的變化量 C l u s t e r M e m b e r s h i p R e gi on C l u s t e r D i s t an c e R e gi on C l u s t e r D i s t an c e 北京 3 138 5. 72 湖北 3 136 . 04 天津 2 665 . 34 湖南 3 788 . 13 河北 3 119 3. 46 廣東 1 117 3. 08 山西 2 626 . 99 廣西 2 570 . 07 內(nèi)蒙古 2 226 . 65 海南 2 761 . 80 遼寧 3 517 . 50 重慶 2 321 . 28 吉林 2 448 . 40 四川 3 504 . 15 黑龍江 3 756 . 68 貴州 2 291 . 36 上海 3 124 5. 95 云南 2 401 . 64 江蘇 1 381 . 29 西藏 2 981 . 69 浙江 1 169 3. 13 陜西 2 433 . 74 安徽 3 101 2. 80 甘肅 2 292 . 90 福建 3 94. 87 青海 2 840 . 18 江西 2 621 . 92 寧夏 2 845 . 43 山東 1 471 . 44 新疆 2 105 . 45 河南 3 114 3. 95 表 各觀測(cè)量所屬類(lèi)成員表 4. Final Cluster Centers(給出聚類(lèi)結(jié)果形成的類(lèi)中心的各變量值) F i n a l C l u s t e r C e n t e r s1 1 0 2 . 1 4 3 0 7 . 6 1 7 1 3 . 2 86 4 2 3 . 0 1 7 9 5 . 4 1 2 5 4 5 . 2 04 4 5 4 . 2 6 6 7 3 . 6 3 2 1 2 2 . 8 7X1X2X31 2 3C l u s t e r表 最終的類(lèi)中心表 ? 結(jié)合表 ,我們可以看出 31個(gè)地區(qū)被分成 3類(lèi)。第一類(lèi)包括:江蘇、浙江、山東和廣東 4個(gè)省。這一類(lèi)的類(lèi)中心三個(gè)產(chǎn)業(yè)的產(chǎn)值分別為 、 ,屬于三個(gè)產(chǎn)業(yè)都比較發(fā)達(dá)的地區(qū)。第二類(lèi)包括:天津、山西、內(nèi)蒙古、吉林、江西、廣西、海南、重慶、貴州、云南、西藏、陜西、甘肅、青海、寧夏和新疆 16個(gè)地區(qū)。這一類(lèi)的類(lèi)中心三個(gè)產(chǎn)業(yè)的產(chǎn)值分別為 、 ,屬于欠發(fā)達(dá)地區(qū)。剩下的 11個(gè)地區(qū)為第三類(lèi)。這一類(lèi)的類(lèi)中心三個(gè)產(chǎn)業(yè)的產(chǎn)值分別為 億元、 ,屬于中等發(fā)達(dá)地區(qū)。 5. 由于我們已經(jīng)在 Save子對(duì)話(huà)框中設(shè)置了在數(shù)據(jù)文件中生成新的分類(lèi)變量,所以,在數(shù)據(jù)編輯窗口中,我們可以看到生成的兩個(gè)表示分類(lèi)結(jié)果的新變量。變量 qcl_1和變量 qcl_2分別代表分類(lèi)號(hào)和觀測(cè)量距所屬類(lèi)中心的距離。 本章結(jié)束
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1