freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

spss回歸分析應用-資料下載頁

2025-08-10 17:25本頁面

【導讀】間存在著一定的聯(lián)系。要了解變量之間如何發(fā)。在上一章講述了相關(guān)分析有關(guān)內(nèi)容。含虛擬自變量的回歸分析以及邏輯回歸分析等。在應用中,兩種分析方法經(jīng)常。在回歸分析中,因變量y是隨機變量,通過一定的數(shù)學表達式來描述變量之間的關(guān)系,定變量的影響程度。通過分析大量的樣本數(shù)據(jù),確定變量。響較為顯著的變量和影響不顯著的變量。的取值,并給出這種預測或控制的精確度。其實,在現(xiàn)實社會生活中,任何一個事。限的,因此無法掌握因變量y總體的全部取值。要利用樣本的信息對其進行估計。立即就用于對某個實際問題的預測。其作各種統(tǒng)計檢驗。該指標是建立在對總離差平方和進行。分解的基礎(chǔ)之上。—回歸離差平方和2)?r3)可決系數(shù)與相關(guān)系數(shù)的關(guān)系。DependentVariable:財政收入(億元)b.

  

【正文】 層次聚類分析中的 R型聚類 快速聚類分析 判 別 分 析 本章介紹統(tǒng)計學中經(jīng)常使用的分類統(tǒng)計分析方法 ——聚類分析與判別分析。主要內(nèi)容有層次聚類分析、快速聚類分析和判別分析。其中層次聚類分析根據(jù)聚類的對象不同分成 Q型聚類和 R型聚類。 聚類分析與判別分析的基本概念 統(tǒng)計學研究這類問題的常用分類統(tǒng)計方法主要有聚類分析( cluster analysis)與判別分析( discriminant analysis)。其中聚類分析是統(tǒng)計學中研究這種 “ 物以類聚 ” 問題的一種有效方法,它屬于統(tǒng)計分析的范疇。聚類分析的實質(zhì)是建立一種分類方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù)按照他們在性質(zhì)上的親密程度在沒有先驗知識的情況下自動進行分類。這里所說的類就是一個具有相似性的個體的集合,不同類之間具有明顯的區(qū)別。 聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動進行分類。聚類分析所使用方法的不同,常常會得到不同的結(jié)論。不同研究者對于同一組數(shù)據(jù)進行聚類分析,所得到的聚類數(shù)未必一致。因此我們說聚類分析是一種探索性的分析方法。 對個案的聚類分析類似于判別分析,都是將一些觀察個案進行分類。聚類分析時,個案所屬的群組特點還未知。也就是說,在聚類分析之前,研究者還不知道獨立觀察組可以分成多少個類,類的特點也無所得知。 變量的聚類分析類似于因素分析。兩者都可用于辨別變量的相關(guān)組別。不同在于,因素分析在合并變量的時候,是同時考慮所有變量之間的關(guān)系;而變量的聚類分析,則采用層次式的判別方式,根據(jù)個別變量之間的親疏程度逐次進行聚類。 聚類分析的方法,主要有兩種,一種是“ 快速聚類分析方法 ” ( K- Means Cluster Analy sis),另一種是 “ 層次聚類分析方法 ”( Hierarchical Cluster Analysis)。如果觀察值的個數(shù)多或文件非常龐大(通常觀察值在 200個以上),則宜采用快速聚類分析方法。因為觀察值數(shù)目巨大,層次聚類分析的兩種判別圖形會過于分散,不易解釋。 判別分析是一種有效的對個案進行分類分析的方法。和聚類分析不同的是,判別分析時,組別的特征已知。如銀行為了對貸款進行管理,需要預測哪些類型的客戶可能不會按時歸還貸款。已知過去幾年中, 900個客戶的貸款歸還信譽度,據(jù)此可以將客戶分成兩組:可靠客戶和不可靠客戶。 再通過收集客戶的一些資料,如年齡、工資收入、教育程度、存款等,將這些資料作為自變量。通過判別分析,建立判別函數(shù)。那么,如果有 150個新的客戶提交貸款請求,就可以利用創(chuàng)建好的判別函數(shù),對新的客戶進行分析,從而判斷新的客戶是屬于可靠客戶類,還是不可靠客戶類。 層次聚類分析中的 Q型聚類 層次聚類分析是根據(jù)觀察值或變量之間的親疏程度,將最相似的對象結(jié)合在一起,以逐次聚合的方式( Agglomerative Clustering),它將觀察值分類,直到最后所有樣本都聚成一類。 層次聚類分析有兩種形式,一種是對樣本(個案)進行分類,稱為 Q型聚類,它使具有共同特點的樣本聚齊在一起,以便對不同類的樣本進行分析;另一種是對研究對象的觀察變量進行分類,稱為 R型聚類。它使具有共同特征的變量聚在一起,以便從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個數(shù)。 本節(jié)講述 Q型聚類的原理和 SPSS的實現(xiàn)過程,下一節(jié)將講述 R型聚類的實現(xiàn)過程。 定義:層次聚類分析中的 Q型聚類,它使具有共同特點的樣本聚齊在一起,以便對不同類的樣本進行分析。 統(tǒng)計學上的定義和計算公式 層次聚類分析中,測量樣本之間的親疏程度是關(guān)鍵。聚類的時候會涉及到兩種類型親疏程度的計算:一種是樣本數(shù)據(jù)之間的親疏程度,一種是樣本數(shù)據(jù)與小類、小類與小類之間的親疏程度。下面講述這兩種類型親疏程度的計算方法和公式。 計算公式如下。 樣本數(shù)據(jù)之間的親疏程度主要通過樣本之間的距離、樣本間的相關(guān)系數(shù)來度量。 SPSS根據(jù)變量數(shù)據(jù)類型的不同,采用不同的測定親疏程度的方法。 樣本若有 k個變量,則可以將樣本看成是一個 k維的空間的一個點,樣本和樣本之間的距離就是 k維空間點和點之間的距離,這反映了樣本之間的親疏程度。聚類時,距離相近的樣本屬于一個類,距離遠的樣本屬于不同類。 1.連續(xù)變量的樣本距離測量方法 ( 1)歐氏距離( Euclidean Distance) 兩個樣本之間的歐氏距離是樣本各個變量值之差的平方和的平方根,計算公式為 ( 2)歐氏距離平方( Squared Euclidean Distance) 兩個樣本之間的歐氏距離平方是各樣本每個變量值之差的平方和,計算公式為 ( 3) Chebychev距離 兩個樣本之間的 Chebychev距離是各樣本所有變量值之差絕對值中的最大值,計算公式為 ( 4) Block距離 兩個樣本之間的 Block距離是各樣本所有變量值之差絕對值的總和,計算公式為 ( 5) Minkowski距離 兩個樣本之間的 Minkowski距離是各樣本所有變量值之差絕對值的 p次方的總和,再求 p次方根。計算公式為 ( 6) Customized距離(用戶自定義距離) 兩個樣本之間的 Customized距離是各樣本所有變量值之差絕對值的 p次方的總和,再求 q次方根。計算公式為 連續(xù)變量親疏程度的度量,除了上面的各種距離外,還可以計算其他統(tǒng)計指標。如Pearson相關(guān)系數(shù)、 Sosine相似度等。 2.連續(xù)變量的樣本親疏程度的其他測量方法 3.順序或名義變量的樣本親疏程度測量方法 對于此類變量,可以計算一些有關(guān)相似性的統(tǒng)計指標來測定樣本間的親疏程度。也可以通過下面兩個計算公式來得到。 4.樣本數(shù)據(jù)與小類、小類與小類之間的親疏程度測量方法 SPSS默認的變量為 Var0000 Var00002等,用戶也可以根據(jù)自己的需要來命名變量。SPSS變量的命名和一般的編程語言一樣,有一定的命名規(guī)則,具體內(nèi)容如下。 所謂小類,是在聚類過程中根據(jù)樣本之間親疏程度形成的中間類,小類和樣本、小類與小類繼續(xù)聚合,最終將所有樣本都包括在一個大類中。 在 SPSS聚類運算過程中,需要計算樣本與小類、小類與小類之間的親疏程度。 SPSS提供了多種計算方法(計算規(guī)則)。 ( 1)最短距離法( Nearest Neighbor) 以當前某個樣本與已經(jīng)形成小類中的各樣本距離的最小值作為當前樣本與該小類之間的距離。 ( 2)最長距離法( Furthest Neighbor) 以當前某個樣本與已經(jīng)形成小類中的各樣本距離的最大值作為當前樣本與該小類之間的距離。 ( 3)類間平均鏈鎖法( Betweengroups Linkage) 兩個小類之間的距離為兩個小類內(nèi)所有樣本間的平均距離。 ( 4)類內(nèi)平均鏈鎖法( Withingroups Linkage) 與小類間平均鏈鎖法類似,這里的平均距離是對所有樣本對的距離求平均值,包括小類之間的樣本對、小類內(nèi)的樣本對。 ( 5)重心法( Centroid Clustering) 將兩小類間的距離定義成兩小類重心間的距離。每一小類的重心就是該類中所有樣本在各個變量上的均值代表點。 ( 6)離差平方和法( Ward’s Method) 小類合并的方法:在聚類過程中,使小類內(nèi)各個樣本的歐氏距離總平方和增加最小的兩小類合并成一類。 ? 研究問題 對一個班同學的數(shù)學水平進行聚類。聚類的依據(jù)是第一次數(shù)學考試的成績和入學考試的成績。數(shù)據(jù)如表 81所示。 SPSS中實現(xiàn)過程 表 81 學生的數(shù)學成績 姓 名 數(shù) 學 入 學 成 績 hxh yaju yu shizg hah john watet jess wish Iiakii ? 實現(xiàn)步驟 圖 81 在菜單中選擇“ Hierarchical Cluster”命令 圖 82 “Hierarchical Cluster Analysis”對話框(一) 圖 83 “Hierarchical Cluster Analysis: Method”對話框(一) 圖 84 “Hierarchical Cluster Analysis: Plots” 對話框(一) 圖 85 “Hierarchical Cluster Analysis: Statistics”對話框(一) 圖 86 “Hierarchical Cluster Analysis: Save New Var”對話框 由于本例中選中的選項較多,這里按照各個結(jié)果分別解釋。 ( 1)首先是層次聚類分析的概要結(jié)果,該結(jié)果是 SPSS輸出結(jié)果文件中的第一個表格,如下表所示。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二個表格如下表所示。 ( 3)輸出的結(jié)果文件中第三個表格為層次聚類分析的凝聚狀態(tài)表,包括: ( 4)輸出的結(jié)果文件中第四個表格如下表所示。 ( 5)輸出的結(jié)果文件中第五個表格如下表所示。 ( 6)輸出的結(jié)果文件中第六部分如圖 87所示。 ( 7)由于對圖 86“Hierarchical Cluster Analysis: Save New Var”對話框進行了設(shè)置,將聚類成三類時,各個樣本的類歸屬情況保存為一個變量,因此在 SPSS數(shù)據(jù)編輯窗口中就新增了一個變量的值,如圖 88所示。 圖 88 層次聚類分析結(jié)果保存 層次聚類分析中的 R型聚類 統(tǒng)計學上的定義和計算公式 定義:層次聚類分析中的 R型聚類是對研究對象的觀察變量進行分類,它使具有共同特征的變量聚在一起。以便可以從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個數(shù)。 計算公式: R型聚類的計算公式和 Q型聚類的計算公式是類似的,不同的是 R型聚類是對變量間進行距離的計算, Q型聚類則是對樣本間進行距離的計算。 ? 研究問題 對一個班同學的各科成績進行聚類,分析哪些課程是屬于一個類的。聚類的依據(jù)是 4門功課的考試成績,數(shù)據(jù)如表 82所示。 SPSS中實現(xiàn)過程 表 82 學生的四門課程的成績 姓 名 數(shù) 學 物 理 語 文 政 治 hxh yaju yu shizg hah john watet jess wish Iiakii ? 實現(xiàn)步驟 圖 89 在菜單中選擇“ Hierarchical Cluster”命令 圖 810 “Hierarchical Cluster Analysis”對話框(二) 圖 811 “Hierarchical Cluster Analysis: Method”對話框(二) 圖 812 “Hierarchical Cluster Analysis: Plots”對話框(二) 圖 813 “Hierarchical Cluster Analysis: Statistics”對話框(二) ( 1)首先是層次 R型聚類分析的結(jié)果,該結(jié)果是 SPSS輸出結(jié)果文件中的第一個表格。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二個表格如下表所示。 ( 3)輸出的結(jié)果文件中第三個表格如下表所示。 ( 4)輸出的結(jié)果文件中第四個表格如下表所示。 ( 5)輸出的結(jié)果文件中第五個表格如下表所示。 ( 6)輸出的結(jié)果文件中第六部分如下: 快速聚類分析 SPSS層次聚類分析對計算機的要求比較高,在大樣本的情況下,可以采用快速聚類分析的方法。采用快速聚類分析,得到的結(jié)果比較簡單易懂,對計算機的性能要求也不高,因此應用也比較廣。 定義:快速聚類分析是由用戶指定類別數(shù)的大樣本資料的逐步聚類分析。它先對數(shù)據(jù)進行初始分類,然后逐步調(diào)整,得到最終分類??焖倬垲惙治龅膶嵸|(zhì)是 KMean聚類。 統(tǒng)計學上的定義和計算公式 和層次聚類分析一致,快速聚類分析也以距離為樣本間親疏程度的標志。但兩者的不同在于:層次聚類可以對不同的聚類類數(shù)產(chǎn)生一系列的聚類解,而快速聚類只能產(chǎn)生固定類數(shù)的聚類解,類數(shù)需要用戶事先指定。 另外,在快速聚類分析中,用戶可
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1