freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

spss回歸分析應(yīng)用(參考版)

2024-08-23 17:25本頁(yè)面
  

【正文】 另外,在快速聚類分析中,用戶可以自。 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 和層次聚類分析一致,快速聚類分析也以距離為樣本間親疏程度的標(biāo)志。它先對(duì)數(shù)據(jù)進(jìn)行初始分類,然后逐步調(diào)整,得到最終分類。采用快速聚類分析,得到的結(jié)果比較簡(jiǎn)單易懂,對(duì)計(jì)算機(jī)的性能要求也不高,因此應(yīng)用也比較廣。 ( 5)輸出的結(jié)果文件中第五個(gè)表格如下表所示。 ( 3)輸出的結(jié)果文件中第三個(gè)表格如下表所示。 SPSS中實(shí)現(xiàn)過程 表 82 學(xué)生的四門課程的成績(jī) 姓 名 數(shù) 學(xué) 物 理 語(yǔ) 文 政 治 hxh yaju yu shizg hah john watet jess wish Iiakii ? 實(shí)現(xiàn)步驟 圖 89 在菜單中選擇“ Hierarchical Cluster”命令 圖 810 “Hierarchical Cluster Analysis”對(duì)話框(二) 圖 811 “Hierarchical Cluster Analysis: Method”對(duì)話框(二) 圖 812 “Hierarchical Cluster Analysis: Plots”對(duì)話框(二) 圖 813 “Hierarchical Cluster Analysis: Statistics”對(duì)話框(二) ( 1)首先是層次 R型聚類分析的結(jié)果,該結(jié)果是 SPSS輸出結(jié)果文件中的第一個(gè)表格。 ? 研究問題 對(duì)一個(gè)班同學(xué)的各科成績(jī)進(jìn)行聚類,分析哪些課程是屬于一個(gè)類的。以便可以從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個(gè)數(shù)。 ( 7)由于對(duì)圖 86“Hierarchical Cluster Analysis: Save New Var”對(duì)話框進(jìn)行了設(shè)置,將聚類成三類時(shí),各個(gè)樣本的類歸屬情況保存為一個(gè)變量,因此在 SPSS數(shù)據(jù)編輯窗口中就新增了一個(gè)變量的值,如圖 88所示。 ( 5)輸出的結(jié)果文件中第五個(gè)表格如下表所示。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二個(gè)表格如下表所示。 SPSS中實(shí)現(xiàn)過程 表 81 學(xué)生的數(shù)學(xué)成績(jī) 姓 名 數(shù) 學(xué) 入 學(xué) 成 績(jī) hxh yaju yu shizg hah john watet jess wish Iiakii ? 實(shí)現(xiàn)步驟 圖 81 在菜單中選擇“ Hierarchical Cluster”命令 圖 82 “Hierarchical Cluster Analysis”對(duì)話框(一) 圖 83 “Hierarchical Cluster Analysis: Method”對(duì)話框(一) 圖 84 “Hierarchical Cluster Analysis: Plots” 對(duì)話框(一) 圖 85 “Hierarchical Cluster Analysis: Statistics”對(duì)話框(一) 圖 86 “Hierarchical Cluster Analysis: Save New Var”對(duì)話框 由于本例中選中的選項(xiàng)較多,這里按照各個(gè)結(jié)果分別解釋。聚類的依據(jù)是第一次數(shù)學(xué)考試的成績(jī)和入學(xué)考試的成績(jī)。 ( 6)離差平方和法( Ward’s Method) 小類合并的方法:在聚類過程中,使小類內(nèi)各個(gè)樣本的歐氏距離總平方和增加最小的兩小類合并成一類。 ( 5)重心法( Centroid Clustering) 將兩小類間的距離定義成兩小類重心間的距離。 ( 3)類間平均鏈鎖法( Betweengroups Linkage) 兩個(gè)小類之間的距離為兩個(gè)小類內(nèi)所有樣本間的平均距離。 ( 1)最短距離法( Nearest Neighbor) 以當(dāng)前某個(gè)樣本與已經(jīng)形成小類中的各樣本距離的最小值作為當(dāng)前樣本與該小類之間的距離。 在 SPSS聚類運(yùn)算過程中,需要計(jì)算樣本與小類、小類與小類之間的親疏程度。SPSS變量的命名和一般的編程語(yǔ)言一樣,有一定的命名規(guī)則,具體內(nèi)容如下。也可以通過下面兩個(gè)計(jì)算公式來得到。如Pearson相關(guān)系數(shù)、 Sosine相似度等。計(jì)算公式為 ( 6) Customized距離(用戶自定義距離) 兩個(gè)樣本之間的 Customized距離是各樣本所有變量值之差絕對(duì)值的 p次方的總和,再求 q次方根。聚類時(shí),距離相近的樣本屬于一個(gè)類,距離遠(yuǎn)的樣本屬于不同類。 SPSS根據(jù)變量數(shù)據(jù)類型的不同,采用不同的測(cè)定親疏程度的方法。 計(jì)算公式如下。聚類的時(shí)候會(huì)涉及到兩種類型親疏程度的計(jì)算:一種是樣本數(shù)據(jù)之間的親疏程度,一種是樣本數(shù)據(jù)與小類、小類與小類之間的親疏程度。 定義:層次聚類分析中的 Q型聚類,它使具有共同特點(diǎn)的樣本聚齊在一起,以便對(duì)不同類的樣本進(jìn)行分析。它使具有共同特征的變量聚在一起,以便從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個(gè)數(shù)。 層次聚類分析中的 Q型聚類 層次聚類分析是根據(jù)觀察值或變量之間的親疏程度,將最相似的對(duì)象結(jié)合在一起,以逐次聚合的方式( Agglomerative Clustering),它將觀察值分類,直到最后所有樣本都聚成一類。通過判別分析,建立判別函數(shù)。已知過去幾年中, 900個(gè)客戶的貸款歸還信譽(yù)度,據(jù)此可以將客戶分成兩組:可靠客戶和不可靠客戶。和聚類分析不同的是,判別分析時(shí),組別的特征已知。因?yàn)橛^察值數(shù)目巨大,層次聚類分析的兩種判別圖形會(huì)過于分散,不易解釋。 聚類分析的方法,主要有兩種,一種是“ 快速聚類分析方法 ” ( K- Means Cluster Analy sis),另一種是 “ 層次聚類分析方法 ”( Hierarchical Cluster Analysis)。兩者都可用于辨別變量的相關(guān)組別。也就是說,在聚類分析之前,研究者還不知道獨(dú)立觀察組可以分成多少個(gè)類,類的特點(diǎn)也無所得知。 對(duì)個(gè)案的聚類分析類似于判別分析,都是將一些觀察個(gè)案進(jìn)行分類。不同研究者對(duì)于同一組數(shù)據(jù)進(jìn)行聚類分析,所得到的聚類數(shù)未必一致。 聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類。聚類分析的實(shí)質(zhì)是建立一種分類方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù)按照他們?cè)谛再|(zhì)上的親密程度在沒有先驗(yàn)知識(shí)的情況下自動(dòng)進(jìn)行分類。 聚類分析與判別分析的基本概念 統(tǒng)計(jì)學(xué)研究這類問題的常用分類統(tǒng)計(jì)方法主要有聚類分析( cluster analysis)與判別分析( discriminant analysis)。主要內(nèi)容有層次聚類分析、快速聚類分析和判別分析。其中,一元線性回歸、多元線性回歸和含虛擬變量的回歸分析可由“ Linear”子菜單完成;非線性回歸分析、曲線估計(jì)和時(shí)間序列的曲線估計(jì)可由 “ Curve Estimation”子菜單完成;邏輯回歸分析可由“ Binary Logistic”子菜單完成。 小 結(jié) 一元線性回歸只涉及一個(gè)自變量的回歸問題;多元線性回歸用于解決兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系問題;非線性回歸主要解決在非線性相關(guān)條件下,自變量對(duì)因變量的數(shù)量變化關(guān)系;時(shí)間序列的曲線回歸用于研究因變量與時(shí)間之間的變化關(guān)系;當(dāng)遇到非數(shù)量型變量時(shí),通過引入虛擬變量來構(gòu)造含虛擬變量的回歸模型; Logistic回歸分析是對(duì)定性變量進(jìn)行的回歸分析。 小 結(jié) 回歸分析是研究變量與變量之間聯(lián)系的最為廣泛的模型。縱坐標(biāo)是個(gè)案分布頻數(shù),反映個(gè)案的分布。該圖以 0和 1為符號(hào),每四個(gè)符號(hào)代表一個(gè)個(gè)案。常數(shù)與 x2之間的相關(guān)性最大, x1和 x3之間的相關(guān)性最小。從該表格中可以看出 x3相伴概率最小,Wald統(tǒng)計(jì)量最大,可見該變量在模型中很重要。 ( 6) Classification Table分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看出對(duì)于 y=0,有 %的準(zhǔn)確性;對(duì)于 y=1,有%準(zhǔn)確性,因此對(duì)于所有個(gè)案總共有 %的準(zhǔn)確性。 ( 4) Model Summary表給出了 2 對(duì)數(shù)似然值、 Cox和 Snell的 R2以及 Nagelkerke的 R2檢驗(yàn)統(tǒng)計(jì)結(jié)果。 ( 2)第二部分( Block 0)輸出結(jié)果有 4個(gè)表格。 SPSS中實(shí)現(xiàn)過程 表 77 使用交通工具上下班情況 序號(hào) x1(年齡) x2(月收入:元) x3(性別) y 1 18 850 0 0 2 21 1200 0 0 3 23 850 0 1 4 23 950 0 1 5 28 1200 0 1 6 31 850 0 0 7 36 1500 0 1 8 42 1000 0 1 9 46 950 0 1 10 48 1200 0 0 11 55 1800 0 1 12 56 2100 0 1 13 58 1800 0 1 14 18 850 1 0 15 20 1000 1 0 16 25 1200 1 0 17 27 1300 1 0 18 28 1500 1 0 19 30 950 1 1 20 32 1000 1 0 21 33 1800 1 0 22 33 1000 1 0 23 38 1200 1 0 24 41 1500 1 0 25 45 1800 1 1 26 48 1000 1 0 27 52 1500 1 1 28 56 1800 1 1 ? 實(shí)現(xiàn)步驟 圖 724 “Logistic Regression”對(duì)話框 圖 725 “Logistic Regression: Options”對(duì)話框 ( 1)第一部分輸出結(jié)果有兩個(gè)表格,第一個(gè)表格說明所有個(gè)案( 28個(gè))都被選入作為回歸分析的個(gè)案。 ? 研究問題 在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工具的社會(huì)調(diào)查中,因變量 y =1表示居民主要乘坐公共汽車上下班; y =0表示主要騎自行車上下班;自變量 x1表示被調(diào)查者的年齡; x2表示被調(diào)查者的月收入; x3表示被調(diào)查者的性別( x3=1為男性, x3=0為女性)。 ( 2)構(gòu)造 Wald統(tǒng)計(jì)量。 7. Wald統(tǒng)計(jì)量 Wald統(tǒng)計(jì)量用于判斷一個(gè)變量是否應(yīng)該包含在模型中,其檢驗(yàn)步驟如下。 如果該 p值小于給定的顯著性水平(如=),則拒絕因變量的觀測(cè)值與模型預(yù)測(cè)值不存在差異的零假設(shè),表明模型的預(yù)測(cè)值與觀測(cè)值存在顯著差異。Snell’s RSquare) 4. Nagelkerke的 R 2( N agelkerke’s RSquare) 5.偽 R 2( PsedoRsquare) 偽 R2與線性回歸模型的 R2相對(duì)應(yīng),其意義相似,但它小于 1。 ?2LL的計(jì)算公式為 1. 2對(duì)數(shù)似然值( 2 log likelihood, 2LL) Logistic回歸的擬合優(yōu)度統(tǒng)計(jì)量計(jì)算公式為 在實(shí)際問題中,通常采用如下分類表( Classification Table)反映擬合效果。本節(jié)將只討論 Binary Logistic回歸,并簡(jiǎn)稱 Logistic回歸(與 計(jì)中介紹的 Logistic曲線模型相區(qū)別)。 Logistic回歸分析根據(jù)因變量取值類別不同,又可以分為 Binary Logistic回歸分析和 Multinominal Logistic回歸分析。 可用于處理定性因變量的統(tǒng)計(jì)分析方法有:判別分析( Discriminant analysis)、Probit分析、 Logistic回歸分析和對(duì)數(shù)線性模型等。 ( 4)輸出的結(jié)果文件中第四個(gè)表格如下表所示。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二個(gè)表格如下表所示。 ? 研究問題 研究采取某項(xiàng)保險(xiǎn)革新措施的速度 y與保險(xiǎn)公司的規(guī)模 x1及其類型 d之間的關(guān)系,數(shù)據(jù)如表 76所示。 ( 1)自變量中只含一個(gè)定性變量,且這個(gè)定性變量只有兩種特征的簡(jiǎn)單情況時(shí)。 計(jì)算公式如下。 如果在回歸模型中需要引入多個(gè) 0?1型虛擬變量 D時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則來確定:對(duì)于包含一個(gè)具有 k種特征或狀態(tài)的質(zhì)因素的回歸模型,如果回歸模型不帶常數(shù)項(xiàng),則中需引入 k個(gè) 0?1型虛擬變量 D;如果有常數(shù)項(xiàng),則只需引入 k?1個(gè) 0?1型虛擬變量 D。虛擬變量也稱為啞變量。例如,令 “ 1”表示改革開放以后的時(shí)期, “ 0”則表示改革開放以前的時(shí)期。 在回歸分析中,對(duì)一些自變量是定性變量的先作數(shù)量化處理,處理的方法是引進(jìn)只取
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1