freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

spss回歸分析應(yīng)用(文件)

2025-09-09 17:25 上一頁面

下一頁面
 

【正文】 4)輸出的結(jié)果文件中第四個表格如下表所示。圖 78為自變量 z1和 my之間的關(guān)系點圖。 在實際問題中,變量之間的相關(guān)關(guān)系往往不是線性的,而是非線性的,因而不能用線性回歸方程來描述它們之間的相關(guān)關(guān)系,而要采用適當(dāng)?shù)姆蔷€性回歸分析。 在本節(jié)中介紹幾種常見的非線性回歸模型,并分別給出其線性化方法及圖形。 ( 2)第二部分輸出的是觀察值和 Cubic,Power兩種曲線預(yù)測值的對比圖,如圖 712所示。數(shù)據(jù)如表 74所示。 圖 716 對比圖 2 ( 4)重新回到圖 713所示對話框,在“ Model”框內(nèi)只選中 “ Quadratic”和 “ Cubic”這兩種擬合優(yōu)度更高的曲線模型進行估計。 圖 718 曲線估計分析結(jié)果保存 統(tǒng)計學(xué)上的定義和計算公式 時間序列的曲線估計 定義:時間序列的曲線估計是分析社會和經(jīng)濟現(xiàn)象中經(jīng)常用到的一種曲線估計。 ? 研究問題 試用 SPSS對 1978~ 2020年間社會消費品零售總額之間的關(guān)系進行曲線回歸分析。 ( 3)由于在圖 719所示 “ Curve Estimation”對話框(三)中選了 “ Save”項,且在圖 720的 “ Save Variables”框中選擇了“ Predicted values”選項和 “ Predict Cases”框中選擇了 “ Predict through”項,并且在 “ Observation”框中鍵入了 “ 31”,因此在 SPSS數(shù)據(jù)編輯窗口中就新增了 fit_1,fit_2, fit_3和 fit_4等 4個變量的預(yù)測值,同時在窗口下方還新增了兩個個案,它們分別代表對 2020年和 2020年的預(yù)測值。 在建立一個實際問題的回歸方程時,經(jīng)常需要考慮這些定性變量。再如,我國居民的消費行為在改革開放前后大不相同,因此消費函數(shù)的參數(shù)也會發(fā)生變化。例如,令 “ 1”表示改革開放以后的時期, “ 0”則表示改革開放以前的時期。 如果在回歸模型中需要引入多個 0?1型虛擬變量 D時,虛擬變量的個數(shù)應(yīng)按下列原則來確定:對于包含一個具有 k種特征或狀態(tài)的質(zhì)因素的回歸模型,如果回歸模型不帶常數(shù)項,則中需引入 k個 0?1型虛擬變量 D;如果有常數(shù)項,則只需引入 k?1個 0?1型虛擬變量 D。 ( 1)自變量中只含一個定性變量,且這個定性變量只有兩種特征的簡單情況時。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二個表格如下表所示。 可用于處理定性因變量的統(tǒng)計分析方法有:判別分析( Discriminant analysis)、Probit分析、 Logistic回歸分析和對數(shù)線性模型等。本節(jié)將只討論 Binary Logistic回歸,并簡稱 Logistic回歸(與 計中介紹的 Logistic曲線模型相區(qū)別)。Snell’s RSquare) 4. Nagelkerke的 R 2( N agelkerke’s RSquare) 5.偽 R 2( PsedoRsquare) 偽 R2與線性回歸模型的 R2相對應(yīng),其意義相似,但它小于 1。 7. Wald統(tǒng)計量 Wald統(tǒng)計量用于判斷一個變量是否應(yīng)該包含在模型中,其檢驗步驟如下。 ? 研究問題 在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工具的社會調(diào)查中,因變量 y =1表示居民主要乘坐公共汽車上下班; y =0表示主要騎自行車上下班;自變量 x1表示被調(diào)查者的年齡; x2表示被調(diào)查者的月收入; x3表示被調(diào)查者的性別( x3=1為男性, x3=0為女性)。 ( 2)第二部分( Block 0)輸出結(jié)果有 4個表格。 ( 6) Classification Table分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看出對于 y=0,有 %的準確性;對于 y=1,有%準確性,因此對于所有個案總共有 %的準確性。常數(shù)與 x2之間的相關(guān)性最大, x1和 x3之間的相關(guān)性最小。縱坐標是個案分布頻數(shù),反映個案的分布。 小 結(jié) 一元線性回歸只涉及一個自變量的回歸問題;多元線性回歸用于解決兩個或兩個以上自變量對一個因變量的數(shù)量變化關(guān)系問題;非線性回歸主要解決在非線性相關(guān)條件下,自變量對因變量的數(shù)量變化關(guān)系;時間序列的曲線回歸用于研究因變量與時間之間的變化關(guān)系;當(dāng)遇到非數(shù)量型變量時,通過引入虛擬變量來構(gòu)造含虛擬變量的回歸模型; Logistic回歸分析是對定性變量進行的回歸分析。主要內(nèi)容有層次聚類分析、快速聚類分析和判別分析。聚類分析的實質(zhì)是建立一種分類方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù)按照他們在性質(zhì)上的親密程度在沒有先驗知識的情況下自動進行分類。不同研究者對于同一組數(shù)據(jù)進行聚類分析,所得到的聚類數(shù)未必一致。也就是說,在聚類分析之前,研究者還不知道獨立觀察組可以分成多少個類,類的特點也無所得知。 聚類分析的方法,主要有兩種,一種是“ 快速聚類分析方法 ” ( K- Means Cluster Analy sis),另一種是 “ 層次聚類分析方法 ”( Hierarchical Cluster Analysis)。和聚類分析不同的是,判別分析時,組別的特征已知。通過判別分析,建立判別函數(shù)。它使具有共同特征的變量聚在一起,以便從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個數(shù)。聚類的時候會涉及到兩種類型親疏程度的計算:一種是樣本數(shù)據(jù)之間的親疏程度,一種是樣本數(shù)據(jù)與小類、小類與小類之間的親疏程度。 SPSS根據(jù)變量數(shù)據(jù)類型的不同,采用不同的測定親疏程度的方法。計算公式為 ( 6) Customized距離(用戶自定義距離) 兩個樣本之間的 Customized距離是各樣本所有變量值之差絕對值的 p次方的總和,再求 q次方根。也可以通過下面兩個計算公式來得到。 在 SPSS聚類運算過程中,需要計算樣本與小類、小類與小類之間的親疏程度。 ( 3)類間平均鏈鎖法( Betweengroups Linkage) 兩個小類之間的距離為兩個小類內(nèi)所有樣本間的平均距離。 ( 6)離差平方和法( Ward’s Method) 小類合并的方法:在聚類過程中,使小類內(nèi)各個樣本的歐氏距離總平方和增加最小的兩小類合并成一類。 SPSS中實現(xiàn)過程 表 81 學(xué)生的數(shù)學(xué)成績 姓 名 數(shù) 學(xué) 入 學(xué) 成 績 hxh yaju yu shizg hah john watet jess wish Iiakii ? 實現(xiàn)步驟 圖 81 在菜單中選擇“ Hierarchical Cluster”命令 圖 82 “Hierarchical Cluster Analysis”對話框(一) 圖 83 “Hierarchical Cluster Analysis: Method”對話框(一) 圖 84 “Hierarchical Cluster Analysis: Plots” 對話框(一) 圖 85 “Hierarchical Cluster Analysis: Statistics”對話框(一) 圖 86 “Hierarchical Cluster Analysis: Save New Var”對話框 由于本例中選中的選項較多,這里按照各個結(jié)果分別解釋。 ( 5)輸出的結(jié)果文件中第五個表格如下表所示。以便可以從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個數(shù)。 SPSS中實現(xiàn)過程 表 82 學(xué)生的四門課程的成績 姓 名 數(shù) 學(xué) 物 理 語 文 政 治 hxh yaju yu shizg hah john watet jess wish Iiakii ? 實現(xiàn)步驟 圖 89 在菜單中選擇“ Hierarchical Cluster”命令 圖 810 “Hierarchical Cluster Analysis”對話框(二) 圖 811 “Hierarchical Cluster Analysis: Method”對話框(二) 圖 812 “Hierarchical Cluster Analysis: Plots”對話框(二) 圖 813 “Hierarchical Cluster Analysis: Statistics”對話框(二) ( 1)首先是層次 R型聚類分析的結(jié)果,該結(jié)果是 SPSS輸出結(jié)果文件中的第一個表格。 ( 5)輸出的結(jié)果文件中第五個表格如下表所示。它先對數(shù)據(jù)進行初始分類,然后逐步調(diào)整,得到最終分類。 另外,在快速聚類分析中,用戶可以自。 統(tǒng)計學(xué)上的定義和計算公式 和層次聚類分析一致,快速聚類分析也以距離為樣本間親疏程度的標志。采用快速聚類分析,得到的結(jié)果比較簡單易懂,對計算機的性能要求也不高,因此應(yīng)用也比較廣。 ( 3)輸出的結(jié)果文件中第三個表格如下表所示。 ? 研究問題 對一個班同學(xué)的各科成績進行聚類,分析哪些課程是屬于一個類的。 ( 7)由于對圖 86“Hierarchical Cluster Analysis: Save New Var”對話框進行了設(shè)置,將聚類成三類時,各個樣本的類歸屬情況保存為一個變量,因此在 SPSS數(shù)據(jù)編輯窗口中就新增了一個變量的值,如圖 88所示。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二個表格如下表所示。聚類的依據(jù)是第一次數(shù)學(xué)考試的成績和入學(xué)考試的成績。 ( 5)重心法( Centroid Clustering) 將兩小類間的距離定義成兩小類重心間的距離。 ( 1)最短距離法( Nearest Neighbor) 以當(dāng)前某個樣本與已經(jīng)形成小類中的各樣本距離的最小值作為當(dāng)前樣本與該小類之間的距離。SPSS變量的命名和一般的編程語言一樣,有一定的命名規(guī)則,具體內(nèi)容如下。如Pearson相關(guān)系數(shù)、 Sosine相似度等。聚類時,距離相近的樣本屬于一個類,距離遠的樣本屬于不同類。 計算公式如下。 定義:層次聚類分析中的 Q型聚類,它使具有共同特點的樣本聚齊在一起,以便對不同類的樣本進行分析。 層次聚類分析中的 Q型聚類 層次聚類分析是根據(jù)觀察值或變量之間的親疏程度,將最相似的對象結(jié)合在一起,以逐次聚合的方式( Agglomerative Clustering),它將觀察值分類,直到最后所有樣本都聚成一類。已知過去幾年中, 900個客戶的貸款歸還信譽度,據(jù)此可以將客戶分成兩組:可靠客戶和不可靠客戶。因為觀察值數(shù)目巨大,層次聚類分析的兩種判別圖形會過于分散,不易解釋。兩者都可用于辨別變量的相關(guān)組別。 對個案的聚類分析類似于判別分析,都是將一些觀察個案進行分類。 聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動進行分類。 聚類分析與判別分析的基本概念 統(tǒng)計學(xué)研究這類問題的常用分類統(tǒng)計方法主要有聚類分析( cluster analysis)與判別分析( discriminant analysis)。其中,一元線性回歸、多元線性回歸和含虛擬變量的回歸分析可由“ Linear”子菜單完成;非線性回歸分析、曲線估計和時間序列的曲線估計可由 “ Curve Estimation”子菜單完成;邏輯回歸分析可由“ Binary Logistic”子菜單完成。 小 結(jié) 回歸分析是研究變量與變量之間聯(lián)系的最為廣泛的模型。該圖以 0和 1為符號,每四個符號代表一個個案。從該表格中可以看出 x3相伴概率最小,Wald統(tǒng)計量最大,可見該變量在模型中很重要。 ( 4) Model Summary表給出了 2 對數(shù)似然值、 Cox和 Snell的 R2以及 Nagelkerke的 R2檢驗統(tǒng)計結(jié)果。 SPSS中實現(xiàn)過程 表 77 使用交通工具上下班情況 序號 x1(年齡) x2(月收入:元) x3(性別) y 1 18 850 0 0 2 21 1200 0 0 3 23 850 0 1 4 23 950 0 1 5 28 1200 0 1 6 31 850 0 0 7 36 1500 0 1 8 42 1000 0 1 9 46 950 0 1 10 48 1200 0 0 11 55 1800 0 1 12 56 2100 0 1 13 58 1800 0 1 14 18 850 1 0
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1