【正文】
95 2020/9/15 注: 多元回歸分析中,變量的篩選一般有 向前篩。 ( 4)在 Method框中選擇回歸分析中解釋變量的篩選策略。 imik ???93 2020/9/15 ( 1)選擇菜單 Analyze- Regression- Linear,出現(xiàn)窗口: 線性回歸分析的基本操作 94 2020/9/15 ( 2)選擇被解釋變量進(jìn)入 Dependent框。指最大特征根與第 i個(gè)特征根比的平方根。如果某個(gè)特征根既能夠刻畫(huà)某解釋變量方差的較大部分比例( ),又能刻畫(huà)另一解釋變量方差的較大部分比例,則表明這兩個(gè)解釋變量間存在較強(qiáng)的線性相關(guān)關(guān)系。 21 ii RT o l ??2iR92 2020/9/15 ( 3)特征根和方差比。方差膨脹因子是容忍度的倒數(shù)。容忍度的取值范圍在 01之間,越接近 0表示多重共線性越強(qiáng),越接近 1表示多重共線性越弱。 )1(2)(22221??????????nttnttteeeDW91 2020/9/15 ?多重共線性分析 多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的現(xiàn)象。檢驗(yàn)統(tǒng)計(jì)量為: DW=2表示無(wú)自相關(guān),在 02之間說(shuō)明存在正自相關(guān),在 24之間說(shuō)明存在負(fù)的自相關(guān)。 ( 2) DW檢驗(yàn)。如果殘差均值為零,殘差圖的點(diǎn)應(yīng)該在縱坐標(biāo)為 0的中心的帶狀區(qū)域中隨機(jī)散落。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于 0;殘差取值與 X的取值無(wú)關(guān);殘差不存在自相關(guān);殘差方差相等。 對(duì)于一元線性回歸方程,檢驗(yàn)統(tǒng)計(jì)量為: 對(duì)于多元線性回歸方程,檢驗(yàn)統(tǒng)計(jì)量為: ),( 21~)2/()?( 1/)?()2/( 1/ 22??? ???? ? ? nFnyy yynSSE SSRF),( 1p~)1/()?( /)?()1/( / 22????? ????? ? ? pnFpnyy pyypnSSE pSSRF87 2020/9/15 ?回歸系數(shù)的顯著性檢驗(yàn)( t檢驗(yàn)) 回歸系數(shù)的顯著性檢驗(yàn)是要檢驗(yàn)回歸方程中被解釋變量與每一個(gè)解釋變量之間的線性關(guān)系是否顯著。所以在多元線性回歸分析中,調(diào)整的判定系數(shù)比判定系數(shù)更能準(zhǔn)確的反映回歸方程的擬合優(yōu)度。 ?對(duì)于一元線性回歸方程: ? ?? ?? ?? ?????????????????22222211yyyyyyyyRSSTSSESSTSSESSTSSTSSRR??( 2)可決系數(shù)(判定系數(shù)、決定系數(shù)) 85 2020/9/15 ?對(duì)于多元線性回歸方程: 在多元線性回歸分析中,引起判定系數(shù)增加的原因有兩個(gè):一個(gè)是方程中的解釋變量個(gè)數(shù)增多,另一個(gè)是方程中引入了對(duì)被解釋變量有重要影響的解釋變量。 2)(? ? yy線性回歸方程的有關(guān)檢驗(yàn) 83 2020/9/15 ? ? ? ? ? ?? ?? ????? 222 yyyyyy ?? 即:總離差平方和( SST)=剩余離差平方和 (SSE) +回歸離差平方和( SSR) 其中; SSR是由 x和 y的直線回歸關(guān)系引起的,可以由回歸直線做出解釋; SSE是除了 x對(duì) y的線性影響之外的隨機(jī)因素所引起的 Y的變動(dòng),是回歸直線所不能解釋的。 ( 1) 離差平方和的分解: 建立直線回歸方程可知: y的觀測(cè)值的總變動(dòng) 可由 來(lái)反映,稱為總變差。 79 2020/9/15 偏相關(guān)分析實(shí)例 例 [07- 3] 某農(nóng)場(chǎng)通過(guò)試驗(yàn)取得早稻產(chǎn)量與降雨量和溫度的數(shù)據(jù)如下,現(xiàn)求降雨量對(duì)產(chǎn)量的偏相關(guān)系數(shù)。 Option按鈕中的 Statistics選項(xiàng)中,選中Zeroorder Correlations表示輸出零階偏相關(guān)系數(shù)。 Controlling for框中。T統(tǒng)計(jì)量服從 nq2個(gè)自由度的 t分布。 1 2 121 , 2222 121 2 12 212( 1 ) ( 1 )y y xxxyyyyyyr r rrrrr r r????1其中, 、 、 分別表示 和x 的相關(guān)系數(shù)、 和 的相關(guān)系數(shù)、和 的相關(guān)系數(shù)??梢栽诳刂其N售能力與各種其他經(jīng)濟(jì)指標(biāo)的情況下,研究銷售量與廣告費(fèi)用之間的關(guān)系等。 ?分析身高與肺活量之間的相關(guān)性,就要控制體重在相關(guān)分析中的影響。原因是身高與體重有線性關(guān)系 ,體重與肺活量存在線性關(guān)系 ,因此得出身高和肺活量之間存在著較強(qiáng)的線性關(guān)系的錯(cuò)誤結(jié)論。如果使用 Pearson相關(guān)計(jì)算其相關(guān)系數(shù) ,可以得出肺活量與身高和體重均存在較強(qiáng)的線性關(guān)系。往往因?yàn)榈谌齻€(gè)變量的作用 ,使相關(guān)系數(shù)不能真正反映兩個(gè)變量間的線性程度。 Kendall相關(guān)分析所得到的結(jié)果類似于 Spearman分析。操作過(guò)程相同,只是在第 3步的 Correlation Coefficients欄內(nèi)選擇 Kendall’s選項(xiàng)。 s r h o權(quán)威主義 地位欲C o r r e l a t i o n i s s i g n i f i c a n t a t t h e . 0 1 l e v e l ( 2 t a i l e d ) .* * . 結(jié)果分析 73 2020/9/15 C o r r e l a t i o n s1 . 0 0 0 . 6 6 7 **. . 0 0 312 12. 6 6 7 ** 1 . 0 0 0. 0 0 3 .12 12C o r r e l a t i o n C o e f f i c i e n tS i g . ( 2 t a i l e d )NC o r r e l a t i o n C o e f f i c i e n tS i g . ( 2 t a i l e d )N權(quán)威主義地位欲K e n d a l l 39。 分析步驟 72 2020/9/15 從表中知,權(quán)威主義與地位欲不相關(guān)的假設(shè)檢驗(yàn) P值為 ,否定原假設(shè),即權(quán)威主義與地位欲是相關(guān)的;權(quán)威主義和地位欲的相關(guān)系數(shù)為 ,這表明權(quán)威主義越高的人地位欲也越高。 6)單擊 Options按鈕,選擇 Exclude cases pairwise選項(xiàng)。 4)在 Test of Significance欄選擇 Twotailed。 學(xué)生 A B C D E F G H I J K L 權(quán)威主義 2 6 5 1 10 9 8 3 4 12 7 11 地位欲 3 4 2 1 8 11 10 6 7 12 5 9 權(quán)威主義和地位欲排秩 71 2020/9/15 1)輸入數(shù)據(jù),依次單擊 Analyze— Correlate—Bivariate,打開(kāi) Bivariate Correlations對(duì)話框 2)選擇 power和 position 變量進(jìn)入 Variables框中。 Pearson相關(guān)系數(shù)矩陣 C o r r e l a t i o n s1 . 0 0 0 . 8 6 5 **. . 0 0 19 0 2 . 5 0 0 2 1 5 2 . 0 0 01 0 0 . 2 7 8 2 3 9 . 1 1 110 10. 8 6 5 ** 1 . 0 0 0. 0 0 1 .2 1 5 2 . 0 0 0 6 8 5 4 . 0 0 02 3 9 . 1 1 1 7 6 1 . 5 5 610 10P e a r s o n C o r r e l a t i o nS i g . ( 2 t a i l e d )S u m o f S q u a r e s a n dC r o s s p r o d u c t sC o v a r i a n c eNP e a r s o n C o r r e l a t i o nS i g . ( 2 t a i l e d )S u m o f S q u a r e s a n dC r o s s p r o d u c t sC o v a r i a n c eN體重雞冠重體重 雞冠重C o r r e l a t i o n i s s i g n i f i c a n t a t t h e 0 . 0 1l e v e l ( 2 t a i l e d ) .* * . 70 2020/9/15 順序變量的 Spearman分析實(shí)例 [072]為研究集團(tuán)迫使個(gè)人順從的效應(yīng),一些研究者用為測(cè)量地位欲而設(shè)計(jì)的一種量表對(duì) 12名大學(xué)生進(jìn)行調(diào)查。體重觀測(cè)值的方差為 ,而雞冠重觀測(cè)值的方差為 ,體重和雞冠重的協(xié)方差為 。 7)單擊 OK完成。 5)選擇 Flag significant correlation。 3)在 Correlation Coefficients欄內(nèi)選擇 Pearson。 對(duì)于任何分析,有缺省值的觀測(cè)值都會(huì)被排除。 對(duì)每一個(gè)變量輸出平方和、叉積和、方差及協(xié)方差。 在輸出結(jié)果中 ,相關(guān)系數(shù)的右上角上有“*”則表示顯著性水平為 ;右上角上有“**”則表示顯著性水平為 。 計(jì)算 Kendall秩相關(guān)系數(shù),適合于順序變量或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)。 清楚變量之間是正相關(guān)還是負(fù)相關(guān)時(shí)可選擇此項(xiàng)。 ?Bivariate相關(guān)分析的步驟: 輸入數(shù)據(jù)后,依次單擊 Analyze— Correlate— Bivariate,打開(kāi) Bivariate Correlations對(duì)話框如圖 7- 1。 ? Distance 相似性測(cè)度, 對(duì)變量或觀測(cè)量進(jìn)行相似性或不相似性測(cè)度。 62 2020/9/15 二、相關(guān)分析的 SPSS過(guò)程 ?在 Analyze→ Correlate下 的三個(gè)子菜單: ? Bivariate相關(guān)分析, 計(jì)算指定的兩個(gè)變量間的相關(guān)關(guān)系,可選擇 Pearson相關(guān)、 Spearman和 Kendall 相關(guān);同時(shí)對(duì)相關(guān)系數(shù)進(jìn)行檢驗(yàn),檢驗(yàn)的零假設(shè)為:相關(guān)系數(shù)為 0(無(wú)線性相關(guān)),給出相關(guān)系數(shù)為 0的概率。 61 2020/9/15 ? 偏相關(guān)分析: 它描述的是當(dāng)控制了一個(gè)或幾個(gè)另外的變量的影響條件下兩個(gè)變量間的相關(guān)性,如控制年齡和工作經(jīng)驗(yàn)的影響,估計(jì)工資收入與受教育水平之間的相關(guān)關(guān)系。如果兩變量具有較強(qiáng)的正相關(guān)關(guān)系,則一致對(duì)數(shù)目 U應(yīng)較大,非一致對(duì)數(shù)目 V應(yīng)較?。蝗绻麅勺兞烤哂休^強(qiáng)的負(fù)相關(guān)關(guān)系,則一致對(duì)數(shù)目 U應(yīng)較小,非一致對(duì)數(shù)目 V應(yīng)較大;如果兩變量的相關(guān)性較弱,則一致對(duì)數(shù)目U和非一致對(duì)數(shù)目 V應(yīng)大致相等,大約各占樣本數(shù)的1/2。 22i11()nn iiiiD U V??????1Z r n??22i11()nn iiiiD U V??????60 2020/9/15 ? Kendall相關(guān)系數(shù):采用非參數(shù)檢驗(yàn)方法度量順序變量間的線性相關(guān)關(guān)系。 ? Pearson相關(guān)系數(shù):對(duì)數(shù)值型變量的數(shù)據(jù)進(jìn)行計(jì)算。一般地, ?|r|? 高度 相關(guān); ?? |r| 中度 相關(guān); ?? |r| 低度 相關(guān); ?|r| 關(guān)系極弱,認(rèn)為無(wú)線性 相關(guān) 。用相關(guān)系數(shù) r來(lái)描述。這里,豬體重的增加量為觀測(cè)變量,飼料為控制變量,豬喂養(yǎng)前體重為協(xié)變量。由于生豬體重的增加理論上會(huì)受到其自身身體條件的影響,于是收集生豬喂養(yǎng)前的體重( wyq)數(shù)據(jù),作為自身身體條件的測(cè)量指標(biāo)。至此, SPSS將自動(dòng)完成對(duì)各變差的分析,并計(jì)算各 F檢驗(yàn)統(tǒng)計(jì)量、對(duì)應(yīng)的概率 p值及其他計(jì)算結(jié)果,并將結(jié)果顯示到輸出窗口中。 把作為協(xié)變量的變量指定到 Covariate(s)框中。 把觀測(cè)變量指定到 Dependent Variable框中。 52 2020/9/15 三、協(xié)方差分析的基本操作步驟 在利用 SPSS進(jìn)行協(xié)方差分析時(shí),應(yīng)首先將作為協(xié)變量的變量定義成一個(gè) SPSS變量。 ? 計(jì)算檢驗(yàn)統(tǒng)計(jì)量和概率 P值。對(duì) SSB、SSAB同理。 50 2020/9/15 離差平方和的分解 在協(xié)方差分析中,將觀測(cè)變量的總離差平方和分解為由控制變量獨(dú)立作用引起的、由控制變量交互作用引起的、由協(xié)變量引起的和由隨機(jī)因素引起的。例如:在研究生豬的飼養(yǎng)問(wèn)題的協(xié)方差分析中,飼料是控制變量,生豬的初始體重是協(xié)變量。而協(xié)方差分析中的控制變量是定性變量,而協(xié)變量一般是定量變量。 定義: 協(xié)方差分析就是將那些很難人為控制的因素作為協(xié)變量,并在排除協(xié)變量對(duì)觀測(cè)變量影響的條件下,分析控制變量對(duì)觀