【正文】
nt/Qt案例 11 表 1 旅游踩踏對土壤微生物生物量碳的影響 ( 單位: mg . kg 1) T ab l e 1 The ef f ect of r ecr eat i onal act i v i t i es on m i cr ob i al b i om as s c ar bon i n soi l 試驗區(qū) T e st z o n e 0 ~ 5 c m 土壤層 0 ~ 5 c m S o il lay e r 5 ~ 1 5 c m 土壤層 5 ~ 1 5 c m S o il lay e r 1 5 ~ 2 5 c m 土壤層 1 5 ~ 2 5 c m S o il lay e r 活動區(qū) A c ti v e z o n e 3 7 6 . 6 177。 案例 8 0500100015002022250035 40 45 50甲基對硫磷010020030040050035 40 45 50西維因0153045607535 40 45 50克百威O / %Kd05001000150020222500 甲基對硫磷0100200300400500 西維因01530456075 克百威H / C / %Kd圖 6 Kd與腐殖酸 O元素含量和 H/C比的相關(guān)性 Fig 6 Correlation of Kd and O content and H/C rate of the humic acids 案例 9 024681012141618201 2 3 4 5 6 7 8 9時間 ( 天 )DO(mg/L)051015202530chl(181。 案例 6 表 3 F r e u n d l i c h 方程擬合的 吸附等溫線回歸 方程 及相關(guān)系數(shù)( R2) T a b le 3 F re u n d li c h r e g re ss io n i so th e rm a n d c o rre latio n c o e f f icie n t ( R2) 表面活性劑濃度( m g/ L ) K n 回歸方程 R2 0 Q = 36C e1. 3927 Q = 72C e1. 0257 Q = 97C e1. 0242 Q = 61C e0. 9835 在下表中,將回歸方程的可決系數(shù)誤稱為 “ 相關(guān)系數(shù) ” 。 案例 4 ? HA對有機農(nóng)藥甲基對硫磷、西維因、克百威的吸附等溫線見圖3,用線性吸附方程擬合甲基對硫磷、西維因和克百威的吸附等溫線,擬合結(jié)果見表 3??傊?, Pb對金盞菊根部積累 Cd有抑制作用,而 Cd對金盞菊地上部吸收 Pb有抑制作用,對根部積累 Pb有促進作用。 ? Friedman秩方差分析:用于檢驗 3個以上相關(guān)樣本是否來自大小相同的總體。 5 重要的數(shù)理統(tǒng)計學常識 ? 3)均值比較 ? d)比較多個來自非正態(tài)分布總體的樣本均值的檢驗方法: ? KruskalWallis檢驗:該方法基于順序變量設計,用于檢驗 3個以上獨立樣本是否來自大小相同的總體,是應用最廣泛的非參數(shù)檢驗方法。 ? 對于將因子作為固定處理(而不是隨機變量)的情形,即模型 1單因子方差分析,實際上可以看作比較 2個總體均值的 t檢驗的直接推廣。 5 重要的數(shù)理統(tǒng)計學常識 ? 3)均值比較 ? c) 比較 2個獨立總體大小的非參數(shù)檢驗 ? 適用于對 2個順序變量的大小進行比較或?qū)?2個不服從正態(tài)分布的數(shù)值變量的大小進行比較 ? “ MannWhitney U” 檢驗 :適合樣本量較大的樣本。 6 重要的數(shù)理統(tǒng)計學常識 ? 3) 均值比較 ? a)將樣本均值與某一特定值相比: t檢驗(參數(shù)檢驗) ? 原假設:總體均值與特定值無顯著差異 ? 前提:樣本來自正態(tài)分布的總體 ? 雙側(cè)檢驗:是否等于。此檢驗無單尾、雙尾之分。 單側(cè)檢驗與雙側(cè)檢驗 ? 在統(tǒng)計軟件中,可通過選擇 Test of Significance選項來控制所輸出的相伴概率是單尾( 1 tailed)概率還是雙尾( 2 tailed )概率。 單側(cè)檢驗與雙側(cè)檢驗 ? 以下是 SPSS 中的單樣本 t檢驗輸出結(jié)果: ? OneSample Test(原假設:儲戶 1次平均存取的現(xiàn)金與 2022元無顯著差異) ? Test Value=2022(均值比較的參比值) ? t=(檢驗統(tǒng)計量的觀測值 ) ? df=312(自由度,樣本量 N=313) 單側(cè)檢驗與雙側(cè)檢驗 ? 以下是 SPSS 中的單樣本 t檢驗輸出結(jié)果: ? df=312(自由度,樣本量 N=313) ? Sig.(2tailed)=(雙側(cè)相伴概率 p ) ? Mean Difference=(均值的標準誤差) ? 95% Confidence Interval of the Difference(總體均值與原假設值之差的 95%的置信區(qū)間) :~(有 95%的把握可認為:儲戶 1次平均存取的金額為 ~) 單側(cè)檢驗與雙側(cè)檢驗 ? 上述檢驗屬 “均值比較”,是雙側(cè)檢驗(大于或小于 2022元都算拒絕原假設),計算的相伴概率也是雙側(cè)的。 ? 在用 “查表法”進行統(tǒng)計推斷時,基于單側(cè)小概率事件檢驗的臨界值表稱“單尾表”,基于雙側(cè)小概率事件檢驗的臨界值表稱“雙尾表”。本文不對第 2)條承擔責任。 有關(guān)相關(guān)分析的斷語 ? 1)顯著和不顯著:描述相關(guān)關(guān)系是否存在。 ? 此外,在論文中常常用“顯著相關(guān)”和“極顯著相關(guān)”來描述相關(guān)分析結(jié)果,即認為 p值小于 是顯著相關(guān)關(guān)系(或顯著相關(guān)),小于 顯著相關(guān)關(guān)系(或極顯著相關(guān))。 顯著性水平:舉例 ? 在描述相關(guān)分析結(jié)果時常有的失誤是:僅給出相關(guān)系數(shù)的值,而不給出顯著性水平。 顯著性水平:舉例 ? 在正態(tài)分布檢驗時,原假設是“樣本數(shù)據(jù)來自服從正態(tài)分布的總體”。否則,可接受原假設。人們通常查閱各類假設檢驗的臨界值表進行統(tǒng)計推斷。相反,如果 p值大于事先已確定的 α 值,就不能拒絕原假設。因此,在報告統(tǒng)計分析結(jié)果時,必須給出 α值。 顯著性水平:通常的取值 ?α值一般在進行假設檢驗前由研究者根據(jù)實際的需要確定。 ?顯著性水平是在原假設成立時檢驗統(tǒng)計量的制落在某個極端區(qū)域的概率值。 假設檢驗 ? 進行統(tǒng)計推斷 – 依據(jù)預先確定的 “顯著性水平” (即 α值),如 ,決定是否拒絕原假設。 ?所設計的檢驗統(tǒng)計量一般服從或近似服從某種已知的理論分布(如 t分布、 F分布、卡方分布),易于估算其取值概率。 接受或拒絕原假設的依據(jù) 小概率事件不可能發(fā)生。 ? 問題在于,對于自變量是普通變量(即其取值有確定性的變量)、因變量為隨機變量的模型 Ⅰ 回歸分析, 2個變量之間的“相關(guān)性”概念根本不存在,又何談“相關(guān)系數(shù)”呢? 4 相關(guān)分析與回歸分析的區(qū)別 ? 11)更值得注意的是,一些早期的教科書不是用R2來描述回歸效果(擬合程度,擬合度)的,而是用 Pearson積矩相關(guān)系數(shù)來描述。 4 相關(guān)分析與回歸分析的區(qū)別 ? 9)如果是模型 Ⅰ 回歸分析,就根本不可能回答變量的“相關(guān)性”問題, 因為普通變量與隨機變量之間不存在“相關(guān)性”這一概念 (問題在于,大多數(shù)的回歸分析都是模型 Ⅰ 回歸分析?。? ? 6)如果自變量是普通變量,即模型 Ⅰ 回歸分析,采用的回歸方法就是最為常用的最小二乘法。 3)相關(guān)分析的目的在于檢驗兩個隨機變量的共變趨勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預測因變量的值。然而,由于這 2種數(shù)理統(tǒng)計方法在計算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這2種數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究者不能嚴格區(qū)分相關(guān)分析與回歸分析 。 3 相關(guān)分析:相關(guān)系數(shù)的選擇 ?對于數(shù)值變量,相關(guān)系數(shù)選擇的依據(jù)是變量是否服從正態(tài)分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。 3 相關(guān)分析:相關(guān)系數(shù)的選擇 ? 在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提條件的。此時,可用中位數(shù)來描述變量的大小特征。 ? 在這種情況下,可通過假設檢驗來判斷隨機變量是否服從對數(shù)正態(tài)分布。 ?何時用算術(shù)平均值?何時用幾何平均值?以及何時用中位數(shù)? 這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機變量的分布特征確定 。 ?2)均值對應于隨機變量總體的數(shù)學期望 — 總體的數(shù)學期望客觀上決定著樣本的均值,反過來,通過計算樣本的均值可以描述總體的數(shù)學期望。由此可見,SPSS和 SAS軟件已被各領域研究者普遍認可。 此外,還有 BMDP和 STATISTICA等 ?? 。 ?出于對工作效率以及對算法的通用性、可比性的考慮,一些學術(shù)期刊要求采用專門的數(shù)理統(tǒng)計軟件進行統(tǒng)計分析。所以,數(shù)理統(tǒng)計方法是否正確應是學術(shù)期刊編輯和極為重視的問題。 數(shù)理統(tǒng)計問題的重要性 ?在科學研究中,經(jīng)常會涉及到對隨機變量大小 、 離散 及分布特征的描述以及對 2個或多個隨機變量之間的關(guān)系描述問題。 ?已經(jīng)掌握最基本的數(shù)理統(tǒng)計學常識,如概率、假設檢驗、均值、方差、標準差、正態(tài)分布、相關(guān)分析、回歸分析、方差分析 ?? 。 ?在科學研究中,能否正確使用各種數(shù)理統(tǒng)計方法關(guān)系到所得出結(jié)論的客觀性和可信性。 ?在進行統(tǒng)計分析時,盡管可以自行編寫計算程序,但在統(tǒng)計軟件很普及的今天,這樣做是毫無必要的。 1 統(tǒng)計軟件的選擇 ?目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商業(yè)軟件很多,比較著名有 SPSS(Statistical Package for Social Sciences)和 SAS(Statistical Analysis System)。 1 統(tǒng)計軟件的選擇 ?目前,國際學術(shù)界有一條不成文的約定:凡是用SPSS和 SAS軟件進行統(tǒng)計分析所獲得的結(jié)果,在國際學術(shù)交流中不必說明具體算法。 均值的計算 :理論問題 ?1)均值(準確的稱呼應為“樣本均值”)的統(tǒng)計學意義:反映隨機變量樣本的大小特征。顯然,這種做法是不嚴謹?shù)?—— 不一定總是正確的 均值計算:技術(shù)問題 ?在數(shù)理統(tǒng)計學中,作為描述隨機變量樣本的總體大小特征的統(tǒng)計量有算術(shù)平均值、幾何平均值和中位數(shù)等多個。 均值計算:技術(shù)問題(續(xù)) ? 如果所研究的隨機變量不服從正態(tài)分布,則算術(shù)平均值不能準確反映該變量的大小特征。 均值計算:技術(shù)問題(續(xù)) ? 如果隨機變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計學知識,尚無合適的統(tǒng)計量描述該變量的大小特征。 3 相關(guān)分析 :相關(guān)系數(shù)的選擇 ?Pearson 積矩相關(guān)系數(shù)可用于描述 2個隨機變量的線性相關(guān)程度, Spearman或 Kendall秩相關(guān)系數(shù)用來判斷兩個隨機變量在二維和多維空間中是否具有某種共變趨勢。只有計算 Pearson 積矩相關(guān)系數(shù)的前提不存在時,才考慮退而求其次,計算專門為秩變量設計的 Spearman或Kendall秩相關(guān)系數(shù)(盡管這樣做會導致檢驗功效的降低)。 4 相關(guān)分析與回歸分析的區(qū)別 ? 相關(guān)分析和回歸分析是極為常用的 2種數(shù)理統(tǒng)計方法,在社會科學研究領域有著廣泛的用途。 4 相關(guān)分析與回歸分析的區(qū)別 2)相關(guān)分析與回歸分析均為研究 2個或多個變量間關(guān)聯(lián)性的方法,但 2種數(shù)理統(tǒng)計方法存在本質(zhì)的差別,即它們用于不同的研究目的。 4 相關(guān)分析與回歸分析的區(qū)別 ? 5)對于回歸分析,其中的因變量肯定為隨機變量(這是回歸分析方法本身所決定的),而自變量則可以是普通變量(有確定的取值)也可以是隨機變量。 4 相關(guān)分析與回歸分析的區(qū)別 8)顯然,對于回歸分析,如果是模型 Ⅱ 回歸分析,鑒于兩個隨機變量客觀上存在“相關(guān)性”問題,只是由于回歸分析方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系的準確的檢驗手段,因此,若以預測為目的,最好不提“相關(guān)性”問題;若 以探索兩者的“共變趨勢” 為目的,應該改用相關(guān)分析。因此,這極易使們錯誤地理解 R2的含義,認為 R2就是 “相關(guān)系數(shù)”或“相關(guān)系數(shù)的平方”。 ?假設檢驗中的關(guān)鍵問題: 1)在原假設成立的情況下,如何計算樣本值或某一極端值發(fā)生的概率? 2)如何界定小概率事件? 假設檢驗 基本思路 首先,對總體參數(shù)值提出假設(原假設);然后,利用樣本數(shù)據(jù)提供的信息來驗證所提出的假設是否成立(統(tǒng)計推斷) —— 如果樣本數(shù)據(jù)提供的信息不能證明上述假設成立,則應拒絕該假設;如果樣本數(shù)據(jù)提供的信息不能證明上述假設不成立,則不應拒絕該假設。