freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用【精品-ppt】(已修改)

2025-01-29 12:51 本頁面
 

【正文】 數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用 重要假定 ?作者所處理的數(shù)據(jù)屬于隨機變量的特定樣本。 ?作者已經(jīng)掌握最基本的數(shù)理統(tǒng)計學常識,如概率、假設(shè)檢驗、均值、方差、標準差、正態(tài)分布、相關(guān)分析、回歸分析、方差分析 ?? 。 數(shù)理統(tǒng)計問題的重要性 ?在科學研究中,經(jīng)常會涉及到對隨機變量 大小 、 離散 及 分布特征的描述以及對 2個或多個隨機變量之間的 關(guān)系 描述問題。地學、環(huán)境科學研究也不例外 。 ?對隨機變量及隨機變量之間的關(guān)系進行定量描述的數(shù)學工具就是 數(shù)理統(tǒng)計學 。 ?在科學研究中,能否正確使用各種數(shù)理統(tǒng)計方法關(guān)系到所得出結(jié)論的客觀性和可信性。所以, 來稿中使用的數(shù)理統(tǒng)計方法是否正確 應(yīng)是學術(shù)期刊編輯和作者極為重視的問題。 ?目前,國內(nèi)科技期刊對稿件中數(shù)理統(tǒng)計方法問題的重視程度存在差異。 1 統(tǒng)計軟件的選擇 ?統(tǒng)計分析通常涉及大量的數(shù)據(jù),需要較大的計算工作量。 ?在進行統(tǒng)計分析時,盡管作者可以自行編寫計算程序,但在統(tǒng)計軟件很普及的今天,這樣做是毫無必要的。 ?出于對 工作效率 以及對 算法的通用性、可比性的考慮,一些學術(shù)期刊要求作者采用專門的數(shù)理統(tǒng)計軟件進行統(tǒng)計分析。 1 統(tǒng)計軟件的選擇 問題: 作者未使用專門的數(shù)理統(tǒng)計軟件,而采用 Excel這樣的電子表格軟件進行數(shù)據(jù)統(tǒng)計分析。 ?由于電子表格軟件提供的統(tǒng)計分析功能十分有限,只能借助它進行較為簡單的統(tǒng)計分析,故我們不主張作者采用這樣的軟件進行統(tǒng)計分析。 1 統(tǒng)計軟件的選擇 ?目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商業(yè)軟件很多,比較著名有 SPSS(Statistical Package for Social Sciences)和 SAS(Statistical Analysis System)。 此外,還有 BMDP和 STATISTICA等 ?? 。 ?SPSS是專門為社會科學領(lǐng)域的研究者設(shè)計的,但此軟件在自然科學領(lǐng)域也得到廣泛應(yīng)用。 ?BMDP是專門為生物學和醫(yī)學領(lǐng)域研究者編制的統(tǒng)計軟件。 1 統(tǒng)計軟件的選擇 ?目前,國際學術(shù)界有一條不成文的約定:凡是用 SPSS和 SAS軟件進行統(tǒng)計分析所獲得的結(jié)果,在國際學術(shù)交流中不必說明具體算法。由此可見, SPSS和 SAS軟件已被各領(lǐng)域研究者普遍認可。 ?我們建議作者們在進行統(tǒng)計分析時盡量使用這 2個專門的統(tǒng)計軟件。目前,有關(guān)這 2個軟件的使用教程在書店中可很容易地買到。 均值的計算 :理論問題 ?1)均值(準確的稱呼應(yīng)為 “ 樣本均值 ” )的統(tǒng)計學意義:反映隨機變量樣本的大小特征。 ?2)均值對應(yīng)于隨機變量總體的數(shù)學期望 — 總體的數(shù)學期望客觀上決定著樣本的均值,反過來,通過計算樣本的均值可以描述總體的數(shù)學期望。 均值計算:理論問題(續(xù)) ?3)在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經(jīng)常會遇到對相同采樣或相同實驗條件下同一隨機變量的多個不同取值進行統(tǒng)計處理的問題。 ? 4)為找到代表這些觀測值總體大小特征的代表值(統(tǒng)計量,該統(tǒng)計量根據(jù)樣本數(shù)據(jù)算出),多數(shù)作者會不假思索地直接給出算術(shù)平均值和標準差。顯然,這種做法是不嚴謹?shù)?—— 不一定總是正確的 均值計算:技術(shù)問題 ?在數(shù)理統(tǒng)計學中,作為描述隨機變量樣本的總體大小特征的統(tǒng)計量有算術(shù)平均值、幾何平均值和中位數(shù)等多個。 ?何時用算術(shù)平均值?何時用幾何平均值?以及何時用中位數(shù)? 這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機變量的分布特征確定 。 均值計算:技術(shù)問題(續(xù)) ?反映隨機變量總體大小特征的統(tǒng)計量是數(shù)學期望,而在隨機變量的分布服從正態(tài)分布時,其數(shù)學期望就可以用樣本的算術(shù)平均值描述。此時,可用樣本的 算術(shù)平均值 描述隨機變量的大小特征。 ?如果所研究的隨機變量不服從正態(tài)分布,則算術(shù)平均值不能準確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢驗來判斷隨機變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正態(tài)分布,則幾何平均值就是數(shù)學期望的值。此時,就可以計算變量的 幾何平均值 。 ?如果隨機變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計學知識,尚無合適的統(tǒng)計量描述該變量的大小特征。此時,可用 中位數(shù) 來描述變量的大小特征。 3 相關(guān)分析 :相關(guān)系數(shù)的選擇 ?在相關(guān)分析中,作者們常犯的錯誤是:簡單地計算Pearson 積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗結(jié)果,也往往不明確指出所計算的相關(guān)系數(shù)就是 Pearson 積矩相關(guān)系數(shù)。 ?在數(shù)理統(tǒng)計學中,除有針對數(shù)值變量設(shè)計的 Pearson 積矩相關(guān)系數(shù)(對應(yīng)于 “ 參數(shù)方法 ” )外,還有針對順序變量(即 “ 秩變量 ” )設(shè)計的 Spearman秩相關(guān)系數(shù)和 Kendall秩相關(guān)系數(shù)(對應(yīng)于 “ 非參數(shù)方法 ” )等。 ? Pearson 積矩相關(guān)系數(shù)可用于描述 2個隨機變量的線性相關(guān)程度, Spearman或 Kendall秩相關(guān)系數(shù)用來判斷兩個隨機變量在二維和多維空間中是否具有某種共變趨勢。 3 相關(guān)分析:相關(guān)系數(shù)的選擇 ? 在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提條件的。 ? 在相關(guān)分析中,對于秩變量,一般別無選擇,只能計算 Spearman或 Kendall秩相關(guān)系數(shù)。 ? 對于數(shù)值變量,只要條件許可,應(yīng)盡量使用 檢驗功效最高 的參數(shù)方法,即計算用 Pearson 積矩相關(guān)系數(shù)。只有計算 Pearson 積矩相關(guān)系數(shù)的前提不存在時,才考慮退而求其次,計算專門為秩變量設(shè)計的 Spearman或 Kendall秩相關(guān)系數(shù)( 盡管這樣做會導(dǎo)致檢驗功效的降低 )。 3 相關(guān)分析:相關(guān)系數(shù)的選擇 ?對于數(shù)值變量,相關(guān)系數(shù)選擇的依據(jù)是變量是否服從正態(tài)分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。 ?對于二元相關(guān)分析,如果 2個隨機變量服從二元正態(tài)分布假設(shè),則應(yīng)該用 Pearson 積矩相關(guān)系數(shù)描述這 2個隨機變量間的相關(guān)關(guān)系。 ?如果樣本數(shù)據(jù)不服從二元正態(tài)分布,則可嘗試進行數(shù)據(jù)變換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以針對變換后的數(shù)據(jù)計算 Pearson 積矩相關(guān)系數(shù);否則,就不能計算 Pearson 積矩相關(guān)系數(shù),而應(yīng)改用檢驗功效較低的 Spearman或 Kendall秩相關(guān)系數(shù)(此時,如果強行計算 Pearson 積矩相關(guān)系數(shù)有可能會得出完全錯誤的結(jié)論)。 4 相關(guān)分析與回歸分析的區(qū)別 ? 相關(guān)分析和回歸分析是極為常用的 2種數(shù)理統(tǒng)計方法,在環(huán)境科學及其它科學研究領(lǐng)域有著廣泛的用途。然而,由于這 2種數(shù)理統(tǒng)計方法在計算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這 2種數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究者不能嚴格區(qū)分相關(guān)分析與回歸分析 。 4 相關(guān)分析與回歸分析的區(qū)別 1)最常見的錯誤是 :用回歸分析的結(jié)果解釋相關(guān)性問題。例如,作者將 “ 回歸直線(曲線)圖 ” 稱為 “ 相關(guān)性圖 ” 或 “ 相關(guān)關(guān)系圖 ” ;將回歸直線的 R2(擬合度,或稱 “ 可決系數(shù) ” )錯誤地稱為 “ 相關(guān)系數(shù) ” 或 “ 相關(guān)系數(shù)的平方 ” ;根據(jù)回歸分析的結(jié)果宣稱 2個變量之間存在正的或負的相關(guān)關(guān)系。 4 相關(guān)分析與回歸分析的區(qū)別 2)相關(guān)分析與回歸分析均為研究 2個或多個變量間關(guān)聯(lián)性的方法,但 2種數(shù)理統(tǒng)計方法存在本質(zhì)的差別,即它們用于不同的研究目的。 3)相關(guān)分析的目的在于檢驗兩個隨機變量的共變趨勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預(yù)測因變量的值。 4 相關(guān)分析與回歸分析的區(qū)別 4)在相關(guān)分析中,兩個變量必須同時都是隨機變量,如果其中的一個變量不是隨機變量,就不能進行相關(guān)分析。這是相關(guān)分析方法本身所決定的。 4 相關(guān)分析與回歸分析的區(qū)別 5)對于回歸分析,其中的因變量肯定為隨機變量(這是回歸分析方法本身所決定的),而自變量則可以是普通變量(有確定的取值)也可以是隨機變量。 4 相關(guān)分析與回歸分析的區(qū)別 6)如果自變量是普通變量,即模型 Ⅰ 回歸分析,采用的回歸方法就是最為常用的最小二乘法。 7)如果自變量是隨機變量, 即模型 Ⅱ 回歸分析,所采用的回歸方法與計算者的目的有關(guān)。 ?在以預(yù)測為目的的情況下,仍采用 “ 最小二乘法 ”(但精度下降 — 最小二乘法是專為模型 Ⅰ 設(shè)計的,未考慮自變量的隨機誤差); ?在以估值為目的(如計算可決系數(shù)、回歸系數(shù)等)的情況下,應(yīng)使用相對嚴謹?shù)姆椒ǎㄈ?“ 主軸法 ” 、“ 約化主軸法 ” 或 “ Bartlett法 ” )。 4 相關(guān)分析與回歸分析的區(qū)別 8)顯然,對于回歸分析,如果是模型 Ⅱ 回歸分析,鑒于兩個隨機變量客觀上存在 “ 相關(guān)性 ” 問題,只是由于回歸分析方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系的準確的檢驗手段,因此,若以預(yù)測為目的,最好不提 “ 相關(guān)性 ” 問題; 若以探索兩者的 “ 共變趨勢 ” 為目的 ,應(yīng)該改用相關(guān)分析。 9)如果是模型 Ⅰ 回歸分析,就根本不可能回答變量的 “ 相關(guān)性 ” 問題, 因為普通變量與隨機變量之間不存在 “ 相關(guān)性 ”這一概念 (問題在于,大多數(shù)的回歸分析都是模型 Ⅰ 回歸分析?。4藭r,即使作者想描述 2個變量間的 “ 共變趨勢 ” 而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而使分析結(jié)果毫無意義。 4 相關(guān)分析與回歸分析的區(qū)別 10)需要特別指出的是,回歸分析中的 R2在數(shù)學上恰好是Pearson積矩相關(guān)系數(shù) r的平方。因此,這極易使作者們錯誤地理解 R2的含義,認為 R2就是 “ 相關(guān)系數(shù) ” 或 “ 相關(guān)系數(shù)的平方 ” 。問題在于,對于自變量是普通變量(即其取值有確定性的變量)、因變量為隨機變量的模型 Ⅰ 回歸分析,2個變量之間的 “ 相關(guān)性 ” 概念根本不存在,又何談 “ 相關(guān)系數(shù) ” 呢? 11)更值得注意的是,一些早期的教科書作者不是用 R2來描述回歸效果(擬合程度,擬合度)的,而是用 Pearson積矩相關(guān)系數(shù)來描述。這就更容易誤導(dǎo)讀者。 5 重要的數(shù)理統(tǒng)計學常識 假設(shè)檢驗 基本思想 ?統(tǒng)計推斷 :是根據(jù)樣本數(shù)據(jù)推斷總體特征的一種方法。 ?假設(shè)檢驗: 是進行 統(tǒng)計推斷 的途徑之一(另一種途徑是參數(shù)估計,如點估計和區(qū)間估計)。 ?假設(shè)檢驗中的關(guān)鍵問題 : 1)在原假設(shè)成立的情況下,如何計算樣本值或某一極端值發(fā)生的概率? 2)如何界定小概率事件? 假設(shè)檢驗 基本思路 首先,對總體參數(shù)值提出假設(shè)(原假設(shè));然后,利用樣本數(shù)據(jù)提供的信息來驗證所提出的假設(shè)是否成立(統(tǒng)計推斷) —— 如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)成立,則應(yīng)拒絕該假設(shè);如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)不成立,則不應(yīng)拒絕該假設(shè)。 接受或拒絕原假設(shè)的依據(jù) 小概率事件不可能發(fā)生。顯然,這樣做是有風險的(小概率事件真的發(fā)生了)。 假設(shè)檢驗 基本步驟 ? 1)提出原假設(shè)(或稱 “ 零假設(shè) ” , H0); ? 2)選擇檢驗統(tǒng)計量; ? 3)根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值的發(fā)生概率(相伴概率, p); ? 4)根據(jù)給定的小概率事件界定標準(顯著性水平,如 , )做出統(tǒng)計推斷。 假設(shè)檢驗 基本步驟:為什么要設(shè)計并計算檢驗統(tǒng)計量? ?在假設(shè)檢驗中,樣本值(或更極端的取值)發(fā)生的概率不能直接通過樣本數(shù)據(jù)計算,而是通過計算 檢驗統(tǒng)計量觀測值 的發(fā)生概率而間接得到的。 ?所設(shè)計的檢驗統(tǒng)計量一般服從或近似服從某種已知的理論分布(如 t分布、 F分布、卡方分布),易于估算其取值概率。 ?對于不同的假設(shè)檢驗和不同的總體,會有不同的選擇檢驗統(tǒng)計量的理論和方法 。 假設(shè)檢驗 基本步驟:計算檢驗統(tǒng)計量觀測值的發(fā)生概率 在假定原假設(shè)成立的前提下,利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值發(fā)生的概率(即 p值,又稱“ 相伴概率 ” — 指該檢驗統(tǒng)計量在某個特定的極端區(qū)域在原假設(shè)成立時的概率)。該概率值間接地給出了在原假設(shè)成立的條件下樣本值(或更極端值)發(fā)生的概率。 假設(shè)檢驗 ? 進行統(tǒng)計推斷 ? 依據(jù)預(yù)先確定的 “ 顯著性水平 ” (即 α值),如 ,決定是否拒絕原假設(shè)。 ? 如果 p值小于 α值,即認為原假設(shè)成立時檢驗統(tǒng)計量觀測值的發(fā)生是小概率事件,則拒絕原假設(shè)。否則,就接受原假設(shè)。 顯著性水平:概念與意義 ?在假設(shè)檢驗中, 顯著性水平( Significant level, 用α表示)的確定是假設(shè)檢驗中至關(guān)重要的問題。 ?顯著性水平是在原假設(shè)成立時檢驗統(tǒng)計量的制落在某個極端區(qū)域的概率值。因此,如果取 α= ,如果計算出的 p值小于 α ,則可認為原假設(shè)是一個不可能發(fā)生的小概率事件。當然,如果真的發(fā)生了,則犯錯誤的可能性為 5%。 顯然,顯著性水平反映了拒絕某一原假設(shè)時所犯錯誤的可能性,或者說, α是指拒絕了事實上正確的原假設(shè)的概率。 顯著性水平:通常的取值 ?α值一般在進行假設(shè)檢驗前由研究者根據(jù)實際的需要確定。 ?常用的取值是 。對于前者,相當于在原假設(shè)事實上正確的情況下,研究者接受這一假設(shè)的可能性為 95%;對于后者,則研究者接受事實上正確的原假設(shè)的可能性為 99%。 ?顯然,降低 α值
點擊復(fù)制文檔內(nèi)容
教學課件相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1