freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

隨機微分方程在數(shù)理金融中的應用碩士學位論文-文庫吧資料

2025-06-28 19:59本頁面
  

【正文】 omington, Ind., 1974, Vol. 2。錯誤發(fā)現(xiàn)率的控制方法的確可以很好地控制整體檢驗的錯誤率,但是隨著數(shù)據(jù)變得越來越復雜,大規(guī)模數(shù)據(jù)之間就會存在這樣或那樣的相依關(guān)系,這就使得研究變得相當困難。文章的最后以Hedenfalk報告的一組乳腺癌患者的基因數(shù)據(jù)為例進行仿真研究,發(fā)現(xiàn)與總體錯誤率(FWER)的控制方法相比較,錯誤發(fā)現(xiàn)率(FDR)的控制方法更加有效,即更少的發(fā)現(xiàn)錯誤拒絕。在研究錯誤發(fā)現(xiàn)率的控制方法時我們發(fā)現(xiàn),在處理多重假設(shè)檢驗問題時,最核心的問題是如何估計真實零假設(shè)的個數(shù),因此本文采用經(jīng)驗貝葉斯估計來估計它的值。 本章小結(jié)本章以Hedenfalk的乳腺癌微陣列數(shù)據(jù)作為實例,采用置換方法對錯誤發(fā)現(xiàn)率的方法進行了研究,發(fā)現(xiàn)錯誤發(fā)現(xiàn)率(FDR)的控制方法所得到的錯誤拒絕個數(shù)遠小于總體錯誤率(FWER)控制方法的錯誤拒絕數(shù),從而說明FDR的控制方法比總體錯誤率(FWER)控制方法有效。按照給定的檢驗標準,在原始的3170個中(P值由R軟件包獲取),有個,在傳統(tǒng)的總體錯誤率(FWER)研究中,就算我們假設(shè)這些基因都是沒有差別的,但由式可知,因此需要控制檢驗的多重性,(FDR)進行控制研究。根據(jù)置換檢驗的原理,如果原假設(shè)為真,采用置換檢驗的方法就可以得到適合多重檢驗的統(tǒng)計量,從而可以得到統(tǒng)計量的精確分布。我們研究的首要問題是能否盡可能多地識別出差異表達的基因,因此我們采用FDR的控制方法來進行估計。表41給出了Hedenfalk的乳腺癌微陣列數(shù)據(jù)集,這里(Hedenfalk數(shù)據(jù)中的有效數(shù)據(jù)),.設(shè)次多重假設(shè)檢驗的零假設(shè)分別為. 這里,對應的統(tǒng)計量和值分別記為,其中值的數(shù)據(jù)集由R軟件包中獲取。我們以Hedenfalk等(2001)報告的一組乳腺癌患者的基因數(shù)據(jù)為例進行研究。在試驗中我們希望錯誤比例不能超過某個預先設(shè)定的值(比如),在統(tǒng)計學意義上,這就等價于控制FDR不能超過. 微陣列數(shù)據(jù)實例研究在研究諸如基因表達的大規(guī)模數(shù)據(jù)時,我們令表示檢測的基因個數(shù),表示樣本容量,全體基因表達數(shù)據(jù)就構(gòu)成了一個的數(shù)據(jù)矩陣. 通常情況下有。在微陣列數(shù)據(jù)研究中,往往需要同時對數(shù)以千計的基因數(shù)據(jù)進行檢驗,因此就涉及多重檢驗的問題,由此產(chǎn)生的多重性問題,我們采用控制錯誤發(fā)現(xiàn)率(FDR)的方法對微陣列數(shù)據(jù)進行研究。第4章 錯誤發(fā)現(xiàn)率的估計方法的應用 引言隨著科學技術(shù)的不斷發(fā)展,在實際的統(tǒng)計研究過程中,出現(xiàn)了越來越多的大型數(shù)據(jù)集合問題。針對兩種不同的分布模型,我們均采用矩估計的方法給出迭代算法的初值,然后采用基于值的最小二乘估計得到迭代點列,并利用最小化方法作迭代算法,得到的估計值。 本章小結(jié)本章主要對參數(shù)混合模型和非參數(shù)混合模型做了詳細的研究分析。選取適當?shù)模瑒t的估計值為 (326) 當時,對于較大的和,有. 因此,當成立時,為的合適的估計。由維爾斯特拉斯逼近定理可知,閉區(qū)間上的連續(xù)函數(shù)都可以由Beinstein多項式來逼近,因此值的密度函數(shù)可以由Beinstein多項式逼近的方法來估計。由上面的討論可知,只要我們能夠估計出值的概率密度函數(shù),那么的估計問題就迎刃而解。 Beinstein多項式擬合模型本節(jié)將考慮值的非參數(shù)混合模型(320),記. 由前文可知,這個模型是不可辨別的。考慮邊界的特殊情形,當時,的密度函數(shù)滿足,從而使得,這就導致了參數(shù)不可辨別。因此可以說模型(323)是非參數(shù)模型(325)的一種特殊情形。易知在模型(323)中,參數(shù)滿足下列條件:再來看模型(320),即Tang,Ghosal and Roy(2007)[23]提出,在模型的非參數(shù)部分采用Beta分布的混合模型: (324)上式中的為參數(shù)的聯(lián)合分布函數(shù)。因此,統(tǒng)計學家Allison等人提出了利用Beta值的密度函數(shù)[22]。于是有 即有 (321)令,記 (322) 若函數(shù)是已知的,當時,式(321)的左邊可以由來估計,而右邊中括號里面的部分可以由來估計。記。類似于第二節(jié)那樣,定義并記。與Beta分布混合模型(312)作對比,我們不難發(fā)現(xiàn),模型(320)為模型(312)的非參數(shù)推廣形式。本節(jié)就對統(tǒng)計量的觀測值和值的分布情況加以限制進行研究。同理可證模型(320)中的參數(shù)也是不可辨別的。可以證明在這個沒有條件限制的混合模型中,參數(shù)或是不可辨別的。 非參數(shù)混合模型的估計在第二節(jié)和第三節(jié)中,我們介紹了參數(shù)混合模型,并分別研究了兩種混合模型下的估計方法。,我們可以得到模型(312)的的算法如下:第一步:采用矩估計方法,由方程組(314)得到參數(shù)的估計,即參數(shù)的初值,記為;第二步:令,代入到(317)式中計算點列,;第三步:對于點列,由(37)式得到的最小二乘估計值;第四步:由,解方程組(315),得到參數(shù)的新估計值,記為;第五步:令,重復計算第二步到第四步直至估計值收斂為止。經(jīng)過計算可得從而有 且有,則有 即 (316) 令,記 (317) 容易知道,若參數(shù)已知,當,(316)式的左邊可以由來估計,而右邊中括號的部分可由來估計。定義并記。從而有 其中同理,有令,則有方程組 (315)若已知,則可以由方程組(315)求的參數(shù)的估計值。我們來研究參數(shù)的極大似然估計方法。和上節(jié)相同,我們?nèi)匀徊捎镁毓烙嫹椒ㄇ蟮脜?shù)的初值。再來看模型(312),我們令表示為Beta分布的分布函數(shù),則有與前面所描述的正態(tài)混合模型類似,同樣可以采用最小二乘估計。從而這個算法的具體步驟如下:算法二:第一步:由(34)式得到參數(shù)和的初值和;第二步:令,代入到(311) 式中,計算點列;第三步:對點列作最小二乘估計,由(37) 式得到的新估計值;第四步:利用的最小化求得;第五步:令,重復計算第二步到第四步到估計值收斂為止。定義并記, 其中為給定的檢驗水平,經(jīng)過計算得 從而 (38) (39) 那么,由(38)和(39)式可以得到 (310)其中。那么這個算法的步驟如下:算法一:第一步:采用矩估計方法,由(34)式得到參數(shù)和的估計,即參數(shù)和的初值,記為和;第二步:令,帶入到(36)式中,計算點列;第三步:對點列作最小二乘估計,由(37)式得到新的估計值;第四步:利用的最小化方法,求得;第五步:令,重復計算第二步至第四步,直到估計值收斂為止。于是有,其中表示正態(tài)分布的上側(cè)分位點,為檢驗水平,有。 我們利用基于值的最小二乘估計來研究參數(shù)的估計方法,這里我們只考慮右側(cè)檢驗。從而隨機變量的其密度函數(shù)可以表示為 (33)在這個模型中,參數(shù)是可辨別的,其中是我們要研究的參數(shù),為冗余參數(shù)。假設(shè)統(tǒng)計量在零假設(shè)下服從標準正態(tài)分布,即, 那么為標準正態(tài)分布密度函數(shù),我們把它記為。下面分別研究在正態(tài)混合分布模型和Beta混合分布模型下的估計方法。在模型(31)中,參數(shù)與均是可辨別的,其中表示冗余參數(shù)。當時,統(tǒng)計量的密度函數(shù)記為, 當時,統(tǒng)計量的密度函數(shù)與某個未知的參數(shù)有關(guān),記為. 這里的. 如果固定,統(tǒng)計量的密度函數(shù)就可以表示為 (31)與之相對應的值密度函數(shù)就可以表示為 (32)其中上式中的和分別表示值在零假設(shè)和備擇假設(shè)下的密度函數(shù)。 本章小結(jié)在第一節(jié)中,我們介紹了多重假設(shè)檢驗中錯誤測度的定義,給出了錯誤發(fā)現(xiàn)率的概念;第二節(jié)介紹了P值的定義和性質(zhì);第三節(jié)和第四節(jié)分別介紹了檢驗統(tǒng)計量在獨立情形和相依情形下FDR控制的檢驗方法,第五節(jié)介紹了兩種真實零假設(shè)或比值的估計方法,為后面參數(shù)混合模型的估計方法奠定了基礎(chǔ)。 經(jīng)驗貝葉斯估計在對微陣列數(shù)據(jù)進行研究時,Efron, B. and Tibshirani, R. (2002)[20]提出可采用經(jīng)驗貝葉斯方法來估計FDR. 令表示不同條件下基因表達無差別的概率,則表示基因表達存在差別的概率。由于上式中的未知,我們可以用取代(22)式的,這是因為對,估計值都偏大,于是有其中表示第次對值樣本進行抽樣后,采用(21)式重新計算得到的估計值。而且由可以看出,當增大時,的方差就會增大,這就造成了估計值的不穩(wěn)定性。對,我們記,那么可由下式估計出: (21)由上式可以看出,的取值不同,由(21)式所得到的的估計值就不同,且所得到的估計值都比真實值偏大,這是因為,有 ,從而有 ,上式中的表示備擇假設(shè)下值的密度函數(shù)。 估計基于值在不同假設(shè)條件下的分布差異性,Storey(2002)提出了一種的估計方法,記為估計方法[18]。 真實零假設(shè)的個數(shù)或比值的估計通過上文在獨立情形和相依情形下基于FDR控制的檢驗方法的研究,我們可以知道,在多重假設(shè)檢驗中,如果真實零假設(shè)的個數(shù)或者比值已知,那么就可以根據(jù)檢驗統(tǒng)計量之間相依或者獨立的關(guān)系,采用上文介紹的檢驗方法來控制FDR. 然而在實際研究中,或者往往是未知的,因此,最重要的問題就是如何估計的值,或者等價的估計的值。注:在上述檢驗方法中,如果不存在這樣的,則不拒絕任何原假設(shè)。 :【
點擊復制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1