freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

隨機(jī)微分方程在數(shù)理金融中的應(yīng)用碩士學(xué)位論文(已改無(wú)錯(cuò)字)

2023-07-23 19:59:38 本頁(yè)面
  

【正文】 二乘擬合,即得到的最小二乘估計(jì)同式(37).而在實(shí)際研究過(guò)程中,密度函數(shù)往往是未知的,那么點(diǎn)列也是未知的,因此我們需要先估計(jì)出密度函數(shù). 如果是帶有兩個(gè)參數(shù)的分布密度函數(shù),記為,則這個(gè)模型就轉(zhuǎn)化為參數(shù)混合模型(312),. Beta分布擬合模型統(tǒng)計(jì)學(xué)家Parker and Rothenberg(1988)指出,區(qū)間上的任何概率分布都可由[21]。因此,統(tǒng)計(jì)學(xué)家Allison等人提出了利用Beta值的密度函數(shù)[22]。如果值的密度函數(shù)可以由個(gè)Beta分布來(lái)擬合,那么它的密度函數(shù)可以表示為: (323)這里的表示參數(shù)為的Beta分布的密度函數(shù),即其中為Beta函數(shù)。易知在模型(323)中,參數(shù)滿足下列條件:再來(lái)看模型(320),即Tang,Ghosal and Roy(2007)[23]提出,在模型的非參數(shù)部分采用Beta分布的混合模型: (324)上式中的為參數(shù)的聯(lián)合分布函數(shù)。從而基于值的密度函數(shù)的模型(320)就可以寫成 (325)下面我們來(lái)研究分析模型(325). 容易知道,當(dāng)參數(shù)的聯(lián)合分布函數(shù)為離散分布且質(zhì)量集中在個(gè)點(diǎn)組成的集合上時(shí),模型(325)就和有限混合模型(323)是相同的。因此可以說(shuō)模型(323)是非參數(shù)模型(325)的一種特殊情形。在多重假設(shè)檢驗(yàn)的研究中,由值的性質(zhì)可知,其密度函數(shù)在區(qū)間上遞減的,且由Beta分布函數(shù)的性質(zhì),我們可以將參數(shù)的聯(lián)合分布函數(shù)的支撐包含在集合中??紤]邊界的特殊情形,當(dāng)時(shí),的密度函數(shù)滿足,從而使得,這就導(dǎo)致了參數(shù)不可辨別。因此只考慮,即限制參數(shù),的支撐包含在集合中的情況[24]。 Beinstein多項(xiàng)式擬合模型本節(jié)將考慮值的非參數(shù)混合模型(320),記. 由前文可知,這個(gè)模型是不可辨別的。為了使之可以辨別,須假定. 進(jìn)一步地講,假設(shè)密度函數(shù)在區(qū)間上連續(xù)且有,則函數(shù)在區(qū)間上連續(xù)且有, 在這樣的前提條件下,如果值的概率密度可以被估計(jì),記為,那么就是的估計(jì)。由上面的討論可知,只要我們能夠估計(jì)出值的概率密度函數(shù),那么的估計(jì)問(wèn)題就迎刃而解。在研究密度函數(shù)的估計(jì)方法時(shí),我們需要考慮邊界效應(yīng)。由維爾斯特拉斯逼近定理可知,閉區(qū)間上的連續(xù)函數(shù)都可以由Beinstein多項(xiàng)式來(lái)逼近,因此值的密度函數(shù)可以由Beinstein多項(xiàng)式逼近的方法來(lái)估計(jì)。令表示參數(shù)為和的二項(xiàng)分布律:的階Beinstein展開(kāi)式為從而得到的第階估計(jì)為其中為密度估計(jì),滿足上式中的為基于樣本值的經(jīng)驗(yàn)分布函數(shù)。選取適當(dāng)?shù)模瑒t的估計(jì)值為 (326) 當(dāng)時(shí),對(duì)于較大的和,有. 因此,當(dāng)成立時(shí),為的合適的估計(jì)。當(dāng)時(shí),這個(gè)估計(jì)可望有較小的方差[25]。 本章小結(jié)本章主要對(duì)參數(shù)混合模型和非參數(shù)混合模型做了詳細(xì)的研究分析。在對(duì)參數(shù)混合模型進(jìn)行研究時(shí),考慮隨機(jī)化檢驗(yàn),分別對(duì)正態(tài)分布混合模型和Beta混合分布模型給出了的計(jì)算方法。針對(duì)兩種不同的分布模型,我們均采用矩估計(jì)的方法給出迭代算法的初值,然后采用基于值的最小二乘估計(jì)得到迭代點(diǎn)列,并利用最小化方法作迭代算法,得到的估計(jì)值。在第四節(jié),我們將參數(shù)混合模型推廣到非參數(shù)的情形,并分別對(duì)最小二乘估計(jì)方法、Beta分布擬合模型、Beinstein多項(xiàng)式擬合模型進(jìn)行了研究討論,得出了相應(yīng)的算法。第4章 錯(cuò)誤發(fā)現(xiàn)率的估計(jì)方法的應(yīng)用 引言隨著科學(xué)技術(shù)的不斷發(fā)展,在實(shí)際的統(tǒng)計(jì)研究過(guò)程中,出現(xiàn)了越來(lái)越多的大型數(shù)據(jù)集合問(wèn)題。在研究巨型數(shù)據(jù)的高維統(tǒng)計(jì)推斷問(wèn)題時(shí),以錯(cuò)誤發(fā)現(xiàn)率為主要特征的非參數(shù)估計(jì)方法為其提供了一個(gè)有效地解決途徑。在微陣列數(shù)據(jù)研究中,往往需要同時(shí)對(duì)數(shù)以千計(jì)的基因數(shù)據(jù)進(jìn)行檢驗(yàn),因此就涉及多重檢驗(yàn)的問(wèn)題,由此產(chǎn)生的多重性問(wèn)題,我們采用控制錯(cuò)誤發(fā)現(xiàn)率(FDR)的方法對(duì)微陣列數(shù)據(jù)進(jìn)行研究。例如在研究基因表達(dá)的差異性試驗(yàn)中,假設(shè)我們挑選了個(gè)差異表達(dá)的基因,其中有個(gè)是真正有差異表達(dá)的,另外有個(gè)其實(shí)是沒(méi)有差異表達(dá)的,也就是說(shuō)是假陽(yáng)性的。在試驗(yàn)中我們希望錯(cuò)誤比例不能超過(guò)某個(gè)預(yù)先設(shè)定的值(比如),在統(tǒng)計(jì)學(xué)意義上,這就等價(jià)于控制FDR不能超過(guò). 微陣列數(shù)據(jù)實(shí)例研究在研究諸如基因表達(dá)的大規(guī)模數(shù)據(jù)時(shí),我們令表示檢測(cè)的基因個(gè)數(shù),表示樣本容量,全體基因表達(dá)數(shù)據(jù)就構(gòu)成了一個(gè)的數(shù)據(jù)矩陣. 通常情況下有。由于基因的個(gè)數(shù)非常大,在對(duì)個(gè)假設(shè)同時(shí)進(jìn)行檢驗(yàn)時(shí),就需要考慮檢驗(yàn)的整體錯(cuò)誤率,這里我們主要關(guān)注檢驗(yàn)中錯(cuò)誤發(fā)現(xiàn)率(FDR)的考察。我們以Hedenfalk等(2001)報(bào)告的一組乳腺癌患者的基因數(shù)據(jù)為例進(jìn)行研究。該數(shù)據(jù)集為15例乳腺癌患者的5361個(gè)基因,包含了兩種不同的基因突變[26]。表41給出了Hedenfalk的乳腺癌微陣列數(shù)據(jù)集,這里(Hedenfalk數(shù)據(jù)中的有效數(shù)據(jù)),.設(shè)次多重假設(shè)檢驗(yàn)的零假設(shè)分別為. 這里,對(duì)應(yīng)的統(tǒng)計(jì)量和值分別記為,其中值的數(shù)據(jù)集由R軟件包中獲取。與第二章的符號(hào)一致,假設(shè)檢驗(yàn)的各種結(jié)果見(jiàn)表42.在假設(shè)檢驗(yàn)中,普遍的做法是用總體錯(cuò)誤率(FWER)來(lái)作為檢驗(yàn)錯(cuò)誤率的控制指標(biāo),然而在微陣列數(shù)據(jù)的研究中,F(xiàn)WER控制就顯得太嚴(yán)格和保守。我們研究的首要問(wèn)題是能否盡可能多地識(shí)別出差異表達(dá)的基因,因此我們采用FDR的控制方法來(lái)進(jìn)行估計(jì)。假設(shè)給定的檢驗(yàn)水平為,BH方法控制FDR的水平為, 其中.對(duì)數(shù)據(jù)作對(duì)數(shù)變換,其中表示患者的基因表達(dá)水平,則對(duì)應(yīng)的檢驗(yàn)統(tǒng)計(jì)量為:上式中的分別表示兩種基因突變患者的第i個(gè)基因的樣本均值(即平均表達(dá)水平),表示對(duì)應(yīng)的樣本方差,. 在樣本容量較大的情況下,由上式計(jì)算出的統(tǒng)計(jì)量服從自由度為的分布,其中但由于在該數(shù)據(jù)集中,樣本容量和比較小,為了方便研究,需要得到樣本容量較大的統(tǒng)計(jì)量,進(jìn)而研究統(tǒng)計(jì)量的分布情況和值,我們考慮采用置換檢驗(yàn)的方法進(jìn)行研究。根據(jù)置換檢驗(yàn)的原理,如果原假設(shè)為真,采用置換檢驗(yàn)的方法就可以得到適合多重檢驗(yàn)的統(tǒng)計(jì)量,從而可以得到統(tǒng)計(jì)量的精確分布。過(guò)程如下:(1) 引入向量,其取值由1到15,對(duì)進(jìn)行無(wú)放回抽樣,就可以得到一個(gè)置換樣本,記得到的重抽樣樣本為,具體結(jié)果見(jiàn)表43;(2) 對(duì)每一個(gè)樣本,計(jì)算統(tǒng)計(jì)量;(3) 對(duì)前兩步重復(fù)1000次,得到;(4) 對(duì)應(yīng)的(圖41)的計(jì)算方法為:。按照給定的檢驗(yàn)標(biāo)準(zhǔn),在原始的3170個(gè)中(P值由R軟件包獲取),有個(gè),在傳統(tǒng)的總體錯(cuò)誤率(FWER)研究中,就算我們假設(shè)這些基因都是沒(méi)有差別的,但由式可知,因此需要控制檢驗(yàn)的多重性,(FDR)進(jìn)行控制研究。由R統(tǒng)計(jì)軟件得到樣本的P值后,將其進(jìn)行排序,并利用BH方法得到, 這里的, 因此由可知,遠(yuǎn)小于總體錯(cuò)誤率(FWER)控制方法所得到的錯(cuò)誤拒絕數(shù),從而說(shuō)明FDR的控制方法比總體錯(cuò)誤率(FWER)控制方法有效,即更少地發(fā)現(xiàn)錯(cuò)誤拒絕[27]。 本章小結(jié)本章以Hedenfalk的乳腺癌微陣列數(shù)據(jù)作為實(shí)例,采用置換方法對(duì)錯(cuò)誤發(fā)現(xiàn)率的方法進(jìn)行了研究,發(fā)現(xiàn)錯(cuò)誤發(fā)現(xiàn)率(FDR)的控制方法所得到的錯(cuò)誤拒絕個(gè)數(shù)遠(yuǎn)小于總體錯(cuò)誤率(FWER)控制方法的錯(cuò)誤拒絕數(shù),從而說(shuō)明FDR的控制方法比總體錯(cuò)誤率(FWER)控制方法有效。結(jié) 論本文主要研究考察了錯(cuò)誤發(fā)現(xiàn)率的在各種參數(shù)模型和非參數(shù)模型下的控制檢驗(yàn)方法,在多重假設(shè)檢驗(yàn)的背景下,我們給出了錯(cuò)誤發(fā)現(xiàn)率的定義,提出利用p值進(jìn)行假設(shè)檢驗(yàn),并在假設(shè)檢驗(yàn)獨(dú)立和相依的情形下對(duì)錯(cuò)誤發(fā)現(xiàn)率的控制方法進(jìn)行了探討。在研究錯(cuò)誤發(fā)現(xiàn)率的控制方法時(shí)我們發(fā)現(xiàn),在處理多重假設(shè)檢驗(yàn)問(wèn)題時(shí),最核心的問(wèn)題是如何估計(jì)真實(shí)零假設(shè)的個(gè)數(shù),因此本文采用經(jīng)驗(yàn)貝葉斯估計(jì)來(lái)估計(jì)它的值。針對(duì)正態(tài)混合分布模型和Beta混合分布模型兩種參數(shù)混合模型,本文采用矩估計(jì)方法和基于p值的最小二乘估計(jì)方法進(jìn)行研究;在研究非參數(shù)混合模型時(shí),分別介紹了最小二乘估計(jì)方法、Beta分布擬合模型和Beinstein多項(xiàng)式擬合模型的方法。文章的最后以Hedenfalk報(bào)告的一組乳腺癌患者的基因數(shù)據(jù)為例進(jìn)行仿真研究,發(fā)現(xiàn)與總體錯(cuò)誤率(FWER)的控制方法相比較,錯(cuò)誤發(fā)現(xiàn)率(FDR)的控制方法更加有效,即更少的發(fā)現(xiàn)錯(cuò)誤拒絕。隨著信息社會(huì)的不斷發(fā)展和進(jìn)步,大規(guī)模的數(shù)據(jù)研究已經(jīng)成為現(xiàn)今統(tǒng)計(jì)學(xué)的一個(gè)重點(diǎn)課題。錯(cuò)誤發(fā)現(xiàn)率的控制方法的確可以很好地控制整體檢驗(yàn)的錯(cuò)誤率,但是隨著數(shù)據(jù)變得越來(lái)越復(fù)雜,大規(guī)模數(shù)據(jù)之間就會(huì)存在這樣或那樣的相依關(guān)系,這就使得研究變得相當(dāng)困難。伴隨著醫(yī)學(xué)的飛速發(fā)展,會(huì)有越來(lái)越多的實(shí)際問(wèn)題等待著統(tǒng)計(jì)學(xué)家的研究與探索,這值得我們期待和解決。參考文獻(xiàn)[1] Benjamini, Y. and Hochberg, Y. (1995). Controlling the false discovery rate: A practical and powerful approach to multiple testing. J. Roy. Statist. Soc. Ser. B 57, 289300.[2] Storey, J. D. and Tibshirani, R. (2003). Statistical significance for genomewide studies. Proc. . Sci. 100, 94409445.[3] Genovese, C. and Wasserman, L. (2002). Operating characteristics and extensions of the false discovery rate procedure. J. R. Stat. Soc. Ser. B 64, 499517.[4] Storey, J. D. (2002a). A direct approach to false discovery rates. J. R. Statist. Soc. B 64, 479498.[5] Storey, J. D. (2003). The positive false discovery rate: A Bayesian interpretation and the . Statist. 31, 20132035.[6] Allison, D. B., Gadbury, G. L., Heo, M., Fernandez, J. R., Lee, ., Prolla, T. A. and Weindruch,R. (2002). A mixture model approach for
點(diǎn)擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1