【正文】
這里將分別推導(dǎo)出非參數(shù)和參數(shù)估計(jì)量的偏差。 中國地質(zhì)大學(xué)(武漢)學(xué)士學(xué)位論文 12 第三章 估計(jì)量的統(tǒng)計(jì)性質(zhì)和窗寬參數(shù)的選取 在本章中主要推導(dǎo)了估計(jì)量的統(tǒng)計(jì)性質(zhì)和討 論窗寬參數(shù)的選取問題。 半?yún)?shù)偏核光滑估計(jì) 在我們求解 模型( 19 ) 時(shí),可 以用參數(shù) H? 來逼近 式中的非 參數(shù)分量? ? ? ? ? ?? ?12, , , Tns s t s t s t? ,其中 H 為 nq? 維矩陣,附加參數(shù) ? 為 1q? 維向量,則模型( 19)變?yōu)椋? L BX H?? ? ??, tXR? , qR?? ( 224) 而式( 224)可以看作為具有附加系統(tǒng)參數(shù)的平差模型,同樣也滿足最小二乘原則: minTV PV ? ( 225) 求解上式,可以得到法方程為: T T TT T TB P B X B P H B P LH P B X H P H H P L??????? ?????? ( 226) 由上式解得 ? ? 1TTX B P B B P L H ???? ???????? ( 227) ? ? 1TTH H H P H H P L B X? ? ?????? ( 228) 在以上式子中: ? ? 1TTTP H H P H H P?? 是投影陣,也稱為帽子矩陣。如果在確定了觀測數(shù)據(jù)樣本和核函數(shù) ??K? 的基礎(chǔ)上,核估計(jì)結(jié)果就主要由窗寬參數(shù) nh 決定。11 ( : ,... ) 1n hn i ni W t t t? ?? ( 22) 滿足以上條件的權(quán)函數(shù)為概率權(quán),由不同的權(quán)函數(shù)形式衍生出不同的估計(jì)方法, 核權(quán)函數(shù)和近鄰權(quán)函數(shù)是最基本的概率密度權(quán)函 數(shù),由此所產(chǎn)生的相應(yīng)的半?yún)?shù)估計(jì)是核估計(jì)和近鄰估計(jì),核估計(jì)和近鄰估計(jì)理論也是基于平差模型的基礎(chǔ)上的, 張松林,柴根象等已對(duì)近鄰估計(jì)的方法進(jìn)行過研究。 權(quán)函數(shù)對(duì)于相應(yīng)變量的空間分布具有較大的影響,在測繪數(shù)據(jù)處理 中,使用比較廣泛的權(quán)函數(shù)有概率密度權(quán)函數(shù)、最小二乘權(quán)函數(shù)、丹麥法權(quán)函數(shù)、 Huber 權(quán)函數(shù)、 Andrews 權(quán)函數(shù)、 Turkey權(quán)函數(shù)、 Hampel 權(quán)函數(shù)以及 IGG 權(quán)函數(shù)等等,當(dāng)然,不同的權(quán)函數(shù)所產(chǎn)生的估計(jì)結(jié)果也就不一樣。 本文所要研究的半?yún)?shù)核估計(jì)理論方法,其模型形式為式 (19)。 參數(shù)平差模型中的函數(shù)形式是已知的,而非參數(shù)平差模型中的回歸函數(shù)是未知的,所以參數(shù)模型只是需求解待定參數(shù)。在統(tǒng)計(jì)領(lǐng)域,關(guān)于半?yún)?shù)模型的估計(jì)問題被認(rèn)為是一個(gè)帶有無窮維多余形狀參數(shù)的歐氏空間的點(diǎn)估計(jì)問題。所以,經(jīng)典的高斯平差模型并沒有從根本上消除觀測數(shù)據(jù)中的誤差,也沒有從本質(zhì)上區(qū)分系統(tǒng)誤差與粗差,當(dāng)平差模型存在系統(tǒng)誤差或者粗差時(shí),經(jīng)典平差模型就會(huì)失去處理數(shù)據(jù)的能力。 Green、 Engle et al 和 Silverman 利用半?yún)?shù)模型相比較參數(shù)模型有明顯的優(yōu)點(diǎn)研究了半?yún)?shù)平差模型在解決觀測量與待估參數(shù)之間的復(fù)雜關(guān)系; Moritz 提出了正則化的數(shù)據(jù)平滑處理方法是為了解決重力測量問題;在美國導(dǎo)航協(xié)會(huì)技術(shù)會(huì)議上, Minghaijia( 20xx)首次提出利用半?yún)?shù)模型中的非參數(shù)分量表示電磁波穿過電離層的系統(tǒng)誤差,分 析 GPS測量中的多路徑效應(yīng)的影響等等;陶本藻( 1997) [23]研得出函數(shù)模型誤差和隨機(jī)模型誤差之間是可以相互轉(zhuǎn)化的,并從理論上研究了模型誤差對(duì)參數(shù)分量的估值是如何影響的;武大測繪學(xué)院的孫海燕、陶本藻、王新洲、張松林、胡宏昌、丁士俊等人把統(tǒng)計(jì)領(lǐng)域的半?yún)?shù)模型應(yīng)用到測量數(shù)據(jù)處理中來:孫海燕( 20xx) [24]將半?yún)?shù)模型引入到測量學(xué)界,并研究了半?yún)?shù)平差模型的相關(guān)算法,證明了半?yún)?shù)平差模型能夠發(fā)現(xiàn)并識(shí)別模型誤差或觀測值中的系統(tǒng)誤差 ,還進(jìn)一步討論了正規(guī)化矩陣半正定時(shí)的計(jì)算方法;吳云( 20xx) [30]利在研究半?yún)?shù)模型中的參數(shù)估計(jì)時(shí)對(duì)正則化矩陣的求解運(yùn)用了數(shù)學(xué)中的三次樣條函數(shù);張松林( 20xx) [26]在基于最小二乘準(zhǔn)則下對(duì)線性半?yún)?shù)模型的一系列估計(jì)理論做了系統(tǒng)分析,同時(shí)也研究了非線性半?yún)?shù)模型中對(duì)參數(shù)分量的估計(jì)值的求解和推導(dǎo)了參數(shù)分量的統(tǒng)計(jì)性質(zhì),并將非線性模型運(yùn)用到實(shí)際問題中 — 提取和分離 GPS 定位中包含的系統(tǒng)誤差;胡宏昌( 20xx) [28]對(duì)于半?yún)?shù)模型中的附有系統(tǒng)參數(shù)的平差模型做了深入研究,解算出半?yún)?shù)模型中非參數(shù)分量的結(jié)果并推導(dǎo)其統(tǒng)計(jì)性質(zhì),對(duì)半?yún)?shù)補(bǔ)償最小二乘法中的關(guān)鍵 問題 — 如何選取正則矩陣 R 和光滑因子 ? 用做了較為系統(tǒng)的研究;潘雄( 20xx) [27]主要研究了半?yún)?shù)補(bǔ)償最小二乘法,計(jì)算出半?yún)?shù)模型中各估計(jì)量的結(jié)果并推導(dǎo)出估計(jì)量統(tǒng)計(jì)性質(zhì)的計(jì)算公式,最后根據(jù)其統(tǒng)計(jì)性質(zhì)判斷出不同平差模型的適用范圍;丁士俊 [25]( 20xx)在參數(shù)回歸診斷方法的基礎(chǔ)上研究了半?yún)?shù)模型的數(shù)據(jù)診斷方法,提出了穩(wěn)健估計(jì)方法并推算出估計(jì)量的基本公式,同時(shí)探討了半?yún)?shù)平差模型中的廣義最小二乘估計(jì),提出了抗差廣義補(bǔ)償最小二乘估計(jì)方法,最后將半?yún)?shù)平差模型應(yīng)用到 GPS 變形分析等問題中;王振杰 (2006)[29]基于不同的正則化參數(shù)和正則化矩陣,對(duì)半?yún)?shù)補(bǔ)償最小二乘法中的不適定問題做了研究。Staniswalis( 1994) [4]、 H228。 半?yún)?shù)偏核光滑估計(jì)量的性質(zhì) ....................................................................... 15 167。and through simulations and parative examples demonstrate that kernel smooth estimation and least squares estimation is effective and feasible in parametric and nonparametric estimation,namely we can estimate the system error. The thesis is divided into five chapters, first chapter mainly describes the research of semiparametric models in the field of statistics and two methods that semiparametric regression model applies in the measurement data processing: Compensation based on least squares method and the epitaxial Forecast Forecast kernel estimation。 在窗寬參數(shù)的選取中,討論了最小均方誤差法和經(jīng)典的 CV 和 GCV 法等等。 半?yún)?shù)核估計(jì)包括偏核光滑估計(jì)、偏殘差估計(jì)、近鄰核估計(jì)、最小二乘核估計(jì)以及NW 核估計(jì)等。半?yún)?shù)模型包含一個(gè)參數(shù)分量和一個(gè)非參數(shù)分量,對(duì)于與觀測值函數(shù)關(guān)系已知部分的參數(shù)采取與最小二乘估計(jì)類似的方法,即將這部分參數(shù)完全參數(shù)化;對(duì)于函數(shù)關(guān)系未知或難以用函數(shù)關(guān)系表達(dá)的因素不采用任何具體函數(shù)表達(dá),而是采用抽象的函數(shù)給與表達(dá),即事先不規(guī)定具體函數(shù)形式,其函數(shù)關(guān)系形式可以任意的,具體應(yīng)用時(shí),根據(jù)實(shí)際情況不同構(gòu)造不同函數(shù),其可以克服參數(shù)和非參數(shù)模型表達(dá)不完善的部分,彌補(bǔ)了參數(shù)模型和非參數(shù)模型的不足,能夠解決許多的實(shí)際問題,具有更強(qiáng)的模型解釋能力和適應(yīng)能力。 第三章主要是推導(dǎo)了半?yún)?shù)核估計(jì)量(即參數(shù)分量和非參數(shù)分量)的統(tǒng)計(jì)性質(zhì),其估計(jì)性質(zhì)包括期望、方差、偏差、均方誤差。將半?yún)?shù)核估計(jì)理論應(yīng)用到平面坐標(biāo)轉(zhuǎn)換,此前,并未有過用核估計(jì)進(jìn)行坐標(biāo)轉(zhuǎn)換,本章通過實(shí)際算例證明了核估計(jì)在高低精度坐標(biāo)系轉(zhuǎn)換之間可以消除系統(tǒng)誤差,取得較高精度。 最小二乘核估計(jì) .............................................................................................. 9 167。所以,半?yún)?shù)模型在測繪領(lǐng)域是一種既有用又充滿挑戰(zhàn)性的理論?;诎?yún)?shù)模型較于參數(shù)模型和非參數(shù)模型不可替代的優(yōu)點(diǎn),半?yún)?shù)模型近幾年來被廣泛地運(yùn)用到工業(yè)、農(nóng)業(yè)、經(jīng)濟(jì)、醫(yī)藥、金融等各種不同領(lǐng)域: 基于半?yún)?shù)統(tǒng)計(jì)模型的中長期電量負(fù)荷預(yù)測應(yīng)用 , 中外股票市場聯(lián)動(dòng)性的非參數(shù)與半?yún)?shù)建模研究 , 中國人口預(yù)測的具有外生變量的半?yún)?shù)回歸模型 等??偠灾S著測量數(shù)據(jù)的復(fù)雜性增加和解算精度要求增高,使得經(jīng)典的平差模型已經(jīng)難以處理現(xiàn)代測繪數(shù)據(jù)。 半?yún)?shù)回歸模型是統(tǒng)計(jì)領(lǐng)域的 一種重要的估計(jì)模型,形式如下,給我們解決上述問題提供了思路: 1111 ????? ???? nnttnn SXBL ( 13) 上式中: S 是表示觀測值 L 函數(shù)關(guān)系中的系統(tǒng)誤差量或者是模型誤差,是關(guān)于參數(shù)個(gè)數(shù) t 的函數(shù),由于數(shù)據(jù)來源的復(fù)雜性,造成了作為模型誤差或系統(tǒng)誤差的 S 的形態(tài)難以用單一的回歸模型進(jìn)行模擬,不能僅僅只用少數(shù)的參數(shù)表示,所以在這個(gè) n 因個(gè)觀測方程中都添加一個(gè)未知量 ( 1, 2 , )iS i n? ,這 n 個(gè)未知量組成的 n 維列向量就是半?yún)?shù)模型中的非參數(shù)分量,這樣的形式比一般的平差模型具有更強(qiáng)的求解最佳估計(jì)量的特性:一是因?yàn)榘雲(yún)?shù)回歸模型克服 了傳統(tǒng)平差模型在處理復(fù)雜數(shù)據(jù)時(shí)的不適應(yīng)性;二是半?yún)?shù)模型與客觀實(shí)際 中國地質(zhì)大學(xué)(武漢)學(xué)士學(xué)位論文 4 更加趨近;三是在已知觀測值 L 和參數(shù)關(guān)系 B 的情況下再運(yùn)用一定準(zhǔn)則對(duì)半?yún)?shù)模型進(jìn)行求解可以分別求出模型中的估計(jì)量即參數(shù)分量 X 、非參數(shù)分量 S 、 ? ,它們分別代表觀測中的真值、系統(tǒng)誤差、偶然誤差。這時(shí)就必須引入新的平 差準(zhǔn)則對(duì)結(jié)果進(jìn)行約束:定義一個(gè)光滑因子 ? 和矩陣 R ,它們在 V 和 S 之間起平衡作用,通過改變 ? 和 R 得出最佳值,具體形式如下: m inTTV P V S R S? ???? ( 17)( 2)基于外延預(yù)測的半?yún)?shù)平差模型,其具體表達(dá)形式為: L BX s? ? ?? 210? ? ? ?? ? ??? ? ( 19) 在上式中:觀測向量 12[ , ,..., ]TnL L L L? 為 1n? 維向量;待估參數(shù) 12[ , ,..., ]TtX X X X? 為1t? 維向量;模型非參數(shù)部分 12[ , ,..., ]Tns s s s? 為 1n? 維向量,由于它可以表達(dá)出與觀測值函數(shù)關(guān)系不確定的因素部分,對(duì)觀測值進(jìn)行部分調(diào)整,其擬合程度更加精確,使得最終平差值與真實(shí)值很接近。 將半?yún)?shù)回歸模型同核估計(jì)理論相結(jié)合并應(yīng)用到測繪領(lǐng)域,是一種全新的測量平差方法,雖然目前不管在理論研究還是實(shí)際應(yīng)用方面都研究得較少,但是也取得了許多的成就:丁士俊 [25]將詳細(xì)分析了偏核光滑估計(jì)和偏殘差核估計(jì)方法,并對(duì)兩種方法的估計(jì)性能和效果進(jìn)行了對(duì)比分析;張松林 [26]解算出最小二乘核估計(jì)的非參數(shù)分量和參數(shù)分量的公式,對(duì)參數(shù)分量的估計(jì)結(jié)果的有偏性和漸近正態(tài)性進(jìn)行了證明;潘雄 [32]用半?yún)?shù)模型中的非參數(shù)分量來 模擬 系統(tǒng)誤差 , 提 出 了處理 測量中系統(tǒng)誤差 的一種新方法 等等。窗口參數(shù) nh 0 為常數(shù),稱為窗寬,它是與樣本容量 n 有關(guān)的一列正實(shí)數(shù),并且當(dāng) n?? 時(shí), 0nh? 。 。除上述核估計(jì)之外,還有其他形式的核權(quán)函數(shù): 中國地質(zhì)大學(xué)(武漢)學(xué)士學(xué)位論文 8 )(iWtS =ikni i LtW )(?=nh1iniik Lh ttK )(1??? ( 25) )(iWtS =ikni i LtW )(?=iikiini LhttKhtt )()( 12?? ??? ( 26) 在核估計(jì)中,如何確定核函數(shù) ()K? , 一般要考慮實(shí)際應(yīng)用情況, ()K? 是定義在 R 上的概率密度函數(shù),一般為以下九種函數(shù): 1 1/ 2() 0Kx ???? ? ?? ?11xx?? ( 27) 2 1() 0xKx ????? ? ?? ?11xx?? ( 28) 23 21( ) e