【正文】
計(jì)算出刪除 6, 7, 8, 10四站的信息損失比率分別為: dert = % % % % 平均信息損失為: % 刪除 4個(gè)站的降水量信息仍保留了約 90%,結(jié)果比較令人滿意。 除了以上分析方法以外是否還有其它統(tǒng)計(jì)方法可以分析呢? 如主成分分析法、定義信息熵函數(shù)等。 思考: 熵 (Entropy)是分子熱力學(xué)中的一個(gè)概念,用以描述分子隨機(jī)運(yùn)動(dòng)的無(wú)序程度。分子運(yùn)動(dòng)越是無(wú)序,則熵越大。 在信息論中,此概念被用以衡量隨機(jī)試驗(yàn)得到的信息量的大小。熵越大,信息量越大。 最大熵原理 定義 121( , , . . . , ) l nnn i iiH p p p c p p??? ?其中 c是常數(shù), pi=P{X=xi}, i =1,2,…, n, 一般取 c=1. 不加任何限制,當(dāng) pi=1/n時(shí) , 熵最大。 定義 ( ) ( ) l n ( )H p p x p x d x????? ?假設(shè) X是連續(xù)型隨機(jī)變量, X的密度函數(shù)是 p(x),則 熵函數(shù)定義為: 在方差一定的連續(xù)型概率分布中,以正態(tài)分布的 熵最大; 對(duì)于任何一個(gè)基本對(duì)稱系統(tǒng),其狀態(tài)的概率分布應(yīng)在表征這個(gè)系統(tǒng)狀態(tài)的約束條件下,使這個(gè)分布所定義的熵最大; 性質(zhì) 例 將系統(tǒng)狀態(tài)限制在有限區(qū)間之內(nèi)時(shí),使熵最大的分布是該區(qū)間上的均勻分布。 對(duì)氣象觀測(cè)站問(wèn)題,可以計(jì)算在各觀測(cè)站下的 標(biāo)準(zhǔn)差 σ i的值,定義 pi= σ i/∑ σ j, 或 1 1 2 2( , , ... , ) ( 39。 , ... , 39。 ) m innnL H p p p H p p? ? ?121/i i jjp x x?? ?可以計(jì)算當(dāng)刪除某個(gè)觀測(cè)站,信息熵的變化值。即