【正文】
計算出刪除 6, 7, 8, 10四站的信息損失比率分別為: dert = % % % % 平均信息損失為: % 刪除 4個站的降水量信息仍保留了約 90%,結果比較令人滿意。 除了以上分析方法以外是否還有其它統(tǒng)計方法可以分析呢? 如主成分分析法、定義信息熵函數(shù)等。 思考: 熵 (Entropy)是分子熱力學中的一個概念,用以描述分子隨機運動的無序程度。分子運動越是無序,則熵越大。 在信息論中,此概念被用以衡量隨機試驗得到的信息量的大小。熵越大,信息量越大。 最大熵原理 定義 121( , , . . . , ) l nnn i iiH p p p c p p??? ?其中 c是常數(shù), pi=P{X=xi}, i =1,2,…, n, 一般取 c=1. 不加任何限制,當 pi=1/n時 , 熵最大。 定義 ( ) ( ) l n ( )H p p x p x d x????? ?假設 X是連續(xù)型隨機變量, X的密度函數(shù)是 p(x),則 熵函數(shù)定義為: 在方差一定的連續(xù)型概率分布中,以正態(tài)分布的 熵最大; 對于任何一個基本對稱系統(tǒng),其狀態(tài)的概率分布應在表征這個系統(tǒng)狀態(tài)的約束條件下,使這個分布所定義的熵最大; 性質 例 將系統(tǒng)狀態(tài)限制在有限區(qū)間之內時,使熵最大的分布是該區(qū)間上的均勻分布。 對氣象觀測站問題,可以計算在各觀測站下的 標準差 σ i的值,定義 pi= σ i/∑ σ j, 或 1 1 2 2( , , ... , ) ( 39。 , ... , 39。 ) m innnL H p p p H p p? ? ?121/i i jjp x x?? ?可以計算當刪除某個觀測站,信息熵的變化值。即