【正文】
k k k k kn n n ny y k k k kk k k kx x y ynnL x x x x x nxnL x x y y x y x y x y nx ynL y y y y y nyn??? ? ? ?? ? ? ? ?? ? ? ?? ??? ?? ? ? ? ? ?? ? ? ? ? ? ? ?? ? ? ? ? ???? ? ? ?? ? ? ? ?? ? ? ?不難看出,為使 Q(a,b) 達(dá)到最小,只要取 1 1 12211?()?n n nk k k kxy k k knnxxkkkkn x y x yLbLn x xa y b x? ? ??????? ??????????? ? ???= ,就可以了。而且這時(shí) Q(a,b)達(dá)到最小值 2??( , ) xyyyxxLQ a b LL??。 我們得到的回歸直線為 kx 帶入到此方程,即可得到一個(gè)相應(yīng)的 此值可以看作是 ky的計(jì)算值。 把樣本中的 2xyyyxxnn22k k k kk = 1 k = 1L??Q ( a , b ) = L L? ??= ( y y ) = ( b x + a y )??? ??y = b x + a 我們把 22??( , ) 1 x y x yy y y yx x x x y yLLQ a b L LL L L??? ? ? ?????叫做殘差平方和?;貧w直線就是使殘差平方和達(dá)到最小的那條直線。 ??( , )Q a b??( , )Q a b 越小,說(shuō)明直線回歸越好。這就部分地解決了我們判斷線性回歸好不好的問(wèn)題。 這里還得到一個(gè)副產(chǎn)品: 22??( , ) 1 0 , x y x yy y y yx x x x y yLLQ a b L LL L L??? ? ? ? ?????從而 20 1 , xyx x y yLLL??2x y x x y yL L L? 所以 相關(guān)系數(shù) 1 1 12 2 2 21 1 1 112 2 2 211111( ) ( )n n nk k k kxyk k kn n n nxxyyk k k kk k k knkkknnkkkkx y x yLnrLLx x y ynnx y nx yx nx y ny? ? ?? ? ? ??????? ? ? ???? ? ? ?? ? ? ???? ? ? ???? ? ? ?? ? ? ?? ? ?? ? ? ????== , 可見(jiàn) | | 1r ?|r|越接近于 1,直線回歸越好。 22: ( 1 , 2 )11nF F nr???? 如果 |r|接近于 1, F值就會(huì)比較大。但是如果沒(méi)有線性相關(guān)關(guān)系, F值較大的可能性很小。所以據(jù)此判斷有線性相關(guān)關(guān)系。 事實(shí)上,如果沒(méi)有線性相關(guān)關(guān)系,那么 例:教材 73頁(yè)例一的數(shù)據(jù)。用 Excel計(jì)算: 輸入數(shù)據(jù) 作散點(diǎn)圖:插入 — 圖表 — 散點(diǎn)圖 作回歸方程:激活散點(diǎn)圖 — 點(diǎn)一個(gè)散點(diǎn) — 右鍵 — 添加趨勢(shì)線 — 線性 — 選項(xiàng)卡 — 顯示公式, R平方值 回歸 也可以用計(jì)算器: MODE+2 進(jìn)入回歸狀態(tài) 輸入數(shù)據(jù): SHIFT+KAC(即開(kāi)關(guān)鍵 )開(kāi)始輸入數(shù)據(jù): 95+(xD,yD)(四排一鍵 )++DATA鍵 (最后一鍵 ) 這樣就完成一對(duì)數(shù)的輸入。重復(fù)地輸入所有數(shù)據(jù); SHIFT+A (即 7鍵 ) 給出 a, SHIFT+B (即 8鍵 )給出 b; SHIFT+r(即 9鍵 )給出相關(guān)系數(shù); 輸入一個(gè) x值 +y^鍵 (四排二鍵 )給出對(duì)應(yīng)的 y的預(yù)測(cè)值; 輸入一個(gè) y值 +SHIFT+x^鍵 (四排二鍵 )給出對(duì)應(yīng)的 x的控制值。 第五節(jié) 獨(dú)立性檢驗(yàn) 美國(guó)在殺人犯的死刑判決中存在種族差異 ?一位叫 Radelet的研究人員對(duì)此進(jìn)行了研究。 怎樣研究? 總體:美國(guó)殺人犯 問(wèn)題: A表示殺人犯是白人, B表示被判處死刑。 A,B這兩個(gè)隨機(jī)事件是否獨(dú)立 ? A,B如果獨(dú)立,則 ( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )P A B P A P BP A B P A P BP A B P A P BP A B P A P B?????這些式子用一句話說(shuō)就是: 殺人犯是白人還是黑人和判不判死刑沒(méi)有關(guān)系 我們?cè)鯓觼?lái)判斷這個(gè)言論的對(duì)錯(cuò)呢? 用統(tǒng)計(jì)的方法,估計(jì)上面涉及到的每一個(gè)概率, 看看估計(jì)的結(jié)果和上面的等式之間會(huì)不會(huì)發(fā)生沖突。 所以,首先要抽樣。 在殺人犯中任取 326人,其中 白人 160名,黑人 166名。 結(jié)果發(fā)現(xiàn): 160名白人中有 19人被判死刑, 141人未判死刑; 166名黑人中有 17人被判死刑, 149人未判死刑。 為了便于說(shuō)明,我們把這些數(shù)據(jù)總結(jié)在如下的表格中: 我們先列出上面提到的所有概率的估計(jì)值: ( ) ( ) ( ) :P A B P A P B? 1 1 1 1,n n nn n n???( ) ( ) ( ) :P AB P A P B? 2 1 2 1,n n nn n n???( ) ( ) ( ) :P AB P A P B? 1 2 1 2,n n nn n n???( ) ( ) ( ) :P A B P A P B?? 22 2 2,n n nn n n??? 如果 A,B相互獨(dú)立 ,那么下面各數(shù)都不應(yīng)該太大: 1 1 1 21 1 1 22 1 2 22 1 2 2,.n n n nnnnnn n n nnnnn?? ? ???? ? ?? ? ???? ? ?221 1 1 21 1 1 221 1 1 2222 1 2 22 1 2 22 1 2 2n n n nnnnnn n n nnnn n n nnnnnn n n nnn?? ? ? ??? ? ? ?? ? ? ?? ? ? ?? ? ? ?? ? ? ?? ? ? ?? ? ? ?? ? ? ??? ?? ?? ? ? ?? 英國(guó)統(tǒng)計(jì)學(xué)家 Pearson證明,如果如果 A,B相互獨(dú) 立,那么當(dāng) n趨向于無(wú)窮大時(shí), 2?將是一個(gè) 的隨機(jī)變量。 作為統(tǒng)計(jì)量的 服從自由度為 1的 分布 2?2( 3. 84 1 ) 0. 05P ? ??如果 A,B相互獨(dú)立,則當(dāng) n比較大時(shí),有 2( 5. 02 4) 0. 02 5P ? ??2( 6. 63 5 ) 0. 01P ? ??2 2 23. 84 1 , 5. 02 4 , 6. 63 5? ? ?? ??? ? ??? ?, , 都是小概率事件 所以,如果我們把表里的數(shù)據(jù)代到公式里求出的 2? 大于其中的某個(gè)數(shù),我們就有理由做出 A,B不相互獨(dú)立 的結(jié)論。 在 死刑問(wèn)題里 2 = 0 . 2 2 2?小概率事件沒(méi)有發(fā)生。所以我們沒(méi)有理由否定 A,B相互獨(dú)立 的結(jié)論,認(rèn)為數(shù)據(jù)不能充分說(shuō)明在死刑判決中存在種族差異。 簡(jiǎn)化計(jì)算公式 ? ? ? ?? ? ? ?221 1 1 1 1 2 1 221 1 1 2222 1 2 1 2 2 2 22 1 2 2n n n n n n n nn n n n n nn n n n n n n nn n n n n n??? ? ? ?? ? ? ???????? ? ??? ?? ?? ? ??