freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

sas系統(tǒng)和數(shù)據(jù)分析典型相關分析-閱讀頁

2024-09-10 20:42本頁面
  

【正文】 及生理指標和訓練指標之間的相關系數(shù)。組內較大的相關是 weight 和 waist的相關系數(shù)為 , chins和 situps的相關系數(shù)為 , situps和 jumps的相關系數(shù)為 。校正值為 ,標準誤差為 ,典型相關系數(shù)的平方( CanRsq)為 。用似然比法檢驗典型相關系數(shù)與零的差別是否顯著,其零假設為小于此對典型變量的典型相關系數(shù)的所有典型相關系數(shù)都為 0,其 p值依次為 , 和 ,在顯著水平取為 , ,說明第一對典型相關系數(shù)具有顯著意義。其余典型相關系數(shù)明顯不顯著。 在 輸出結果表 中,用原指標來線性表達第一對典型變量的系數(shù),即: PHYS1=- + - EXER1=- - + 由于變量 的單位不一致,應考慮標準化的典型系數(shù)。來自訓練指標的第一典型變量在 situps上的系數(shù)最大。因而 wight 為一抑制變量,因為它在典型變量 PHYS1 上的系數(shù)符號( ,負號)與它跟典型變量 PHYS1的相關系數(shù)符號( ,正號)相反。而所有變量與第一典型變量 EXER1 的相關系數(shù)皆為負值( , 和 ),只有變量 jumps的系數(shù)符號與相關符號相反, 表明 jumps 亦為一抑制變量。一個變量成為抑制變量是因為它同典型變量的相關系數(shù)符號與系數(shù)符號相反。一般來說,瘦的人比胖的人起坐次數(shù)( situps)多,而來自訓練指標的典型變量 EXER1 主要與起坐次數(shù)( situps)相關。綜上所述,我們可以通過肥胖性與起坐次數(shù)( situps)的基本相關關系得出體重( wight)和腰圍( waist)與起坐次數(shù)( situps)的基本相關關系。我們考慮簡單的情況,把尋找典型變量的線性7598d14e6a212b8db2b4f9258f0234b1 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 12 of 44 組合,假設用 多元回歸方法產生,即由體重( wight)和腰圍( waist)來預測起坐次數(shù)( situps)。如果固定腰圍( waist)的值,體重( wight)大的人,身高就高,因此人傾向于較瘦,所以預測起坐次數(shù)( situps)應該較大,這樣,體重( wight)在多元回歸中的回歸系數(shù)一定是正值才能使起坐次數(shù) ( situps)增加。綜合結論,第一對典型相關的一般解釋為以體重( wight)和跳躍次數(shù)( jumps)作為抑制變量來增強或減弱腰圍( waist)和起坐次數(shù)( situps)之間的相關。我們略過原始變量的方差分析,而來分析標準化的方差。來自生理指標的標準差被自己的第一個典型變量 PHYS1 解釋的方差比例為 ,而被對方第一個典型變量PHYS1 解釋的方差比例為 。第二對和第三對典型變量實際上沒有對標準差有什么貢獻,因為三個典型變量的累計比例僅為 和 。訓練指標的第一典型變量 EXER1 對生理變量 waist( )有相當好的預測作用,對生理變量 weight( )預測作用較差,而對生理變量 pulse( )幾乎沒有預測作用。 判別分析( Discriminate Analysis)是用以判別個體所屬類體的一種統(tǒng)計方法。 判別分析方法通常要給出一個判別指標 —— 判別函數(shù),同時還要指定一種判別規(guī)則。否則,將采用不基于任何分布假設的非參數(shù)方法。設有 k 個組 kGGG , 21 ? ,且組 iG 的概率密度為)(xfi ,樣品 x 來自組 iG 的先驗概率為 kipi ,2,1, ?? ,滿足 11 ???ki ip ,那么根據(jù)貝葉斯理論,樣品 x 屬于組 iG 的后驗概率為: 7598d14e6a212b8db2b4f9258f0234b1 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 14 of 44 ? ?? ki iiiii xfp xfpxGp 1 )()()|( () 如果假設每組內 p 維樣品 x 分布為 p 元正態(tài)分布情況,則有: kiNG iipi ?,2,1),(~ ??? () 其中, i? 和 i? 分別是第 i 組的均值和協(xié)方差陣。將式()代入式 ()可得: ? ?? ?? ?? ???????????????ki iiiiki iiiiiiiiiGxDGxDGxdpGxdpxGp12212/122/12),( x p),( x p),( x p),( x p)|( () 其中: iiii hgxdxD ??? )()( 22 () 為從樣品 x 至第 i 組的廣義平方距離。這種判別哪個樣品歸屬于哪個組的判別準則稱為最大后驗概率準則。 2. 線性判別分析 為簡單起見,我們只考慮兩個總體的情況?,F(xiàn) 在對于一個新的樣品 y ,我們要判斷它來自哪個總體。 那么關鍵的問題是 這里的距離函數(shù)怎么選。即 y 到母體 iG 的距離定義為: )()(),( 1 iii uyVuyGyd ???? ? () 那么: )()2(2),(),( 2112121 uuVuuyGydGyd ??????? ? () 若令: )()2()( 21121 uuVuuyyw ????? ? () 上述判別規(guī)則可寫成: 當 0)( ?yw 時, 1Gy? ;當 0)( ?yw 時, 2Gy? 。 3. 非線性判別分析 如果協(xié)方差不同, 即兩個正態(tài)總體 1G 和 2G 分別服從 ),( 11 VuN 和 ),( 22 VuN 。我們仍然按照樣品至各母體的最近距離歸類。其中: 2,1,)()(),( 1 ????? ? iuyVuyGyd iiii () 那么: 21221111212111121121 )(2)(),(),( uVuuVuuVuVyyVVyGydGyd ?????? ??????????? () 這是一個二次項判別函數(shù)。 可見,當 VVV ?? 21 時,我們得到了線性判別函數(shù),因此使用線性判別函數(shù)判別;當21 VV? 時,我們得到了二次判別函數(shù),因此使用二次判別函數(shù)判別。使用線性判別函數(shù)還是二次判別函數(shù)進行判別分析取決于兩個總體的方差。這樣檢驗 1V 與 2V 是否相等就極為重要了。勃克斯指出 Md)1( ? 近似服從自由度為 f 的卡方 2? 分布,其中: 2/)1( ?? ppf () ? ?16 132211111 22121 ? ?????????? ??????? p ppnnnnd () 如果有 ? ?? ?2/1)1( 2 ??? ppMd ?? ,則在顯著性水平 ? 的意義下,拒絕原假設 H0,而接受備選假設 H1;反之,如果有 ? ?? ?2/1)1( 2 ??? ppMd ?? ,則在顯著性水平 ? 的意義下,接受原假設 H0。 4. 多類判別 對于兩類線性判別及非線性判別,都是求得一個判別函數(shù),對于任一組樣品(或待判別樣品)將其代入判別函數(shù),求得判別得分,再依判別分界點,而決定將其判屬于哪一 類。 設有 g 類 ( 2?g ),每類中有 1n , 2n ,?, gn 組樣品,每組樣品有 p 個指標,并記knnnn ???? ?21 。我們要判別一組待判樣品 ? ??? pXXXX , 21 ?應屬于 g 類中的哪一類。這里均值向量 ??k? 的估計式為: 7598d14e6a212b8db2b4f9258f0234b1 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 18 of 44 ? ? ? ????knikikk XnX11 () 協(xié)方差矩陣 ? 的估計為: )()(1 )(1 1 )( ????? ? ?? ? XXXXgnS kigk ni kii () 其中, ? ???? ??gknikik XnX1 11 。 有兩點值得注意: ① 我們這里的判別函數(shù)和判別規(guī)則并沒有涉及分布的類型,只要二階矩存在就可以了; ② 這種判別規(guī)則符合習慣,但不可能完全判別準確,會發(fā)生誤判。協(xié)方差相同的兩個正態(tài)總體 1G 和2G 的分布分別是 ),( 1 VuN 和 ),( 2 VuN 。如圖 381 所示。誤判概率為圖中陰影部分的面積。 如果利用以上判別準則,對全部 n1+n2 組樣品進行判別,記第一類中的樣 品,而被判入第二類的有 m1個;第二類的而被判入第一類的有 m2 個,則誤判概率可表示為: 222111 /,/ nmPnmP ?? () 六、 Fisher 線性函數(shù)判別 在分類判別問題中,關鍵問題之一是尋找一個合適的判別函數(shù)。在判別分析中, Fisher 準則下的線性判別函數(shù)就是一個只要利用總體的一、二階矩就可求得的判別函數(shù)。設 ijkx 代表第 i 組( ri ,2,1 ?? )中的第 j 個特征( pj ,2,1 ?? )的第 k 個觀察值( ink ?,2,1? )。同樣,我們以兩個總體為例來介紹 Fisher 準則下的線性判別函數(shù),即 2?r 。符號“ *”代表一組,而符號“ +”則代表另一組。若有一個新來的點 ),( 21 pzzzz ?? ,我們就將 z 點畫在圖上,看它是靠近“ *”號近一些還是靠近“ +”號近一些。這其實就是 Fisher 線性判別分析的主要思想。如果 2?p ,則我們便可得到一個如下的線性方程式: pp xaxaxaa ???? ?22110 () 問題的關鍵是如何找出這個最具有鑒別力的線性判別函數(shù)。設 ),( 21 paaaa ??? ,則 xay ?? 。因此,一條第 i 組第 k 個的 p 維觀察數(shù)據(jù)變成了一個投 影點 iky 數(shù)據(jù)。對 SST 進行方差的平方和分解,分成組內方差 SSE 和組間方 差 SSR ,如下所示: SSRSSEyynyySST ri iiirink iki?????? ?? ??? ? 1221 1)()( () 其中, iy 表示第 i 組的均值,即 ii xay ?? ,稱為組內均值。因此,我們應該選的 a ,要能夠使得: m a x)()()(11221 112???????????? ????? ??riiriiiirinkikriiiaVaxaxanyyyynSSESSRi () 達到最大。即表示組與組之間系統(tǒng)因素引起的變異 SSR 比組內隨機因素引起的變異 SSE 達到了最大值,此時才能使不同組之間的鑒別力達到最大。同樣,我們仍以兩個總體為例來求解系數(shù) a 。由公式 ()可得: m a x)( )()(21212121 ???????aVVaauuuua () 事實上,我們只要考慮 k 的一個二次型: 0)()()()()()()()()()()(2)(2121212121212121212121121212212121??????? ??????????? ????????????????????uuVVkaVVuuVVkaVVuuVVuukauuuuakaVVa () 因此: )()()()(4)()(4 2112121212121 uuVVuuaVVaauuuua ??????????? ? () 當且僅當 )()( 21121 uuVVka ??? ?時,等號成立。這樣我們求得的判別函數(shù)為: xuuVVy )()( 21121 ??? ? () 給出判別函數(shù)以后,我們還要給出判別準則。 七、 應注意的幾個問題 ? 判別分析方法首先根據(jù)已知所屬組的樣本給出判別函數(shù),并制定判別規(guī)則,然后再判斷每一個新樣品應屬于哪一組。 ? 從馬氏距離的角度來看 2T 統(tǒng)計量是很直觀的。 ? 判別分析中各種誤判的后果允許看作是相同的,而在假設檢驗中,犯兩類錯誤的后果一般是不同的,通常將犯第一類錯誤的后果看得更嚴重些。從數(shù)據(jù)集中得出的判別準則在discrim 過程的同一個執(zhí)行過程中可應用于第二個數(shù)據(jù)集。 discrim 過程一般由下列語句控制: proc discrim 選項列表 。 by 變量表 。 id 變量 。 testclass 變量 。 testid 變量 。 weight 變量 。 1. proc discrim 語句 選項列表 主要分成有關輸入輸出數(shù)據(jù)集的 2 類
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1