freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

統(tǒng)計學(xué)判別分析-文庫吧

2025-07-17 11:10 本頁面


【正文】 為相應(yīng)的百分比)。 ? 下面一半( Cross validated)是對每一個觀測值,都用缺少該觀測的全部數(shù)據(jù)得到的判別函數(shù)來判斷的結(jié)果。 ? 這里結(jié)果是 100%正確,但一般并不一定。 ? 如果就用這個數(shù)據(jù) , 但不用所有的變量 , 而 只用 4個變量 進(jìn)行判別:企業(yè)規(guī)模 ( is) 、 服務(wù) (se)、 雇員工資比例 (sa)、 資金周轉(zhuǎn)速度 (cs)。 結(jié)果的圖形和判別的正確與否就不一樣了 。 下圖為兩個典則判別函數(shù)導(dǎo)出的 150個企業(yè)的二維點圖 。 它不如前面的圖那么容易分清楚了 C an o n i c al D i s c r i mi n an t F u n c t i o n sF u n ct io n 1864202468Function 232101234G R O U PG r o u p Ce n t r o id s321321C an o n i c al D i s c r i mi n an t F u n c t i o n sF u n ct io n 1100 1 0Function 243210123G R O U PG r o u p Ce n t r o id s321321原先的圖 ? 下面是基于 4個變量時分類結(jié)果表: ? 這個表的結(jié)果是有 87個點 ( %) 得到正確劃分 , 有3個點被錯誤判別;其中第二類有兩個被誤判為第一類 ,有一個被誤判為第三類 。 C l a s s i f i c a t i o n R e s u l t sb,c30 0 0 302 27 1 300 0 30 301 0 0 . 0 .0 .0 1 0 0 . 06 . 7 9 0 . 0 3 . 3 1 0 0 . 0.0 .0 1 0 0 . 0 1 0 0 . 030 0 0 302 27 1 300 0 30 301 0 0 . 0 .0 .0 1 0 0 . 06 . 7 9 0 . 0 3 . 3 1 0 0 . 0.0 .0 1 0 0 . 0 1 0 0 . 0G R O U P1 . 0 02 . 0 03 . 0 01 . 0 02 . 0 03 . 0 01 . 0 02 . 0 03 . 0 01 . 0 02 . 0 03 . 0 0C o u n t%C o u n t%O r i g i n a lC r o s s v a l i d a t e da1 . 0 0 2 . 0 0 3 . 0 0P r e d i c t e d G r o u p M e m b e r s h i pT o t a lC r o s s v a l i d a t i o n i s d o n e o n l y f o r t h o s e c a s e s i n t h e a n a l y s i s . I n c r o s sv a l i d a t i o n , e a c h c a s e i s c l a s s i f i e d b y t h e f u n c t i o n s d e r i v e d f r o m a l lc a s e s o t h e r t h a n t h a t c a s e .a . 9 6 . 7 % o f o r i g i n a l g r o u p e d c a s e s c o r r e c t l y c l a s s i f i e d .b . 9 6 . 7 % o f c r o s s v a l i d a t e d g r o u p e d c a s e s c o r r e c t l y c l a s s i f i e d .c . ? ? 訓(xùn)練樣本中必須包含所有要判別的類型,分類必須清楚,不能有混雜。 ? 要選擇好可能用于判別的預(yù)測變量。這是最重要的。當(dāng)然,在應(yīng)用中,選擇余地不見得有多大。 ? 要注意數(shù)據(jù)是否有不尋常的點或者模式存在。還要看預(yù)測變量中是否有些不適宜的;這可以用單變量方差分析( ANOVA)和相關(guān)分析來驗證。 判別分析要注意什么 ? ? 判別分析是為了正確地分類,但同時也要注意使用盡可能少的預(yù)測變量來達(dá)到這個目的。使用較少的變量意味著節(jié)省資源和易于對結(jié)果作解釋。 ? 在計算中需要看關(guān)于各個類的有關(guān)變量的均值是否顯著不同的 ? 檢驗結(jié)果 (在 SPSS選項中選擇 Wilks’ Lambda、Rao’s V、 The Squared Mahalanobis Distance或 The Sum of Unexplained Variations等檢驗的計算機(jī)輸出 ),以確定是否分類結(jié)果僅由于隨機(jī)因素。 判別分析要注意什么 ? ? 此外成員的權(quán)數(shù)( SPSS用 prior probability,即“先驗概率”,和貝葉斯統(tǒng)計的先驗概率有區(qū)別)需要考慮;一般來說,加權(quán)要按照各類觀測值的多少,觀測值少的就要按照比例多加權(quán)。 ? 對于多個判別函數(shù),要弄清各自的重要性。 ? 注意訓(xùn)練樣本的正確和錯誤分類率。研究被誤分類的觀測值,看是否能找出原因。 SPSS選項 ? 打開 。然后點擊 Analyze- Classify-Discriminant, ? 把 group放入 Grouping Variable,再定義范圍,即在 Define Range輸入 1- 3的范圍。然后在 Independents輸入所有想用的變量;但如果要用逐步判別,則不選 Enter independents together,而選擇 Use stepwise method, ? 在方法( Method)中選挑選變量的準(zhǔn)則(檢驗方法;默認(rèn)值為 Wilks’ Lambda)。 ? 為了輸出 Fisher分類函數(shù)的結(jié)果可以在 Statistics中的Function Coefficient選 Fisher和 Unstandardized ,在Matrices中選擇輸出所需要的相關(guān)陣; ? 還可以在 Classify中的 Display選 summary table, Leaveoneout classification;注意在 Classify選項中默認(rèn)的 Prior Probability為 All groups equal表示所有的類都平等對待,而另一個選項為 Compute from group sizes,即按照類的大小加權(quán)。 ? 在 Plots可選 Combinedgroups, Territorial map等。 附錄 費歇 (Fisher)判別法 ? 并未要求總體分布類型 ? 工作原理就是對原數(shù)據(jù)系統(tǒng)進(jìn)行坐標(biāo)變換 ,尋求能夠?qū)⒖傮w盡可能分開的方向 . ? 點 x在以 a為法方向的投影為 a’x ? 各組數(shù)據(jù)的投影為 ( ) ( )1: 39。 39。 , 1 , ...,iiiinG a x a x i k?將 Gm組中數(shù)據(jù)投影的均值記為 有 記 k組數(shù)據(jù)投影的總均值為 有 ( ) ( )1139。 39。 , 1 , . . . ,mnmmiima x a x m kn ????()39。 max39。ax()11139。39。mnkmimia x a xn ??? ??組間離差平方和為 : ( ) 21( ) ( )1( 39。 39。 )39。[ ( ) ( ) 39。] 39。 。kmmmkmmmmS S G n a x a xa n x x x x a a Ba????? ? ? ???這里 ( ) ( )1( ) ( ) 39。]k mmmmB n x x x x?? ? ?? 組內(nèi)離差平方和為 : ( ) ( ) 211( ) ( ) ( ) ( )11( 39。 39。 )39。[ ( ) ( ) 39。 ] 39。 。mmnkmmiminkm m m miimiS S E a x a xa x x x x a a Ea??????? ? ? ?????( ) ( ) ( ) ( )11( ) ( ) 39。mnk m m m miimiE x x x x??? ? ???這里 注 :L=|E|/|B+E|為有 Wilks分布的檢驗零假設(shè)H0:m(1)=…= m(k)的似然比統(tǒng)計量 . Wilks分布常用 c2分布近似 (Bartlett) 希望尋找 a使得 SSG盡可能大而 SSE盡可能小 ,即 39。( ) m a x39。a B aaa E a? ? ?記方程 |BlE|=0的全部特征根為 l1 ≥ …≥ lr0, 相應(yīng)的特征向量為 v1,…,v r. ?(a)的大小可以估計判別函數(shù) yi(x)=vi’x (= a’x)的效果 . 記 pi為判別能力 (效率 ), 有 最大的值為方程 |BlE|=0的最大特征根 l1. 1ii rhhpll???使 39。39。a Baa Eam個判別函數(shù)的判別能力定義為 111mimii rihhpll???????據(jù)此來確定選擇多少判別函數(shù)。 再看逐步判別法。 判別分析 (Discriminant Analysis) 和聚類分析的關(guān)系 ? 判別分析和聚類分析都是分類 . ? 但判別分析是在已知對象有若干類型和一批已知樣品的觀測數(shù)據(jù)后的基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式 . 而做聚類分析時類型并不知道 . ? 可以先聚類以得知類型 ,再進(jìn)行判別 . 距離判別法 ? 假設(shè)有兩個總體 G1和 G2, 如果能夠定義點 x到它們的距離D(x,G1)和 D(x,G2), 則 ? 如果 D(x,G1) D(x,G2)則 x∈ G1 ? 如果 D(x,G2) D(x,G1)則 x∈ G2 ? 如果 D(x,G1) = D(x,G2)則待判 Mahalanobis距離 ? 假設(shè) m(1), m(2), S(1), S(2)分別為 G1和G2的均值向量和協(xié)差陣 ,則點 x到 Gi的馬氏距離定義為 D2(x,Gi)=(x m(i))’(S(i))1(x m(i)) ? 其他一些距離為馬氏距離的特殊情況 ,因此我們著重討論馬氏距離 .馬氏距離的好處是可以克服變量之間的相關(guān)性干擾 ,并且消除各變量量綱的影響 . 線性判別函數(shù) :當(dāng) S(1)=S(2)=S時 2 2 ( 1 ) ( 2 ) 1 ( 1 ) ( 2 )211( , ) ( , ) 2 [ ( ) ] 39。 ( )2D x G D x G x m m m m?? ? ? ? S ?記 ( 1 ) ( 2 ) 1 ( 1 ) ( 2 )1 ( ) 。 ( ) ( ) 39。 ( )2W x xm m m m m m?? ? ? ? S ?如果 W(x)0即 D(x,G1)D(x,G2)則 x∈ G1 如果 W(x)0即 D(x,G1)D(x,G2)則 x∈ G2 如果 W(x)=0即 D(x,G1)=D(x,G2)則待判 當(dāng) m(1), m(2), S 已知 時 , 令 a= S1(m(1) m(2) ) ≡(a1,…, a p)’,則 1111 1 1( ) ( ) 39。 39。( ) ( , ..., )( ) , ..., ( )pppp p pxW x x a a x a axa x a xmmmmmm?? ???? ? ? ? ????? ???? ? ?顯然 W(x)為 x1,…, x p的線性函數(shù) , 稱為線性判別函數(shù) 。 a稱為判別系數(shù) . 當(dāng) m(1), m(2), S 未知 時 , 可通過樣本來估計 : ( ) ( )1 , .. ., iiinxx判別函數(shù)為 為來自 Gi的樣本為 (i=1,2) 2( ) ( ) ( )121 12( ) ( ) ( ) ( ) ( 1 ) ( 2 )111?? , ( ) ,21( ) ( ) 39。, ( )2ini i ikkini i i ii t ttx x S Sn n nS x x x x x x xm??? ? S ? ???? ?
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1