freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

[經濟學]高級統(tǒng)計學-資料下載頁

2025-02-22 00:30本頁面
  

【正文】 方向進行坐標軸旋轉。 主成分分析的這一特性大大擴展了其應用范圍,對多維數(shù)據(jù),只要是涉及降維的處理,我們都可以嘗試用主成分分析,而不用花太多精力考慮其分布情況。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 62 目錄 上頁 下頁 返回 結束 167。 首先應當認識到主成分分析方法適用于變量之間存在較強相關性的數(shù)據(jù),如果原始數(shù)據(jù)相關性較弱,運用主成分分析后不能起到很好的降維作用,即所得的各個主成分濃縮原始變量信息的能力差別不大。一般認為當原始數(shù)據(jù)大部分變量的相關系數(shù)都小于 ,運用主成分分析不會取得很好的效果。 很多研究工作者在運用主成分分析方法時,都或多或少存在著對主成分分析去除原始變量重疊信息的期望,這樣,在實際工作中初始就可以把與某一研究問題相關而可能得到的變量(指標)都納入分析過程,再用少數(shù)幾個主成分濃縮這些有用信息(假定已剔除了重疊信息),然后對主成分進行深入分析。在對待重疊信息方面,生成的新的綜合變量(主成分)是有效剔除了原始變量中的重疊信息,還是僅僅按原來的模式將原始信息中的絕大部分用幾個不相關的新變量表示出來,這一點還值得討論。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 63 目錄 上頁 下頁 返回 結束 167。 為說明這個問題,我們有必要再回顧一下主成分的求解過程,我們僅就從協(xié)方差矩陣出發(fā)求主成分的過程予以說明,對相關陣有類似的情況。 對于 維指標的情況,我們得到其協(xié)方差矩陣如下: p????????????????pppppp???????????????212222111211現(xiàn)在考慮一種極端情況,即有兩個指標完全相關,不妨設第一個指標在進行主成分分析時考慮了兩次。則協(xié)方差矩陣變?yōu)椋? 2022/3/13 中國人民大學六西格瑪質量管理研究中心 64 目錄 上頁 下頁 返回 結束 167。 1 1 1 1 1 2 11 1 1 1 1 2 12 1 2 1 2 2 211 1 2pppp p p p p? ? ? ?? ? ? ?? ? ? ?? ? ? ???????????此時進行主成分分析的時候實際上是由 維矩陣 進行。 的行列式的值為零但仍滿足非負定,只不過其最小的特征值為 0,由 出發(fā)求解主成分,其方差總和不再是 而是變?yōu)? ,也就是說,第一個指標在分析過程中起到了加倍的作用,其重疊信息完全象其他指標提供的信息一樣在起作用。 )1()1( ??? pp 1Σ1Σ1Σ pp??? ??? ?2211112211 ???????? pp?2022/3/13 中國人民大學六西格瑪質量管理研究中心 65 目錄 上頁 下頁 返回 結束 167。 這樣求得的主成分已經與沒有第一個指標重疊信息時不一樣了,因為主成分方差的總和已經變?yōu)? 而不是 ,每個主成分解釋方差的比例也相應發(fā)生變化,而整個分析過程沒有對重疊信息作任何特殊處理。也就是說,由于對第一個指標羅列了兩次,其在生成的主成分構成中也起到了加倍的作用。這一點是尤其應該引起注意的,這意味著主成分分析對重疊信息的剔除是無能為力的,同時主成分分析還損失了一部分信息。對此文獻 [4]舉例進行了說明。 112211 ???????? pp?pp??? ??? ?2211 這就告訴我們在實際工作中,在選取初始變量進入分析時應該小心,對原始變量存在多重共線性的問題,在應用主成分分析方法時一定要慎重。應該考慮所選取的初始變量是否合適,是否真實地反映了事物的本來面目,如果是出于避免遺漏某些信息而特意選取了過多的存在重疊信息的變量時,就要特別注意應用主成分分析所得到的結果。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 66 目錄 上頁 下頁 返回 結束 167。 如果所得到的樣本協(xié)方差矩陣(或是相關陣)最小的特征值接近于 0,那么就有 0)39。()( ?????? pppp ???? μXμX ( ) 進而推出 0)39。( ??p?μX ( ) 這就意味著,中心化以后的原始變量之間存在著多重共線性,即原始變量存在著不可忽視的重疊信息。因此,在進行主成分分析得出協(xié)方差陣或是相關陣發(fā)現(xiàn)最小特征根接近于零時,應該注意對主成分的解釋,或者考慮對最初納入分析的指標進行篩選,由此可以看出,雖然主成分分析不能有效地剔除重疊信息,但它至少可以發(fā)現(xiàn)原始變量是否存在著重疊信息,這對我們減少分析中的失誤是有幫助的。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 67 目錄 上頁 下頁 返回 結束 167。 主成分分析步驟及框圖 167。 主成分分析步驟 167。 主成分分析的邏輯框圖 2022/3/13 中國人民大學六西格瑪質量管理研究中心 68 目錄 上頁 下頁 返回 結束 167。 主成分分析步驟 由上面討論大體上已經可以明了進行主成分分析的步驟,對此進行歸納如下: ; 陣求主成分; ; ,若存在,則回到第一步; ,選取主成分; 。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 69 目錄 上頁 下頁 返回 結束 167。 主成分分析的邏輯框圖 特征值 標準正交特征向量 是否有接近 0的情況 是 其他處理 否 主成分 對主成分進行分析 深入分析 選擇初始變量 度量或取值范圍相同 ? 是 否 ( 否 ) 對比 分析相關陣 分析協(xié)方差陣 主成分分析的邏輯框圖見 圖 53: 【 例 】 數(shù)據(jù)集 Employee data為 Midwestern銀行在 19691971年之間雇員情況的數(shù)據(jù),共包括 474條觀測及如下 10個變量: Id(觀測號)、 Gender(性別)、 Bdate(出生日期)、Educ(受教育程度(年數(shù)))、 Jobcat(工作種類)、 Salary(目前年薪)、 Salbegin(開始受聘時的年薪)、 Jobtime(受雇時間(月))、 Prevexp(受雇以前的工作時間(月))、 Minority(是否少數(shù)民族)。下面我們用主成分分析方法處理該數(shù)據(jù),以期用少數(shù)變量來描述該地區(qū)居民的雇傭情況。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 70 目錄 上頁 下頁 返回 結束 167。 SPSS軟件 FACTOR模塊提供了主成分分析的功能。下面先以SPSS軟件包自帶的數(shù)據(jù) Employee 析的上機實現(xiàn)方法,在 SPSS軟件的安裝目錄下可以找到該數(shù)據(jù)集;然后,我們舉一個實際的例子介紹主成分分析的具體應用。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 71 目錄 上頁 下頁 返回 結束 167。 進入 SPSS軟件,打開數(shù)據(jù)集 Employee 。依次點選 Analyze→Data Reduction→Factor … .進入 Factor Analysis(因子分析)對話框。(在 SPSS軟件中,主成分分析與因子分析均在 Factor Analysis模塊中完成。此時,數(shù)據(jù)集 Employee 中,依次選中變量 educ、 salary、 salbegin、 jobtime、prevexp并點向右的箭頭按鈕,這五個變量便進入 variables窗口(此時若選中 variables窗口中的變量,則窗口左側的箭頭按鈕即轉向左側,點此按鈕即可剔除所選中變量)。點擊右側的 OK按鈕,即可得到如下輸出結果 51。 2022/3/13 中國人民大學六西格瑪質量管理研究中心 72 目錄 上頁 下頁 返回 結束 167。 T o t a l V a r i a n c e E x p l a i n e d2 . 4 7 7 4 9 . 5 4 1 4 9 . 5 4 1 2 . 4 7 7 4 9 . 5 4 1 4 9 . 5 4 11 . 0 5 2 2 1 . 0 4 6 7 0 . 5 8 7 1 . 0 5 2 2 1 . 0 4 6 7 0 . 5 8 71 . 0 0 3 2 0 . 0 7 0 9 0 . 6 5 6 1 . 0 0 3 2 0 . 0 7 0 9 0 . 6 5 6.365 7 . 2 9 9 9 7 . 9 5 5.102 2 . 0 4 5 1 0 0 . 0 0 0C o m p o n e n t12345T o t a l % o f V a r i a n c e C u m u l a t i v e % T o t a l % o f V a r i a n c e C u m u l a t i v e %I n i t i a l E i g e n v a l u e s E x t r a c t i o n S u m s o f S q u a r e d L o a d i n g sE x t r a c t i o n M e t h o d : P r i n c i p a l C o m p o n e n t A n a l y s i s .輸出結果 51( 2) C o m m u n a l i t i e s1 . 0 0 0 .7541 . 0 0 0 .8961 . 0 0 0 .9161 . 0 0 0 .9991 . 0 0 0 .968E d u c a t i o n a l L e v e l( y e a r s )C u r r e n t S a l a r yB e g i n n i n g S a l a r yM o n t h s s i n c e H i r eP r e v i o u s E x p e r i e n c e( m o n t h s )I n i t i a l E x t r a c t i o nE x t r a c t i o n M e t h o d : P r i n c i p a l C o m p o n e n t A n a l y s i s .輸出結果 51( 1) 2022/3/13 中國人民大學六西格瑪質量管理研究中心 73 目錄 上頁 下頁 返回 結束 167。 輸出結果 51( 3) C o m p o n e n t M a t r i xa.846 . 1 9 4 . 0 1 4.940 .104 .029.917 .264 . 0 7 7.068 . 0 5 2 .996 . 1 7 8 .965 .069E d u c a t i o n a l L e v e l( y e a r s )C u r r e n t S a l a r yB e g i n n i n g S a l a r yM o n t h s s i n c e H i r eP r e v i o u s E x p e r i e n c e( m o n t h s )1 2 3C o m p o n e n tE x t r a c t i o n M e t h o d : P r i n c i p a l C o m p o n e n t A n a l y s i s .3 c o m p o n e n t s e x t r a c t e d .a. 2022/3/13 中國人民大學六西格瑪質量管理研究中心 74 目錄 上頁 下頁 返回 結束 167。 其中 Communalities給出了該次分析從每個原始變量中提取的信息,表格下面的注示表明,該次分析是用 Factor analysis模塊默認的信息提取方法即主成分分析完成的??梢钥吹匠芙逃潭刃畔p失較大外,主成分幾乎包含了各個原始變量至少 90%的信息。 Total Variance Explained表則顯示了各主成分解釋原始變量總方差的情況, SPSS默認保留特征根大于 1的主成分,在本例中看到當保留 3個主成分為宜,這 3個主成分集中了原始 5個變量信息的 %,可見效果是比較好的。實際上,主成分解釋總方差的百分比也可以由 Communalities表中計算得出,即 ( ++++) /5=%。 Component Matrix表中給出了標準化原始變量用求得的主成分線性表示的近似表達式,我們以表中Current Salary一行為例,不妨用 來表示各個主成分,則由 Component Matrix表可以得到: 、1pri
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1