freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

廈門大學(xué)應(yīng)用多元統(tǒng)計(jì)分析第06章__主成分分析-wenkub

2023-05-27 18:07:23 本頁面
 

【正文】 主成分分析。他曾利用美國 1929一 1938年各年的數(shù)據(jù),得到了 17個(gè)反映國民收入與支出的變量要素,例如雇主補(bǔ)貼、消費(fèi)資料和生產(chǎn)資料、純公共支出、凈增庫存、股息、利息外貿(mào)平衡等等。如果第一主成分還不能反映原指標(biāo)的全部信息,再考慮選取第二主成分 y2, y2在剩余的線性組合中方差最大,并且與 y1不相關(guān),如若第一、第二主成分仍然不能反映原變量的全部信息,再考慮選取第三主成分 y3, y3在剩余的線性組合中方差最大,并且與 y y2不相關(guān),依次可求出全部 p個(gè)主成分,它們的方差是依次遞減的。多數(shù)情況下提取出前 2~3個(gè)主成分已包含了90%以上的信息,其他的可以忽略不計(jì)。這些綜合指標(biāo)就稱為主成分。 基本思想 ? 在社會(huì)經(jīng)濟(jì)的研究中,為了全面系統(tǒng)的分析和研究問題,必須考慮許多經(jīng)濟(jì)指標(biāo),這些指標(biāo)能從不同的側(cè)面反映我們所研究對象的特征,但在某種程度上存在信息的重疊,具有一定的相關(guān)性。當(dāng)?shù)谝粋€(gè)線性組合不能提取更多的信息時(shí),再考慮用第二個(gè)線性組合繼續(xù)這個(gè)快速提取的過程, …… ,直到所提取的信息與原指標(biāo)相差不多時(shí)為止。人們自然希望通過克服相關(guān)性、重疊性,用較少的變量來代替原來較多的變量,而這種代替可以反映原來多個(gè)變量的大部分信息,這實(shí)際上是一種“降維”的思想。第六章 主成分分析 第一節(jié) 引言 第二節(jié) 主成分的幾何意義及數(shù)學(xué) 推導(dǎo) 第三節(jié) 主成分的性質(zhì) 第四節(jié) 主成分方法應(yīng)用中應(yīng)注意 的問題 第五節(jié) 實(shí)例分析與計(jì)算機(jī)實(shí)現(xiàn) 第一節(jié) 引言 ? 多元統(tǒng)計(jì)分析處理的是多變量(多指標(biāo))問題。 ? 主成分分析也稱主分量分析,是由 Hotelling于 1933年首先提出的。這就是主成分分析的思想。 ? 主成分分析是把各變量之間互相關(guān)聯(lián)的復(fù)雜關(guān)系進(jìn)行 簡化 分析的方法。 ? 將原來眾多具有一定相關(guān)性的指標(biāo)重新組合成一組新的相互無關(guān)的綜合指標(biāo)來代替原來指標(biāo)。 ? 二維空間: 其中 y y2分別都是 x x2的線性組合,并且信息盡可能地集中在 y1上。 ? 在實(shí)際工作中,在不損失較多信息的情況下, 通常選取前幾個(gè)主成分來進(jìn)行分析,達(dá)到簡化數(shù)據(jù)結(jié)構(gòu)的目的。 ? 在進(jìn)行主成分分析后,竟以 %的精度,用三新變量就取代了原 17個(gè)變量。當(dāng)分析中所選擇的經(jīng)濟(jì)變量具有不同的量綱,變量水平差異很大,應(yīng)該選擇基于相關(guān)系數(shù)矩陣的主成分分析。 ? 如何解釋主成分所包含的經(jīng)濟(jì)意義。 ? 主成分分析的數(shù)學(xué)模型是,設(shè) p個(gè)變量構(gòu)成的 p維隨機(jī)向量為X = ( X1, … , Xp) ′。 ??????????????npnnppxxxxxxxxx. . . . . .. . . . . .. . . . . . .. . . . . .. . . . . .. . . . . . .. . . . . .212222111211 1 1 1 1 1 2 2 12 2 1 1 2 2 2 21 1 2 2................................ppppp p p p p pF u x u x u xF u x u x u xF u x u x u x? ? ? ?? ? ? ?? ? ? ?這種由討論多個(gè)指標(biāo)降為少數(shù)幾個(gè)綜合指標(biāo)的過程在數(shù)學(xué)上就叫做降維。事實(shí)上,散點(diǎn)的分布總有可能沿著某一個(gè)方向略顯擴(kuò)張,這個(gè)方向就把它看作橢圓的長軸方向。旋轉(zhuǎn)公式為 1 1 22 1 2c o s s i ns i n c o sY X XY X X????????? ? ?? ( 6 . 1 ) 我們看到新變量1Y和2Y是原變量1X和2X的線性組合,它的 矩陣表示形 式為: 1122c os sinsin c osYXYX????? ? ? ????????? ? ? ????? ? ? ?TX ( 6 . 2 ) 其中, ?T 為旋轉(zhuǎn)變換矩陣,它是正交矩陣,即有 1?? ?TT 或 ? ?T T I 。我們稱 Y1為第一主成分,稱 Y2 為第二主成分。 ? 另一種是橢圓扁平到了極限,變成 y1軸上的一條線,第一主成分包含有二維空間點(diǎn)的全部信息,僅用這一個(gè)綜合變量代替原始數(shù)據(jù)不會(huì)有任何的信息損失,此時(shí)的主成分分析效果是非常理想的,其原因是,第二主成分不包含任何信息,舍棄它當(dāng)然沒有信息損失。 ? ? 我們下面將借助投影尋蹤( P r oj e c t i on P u r s u i t )的思想來解決這一問題。 第二主成分為,滿足22 1TT? ?,且2 1 2 1( , ) ( , ) 0Cov Y Y Cov T T???? XX,使得2 2 2()D Y T T?? Σ達(dá)到最大的22YT?? X。那么,1Y的最大方差值為1?,其相應(yīng)的單位化特征向量為1T。從而 2( ) 0T???Σ I ( 6 . 1 1 ) 而且 22TT ?? ?Σ ( 6 . 1 2 ) (二)第二主成分 在約束條件 下,尋找第二主成分 12c o v ( , ) 0FF ?2 1 2 1 2ppF u X u X? ? ?因?yàn)? 1 2 1 2 2 1 1 2 1c o v ( , ) c o v ( , ) 0F F u x u x u u u u?? ? ? ?? ? ? ? ?012 ??uu所以 則 , 對 p維向量 , 有 2u?? ?? ??????? pi iipi iiiuuFV 1 221 22222 )()( uuuuuu ?????? pi i222 )( uu 2??? ??? pi ii1 22 uuuu 2? 22 uUUu ??? 2? 222u? ? ??所以如果取線性變換: 則 的方差次大 。這樣我們構(gòu)造目標(biāo)函數(shù)為 11( , , ) ( 1 ) 2 ( )kk k i k k k k i i kiT T T T T T T? ? ? ? ???? ? ?? ? ? ? ?Σ ( 6 . 13) 對目標(biāo)函數(shù)( , , )k k iT? ? ?求導(dǎo)數(shù)有: 112 2 2 0kkk k i iikT T TT??????? ? ? ???Σ ( 6 . 14) ? ? 用iT?左乘 ( 6 . 14) 式有 11( ) 0ki k i k i i iiT T T T T T????? ? ?? ? ??Σ 即有0i i iTT? ? ?,那么,0i? ?(1 , 2 , 1ik??)。那么,由此所確定的主成分為11YT?? X,22YT?? X, ,mmYT?? X,其方差分別為Σ的特征根。 證明:事實(shí)上 ( , ) ( , )( , )( ) ( )k i k ikik i k iiCov Y X Cov T eYXD Y D X??????XX 其中的( 0 , , 0 , 1 , 0 , , 0 )ie ?,它是除第i個(gè)元素為 1 外其他元素均為 0 的單位向量。 二、主成分的方差貢獻(xiàn)率 ? 由主成分的性質(zhì) 2 可以看出,主成分分析把p個(gè)原始變量12, , , pX X X的總方差()tr Σ分解成了p個(gè)相互獨(dú)立的變量12, , , pY Y Y的方差之和1pkk???。若只取()mp ?個(gè)主成分,則稱 11pmm k kkk? ? ???? ?? ( ) 為主成分1 , mYY的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率表明1 , mYY綜合12, , , pX X X的能力。不同的變量往往有不同的單位,對同一變量單位的改變會(huì)產(chǎn)生不同的主成分,主成分傾向于多歸納方差大的變量的信息,對于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)”的問題。實(shí)際表明,這種差異有時(shí)很大。一般情況下,選擇評價(jià)指標(biāo)體系后通過對各指標(biāo)加權(quán)的辦法來進(jìn)行綜合。這個(gè)方法是根據(jù)指標(biāo)間的相對重要性進(jìn)行客觀加權(quán),可以避免綜合評價(jià)者的主觀影響,在實(shí)際應(yīng)用中越來越受到人們的重視。 ? 設(shè)12, , , pY Y Y是所求出的p個(gè)主成分, 它們的特征根分別是12, , , p? ? ?,將特征根“歸一化”即有 ???miiiiw1?? 1 , 2 , ,ip? 記為12( , , )pW w w w ??,由??Y T X,構(gòu)造綜合 評價(jià)函數(shù)為 1 1 2 2 ()ppZ w Y w Y w Y W W W? ? ? ?? ? ? ? ? ? ?
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1