【正文】
間互不相關(guān)。 8 主成分分析 什么是主成分分析 主成分分析的數(shù)學(xué)模型 主成分分析的主要步驟 如何在 SPSS軟件中進行主成分分析 167。 167。它從一定的模型出發(fā),找出幾個反映原有變量的公共因子,并力求使之有較為合理的專業(yè)解釋。綜合變量即主成分( principal pontent)綜合變量之間相互獨立,且能反映原來多個變量的大部分信息。 換一個角度來看,如果眾多的變量間存在著的相關(guān)關(guān)系,能否在相關(guān)分析的基礎(chǔ)上,用較少的新變量代替原來較多的舊變量,而且使這些較少的新變量盡可能多地保留原來變量所反映的信息? 主成分分析和因子分析就是綜合處理這種問題的一種強有力的工具。 地理系統(tǒng)是多要素的復(fù)雜系統(tǒng)。 解決該問題的一個辦法就是篩選變量,即只挑選部分較為重要的變量,以減少變量數(shù),并可緩解相關(guān)性帶來的麻煩-如逐步回歸分析、逐步判別分析等。它把原來多個變量(顯式變量)轉(zhuǎn)化為少數(shù)幾個綜合變量(潛式變量)。因子分析是主成分分析的一種推廣。 8 主成分分析 問題的提出 [引例 81] 2022年全國各地 區(qū)經(jīng)濟效益主要指標(biāo)有以下 8個: GDP(億元)、工業(yè) 增加值( %)、總資產(chǎn)貢 獻率( %)、資產(chǎn)負(fù)債率 ( %)、流動資產(chǎn)周轉(zhuǎn)次 數(shù)(次 /年)、工業(yè)成本費 用利潤率( %)、全員勞動 生產(chǎn)率(元 /人 .年)、產(chǎn)品 銷售率( %)。 8 主成分分析 問題的提出 167。 主成分分析( Principal Components Analysis , PCA)也 稱為主分量分析,是一種通過降維來簡化數(shù)據(jù)結(jié)構(gòu)的方 法,即如何把多個變量(變量)轉(zhuǎn)化為少數(shù)幾個綜合變量 (綜合變量),而這幾個綜合變量可以反映原來多個變量 的大部分信息。變量多且變量間有一定的相關(guān)性,勢必增加了分析問題的復(fù)雜性。 怎么處理? 通常數(shù)學(xué)上的處理就是將原來 p個變量作線性組合作為新的綜合變量。 167。依此類推,可以獲得 p個主成分。 167。 8 主成分分析 數(shù)學(xué)模型 引例 81中,有 31個樣本,每個樣本有 8個變量。 8 主成分分析 數(shù)學(xué)模型的條件 對于任意常數(shù) c,有 為了使方差 可以比較,要求線性組合的系數(shù)滿足規(guī)范化條件 要求原始變量之間存在一定的相關(guān)性 要求各個綜合變量間互不相關(guān),即協(xié)方差為 0 為了消除變量量綱不同對方差的影響,通常對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,變量之間的協(xié)方差即為相關(guān)系數(shù)。s T e s t o fS p h e r i c i t y 如果多個變量相互獨立或相關(guān)性很小,就不能進行 主成分分析。 167。( 39。 ( 39。 39。 8 主成分分析 數(shù)學(xué)模型的推導(dǎo) ?通過推導(dǎo)可知, 的主成分就是以協(xié)方差陣 的特征向量為系數(shù)的線性組合,它們互不相關(guān),其方差 為 的特征根。 方法之二是根據(jù)累計貢獻率來取主成分。 8 主成分分析 主成分的提取 ?累計貢獻率 如果前 k個主成分的累計貢獻率達到 85%,則表明取前 k 個主成分基本包含了全部測量指標(biāo)所具有的信息,從而 達到了變量降維的目的。 8 主成分分析 主成分的提取 T o t a l V a ri a n c e E x p