【正文】
間互不相關。 8 主成分分析 什么是主成分分析 主成分分析的數學模型 主成分分析的主要步驟 如何在 SPSS軟件中進行主成分分析 167。 167。它從一定的模型出發(fā),找出幾個反映原有變量的公共因子,并力求使之有較為合理的專業(yè)解釋。綜合變量即主成分( principal pontent)綜合變量之間相互獨立,且能反映原來多個變量的大部分信息。 換一個角度來看,如果眾多的變量間存在著的相關關系,能否在相關分析的基礎上,用較少的新變量代替原來較多的舊變量,而且使這些較少的新變量盡可能多地保留原來變量所反映的信息? 主成分分析和因子分析就是綜合處理這種問題的一種強有力的工具。 地理系統是多要素的復雜系統。 解決該問題的一個辦法就是篩選變量,即只挑選部分較為重要的變量,以減少變量數,并可緩解相關性帶來的麻煩-如逐步回歸分析、逐步判別分析等。它把原來多個變量(顯式變量)轉化為少數幾個綜合變量(潛式變量)。因子分析是主成分分析的一種推廣。 8 主成分分析 問題的提出 [引例 81] 2022年全國各地 區(qū)經濟效益主要指標有以下 8個: GDP(億元)、工業(yè) 增加值( %)、總資產貢 獻率( %)、資產負債率 ( %)、流動資產周轉次 數(次 /年)、工業(yè)成本費 用利潤率( %)、全員勞動 生產率(元 /人 .年)、產品 銷售率( %)。 8 主成分分析 問題的提出 167。 主成分分析( Principal Components Analysis , PCA)也 稱為主分量分析,是一種通過降維來簡化數據結構的方 法,即如何把多個變量(變量)轉化為少數幾個綜合變量 (綜合變量),而這幾個綜合變量可以反映原來多個變量 的大部分信息。變量多且變量間有一定的相關性,勢必增加了分析問題的復雜性。 怎么處理? 通常數學上的處理就是將原來 p個變量作線性組合作為新的綜合變量。 167。依此類推,可以獲得 p個主成分。 167。 8 主成分分析 數學模型 引例 81中,有 31個樣本,每個樣本有 8個變量。 8 主成分分析 數學模型的條件 對于任意常數 c,有 為了使方差 可以比較,要求線性組合的系數滿足規(guī)范化條件 要求原始變量之間存在一定的相關性 要求各個綜合變量間互不相關,即協方差為 0 為了消除變量量綱不同對方差的影響,通常對數據進行標準化處理,變量之間的協方差即為相關系數。s T e s t o fS p h e r i c i t y 如果多個變量相互獨立或相關性很小,就不能進行 主成分分析。 167。( 39。 ( 39。 39。 8 主成分分析 數學模型的推導 ?通過推導可知, 的主成分就是以協方差陣 的特征向量為系數的線性組合,它們互不相關,其方差 為 的特征根。 方法之二是根據累計貢獻率來取主成分。 8 主成分分析 主成分的提取 ?累計貢獻率 如果前 k個主成分的累計貢獻率達到 85%,則表明取前 k 個主成分基本包含了全部測量指標所具有的信息,從而 達到了變量降維的目的。 8 主成分分析 主成分的提取 T o t a l V a ri a n c e E x p