freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

研主成分分析與因子分析-展示頁

2024-10-25 19:48本頁面
  

【正文】 變換后 , 得到的新綜合變量物理含義即是因子變量的命名解釋 , 它可以進一步說明影響原變量系統(tǒng)構(gòu)成的主要因素和系統(tǒng)特征。 前 m個因子的 累計方差貢獻率 計算方法為 : ?????piimiiQ11??如果數(shù)據(jù)已經(jīng)標準化 , 則 : pQmii??? 1?一般方差的累計貢獻率應(yīng)在 80% 以上 。 主成分分析產(chǎn)生的 m維主超平面 , 能使 數(shù)據(jù)信息 損失盡可能小。 其中 pnijpnij xx ??? ? ][][記 ? 計算數(shù)據(jù) 的協(xié)方差矩陣 R pnijx ?][? 求 R的前 m個特征值 : m???? ???? ?321 以及對應(yīng)的特征向量 u1, u2, … , um, 它們標準正交。 主成分分析的步驟 ? 數(shù)據(jù)的標準化處理 jjijij Sxxx ???i = ? 、 n, n為樣本數(shù)。生成的空間 L(u1,u2, ? , um)稱為 “ m維主超平面 ” 。 Kaiser給出了一個 KMO的標準 : ? KMO: 非常適合 ; ? KMO: 適合 ; ? KMO: 一般 ; ? KMO: 不太適合 ; ? KMO: 極不適合。 越接近于 1,則所有變量之間的簡單相關(guān)系數(shù)平方和遠大于偏相關(guān)系數(shù)平方和 , 因此 , 越 適合 作因子分析。因此 , 如果 反映像相關(guān)矩陣 中有些元素的 絕對值 比較大 , 那么說明這些變量 不適合 作因子分析。 ? 反映像相關(guān)矩陣檢驗以變量的 偏相關(guān)系數(shù)矩陣 為出發(fā)點 , 將偏相關(guān)系數(shù)矩陣的每個元素 取反 , 得到反映像相關(guān)矩陣。 ? 巴特利特球形檢驗的統(tǒng)計量是根據(jù)相關(guān)系數(shù)矩陣的 行列式 得到的。 巴特利特球形檢驗 (Bartlett Test of Sphericity) ? 巴特利特球形檢驗是以變量的相關(guān)系數(shù)矩陣為出發(fā)點的。如果相關(guān)系數(shù)矩陣在進行統(tǒng)計檢驗中 , 大部分相關(guān)系數(shù)都小于 未 通過統(tǒng)計檢驗 , 那么這些變量就 不適合 進行因子分析。如果原有變量之間不存在較強的相關(guān)關(guān)系 , 那么就無法從中綜合出能反映某些變量共同特性的少數(shù)公共因子變量來。 因子分析有兩個 核心問題 : 一是如何構(gòu)造因子變量 ; 二是如何對因子變量進行命名解釋。 ? 變量共同度 : 也稱公共方差 , 反映全部公共因子變量對原有變量 xi 的 總方差 解釋說明的比例。 因子分析中的幾個概念 ? 因子載荷 : 在各個因子變量不相關(guān)情況下 , 因子載荷 aij 就是第 i 個原有變量和第 j 個因子變量的相關(guān)系數(shù) , 即 xi 在第 j 個公共因子變量上的相對重要性。 ? 因子變量具有命名解釋性 , 即該變量是對某些原始變量信息的綜合和反映。 ? 因子變量 不是 對原有變量的取舍 , 而是根據(jù)原始變量的信息進行重新組構(gòu) , 它能夠反映原有變量 大部分 的信息。即是一種通過顯在 變量來測評 潛在 變量,通過 具體指標 測評抽象因子 的統(tǒng)計分析方法。因此 , 有可能用較少的綜合指標分析存在于各變量中的各類信息 , 這些被抽象出來的綜合指標之間彼此 不相關(guān) , 且能反映原來眾多變量的主要信息 , 稱之為 因子 。 Z1 Z2 Z3 C1 C2 C3 Z1 1 Z2 0 1 Z3 0 0 1 C1 1 C2 1 C3 1 ? 在社會、政治、經(jīng)濟和醫(yī)學(xué)等領(lǐng)域的研究中往往需要對反映事物的多個變最進行人量的觀察 ,收集大量的數(shù)據(jù)以便進行分析 , 尋找規(guī)律。 ? 根據(jù)這 3個變量的命名含義 , 可以看出這 3個新的變量是可以測量的。 ? Z2—— 總收入率。 著名的因子分析研究 ? 美國統(tǒng)計學(xué)家 Stone在 1947年關(guān)于國民經(jīng)濟的研究 , 它根據(jù)美國 1927年到 1938年的數(shù)據(jù) , 得到 17個反映國民收入與支出的變量要素 , 經(jīng)過因子分析 , 得到了 3個新的變量 ,可以解釋 17個原始變量 % 的信息。主成分分析與因子分析 ? 英國統(tǒng)計學(xué)家 Moser Scott 1961年在對英國157個城鎮(zhèn)發(fā)展水平進行調(diào)查時 , 原始測量的變量有 57個 , 而通過因子分析發(fā)現(xiàn) , 只需要用 5個新的綜合變量 (它們是原始變量的線性組合 ), 就可以解釋 95% 的原始信息。對問題的研究從 57維度降低到 5個維度 , 因此可以進行更容易的分析。根據(jù)這 3個因子變量和 17個原始變量的關(guān)系 ,Stone將這 3個變量命名為 : ? Z1—— 總收入 。 ? Z3—— 經(jīng)濟發(fā)展或衰退的趨勢 (時間 t的線性部分 )。 Stone把實際測量 3個變量的值 (C1, 實際測量總收入 ; C2,實際測量總收入率 ; C3, 時間因素 )和因子分析得到的 3個變量值進行相關(guān)性分析 , 得到的結(jié)果如下表所示。在大多數(shù)情況下 , 許多變量之間存在一定的相關(guān)關(guān)系。 ? 因子分析 就是用少數(shù)幾個因子來描述許多指標或因素之間的聯(lián)系 , 以較少幾個因子反映原資料的大部分信息的統(tǒng)計學(xué)方法。 因子分析的特點 ? 因子變量的數(shù)量遠少于原有的指標變量的數(shù)量 , 對因子變量的分析能夠減少分析中的計算工作量。 ? 因子變量之間 不 存在線性相關(guān)關(guān)系 , 對變量的分析比較方便。 因子分析的數(shù)學(xué)模型 ? 因子分析的出發(fā)點是用較少的相互獨立的因子變量來代替原來變量的大部分信息 , 可以通過下面的數(shù)學(xué)模型來表示 : ??????????????????????ppmmmmpmpmpp aFaFaFaxaFaFaFaxaFaFaFax???????221122222212121112121111原有變量 是均值為零、標準差為 1的標準化變量 ?i 特殊因子 , 表示了原有變量不能被因子變量所解釋的部分 , 相當于多元回歸分析中的殘差部分。因此 , aij 絕對值越大 , 則公共因子 Fj 和原有變量 xi 關(guān)系越強。原有變量 xi 的共同度是因子載荷矩陣 A中第 i行元素第平方和 , 即 : ???mjiji ah122? 公共因子 Fj的方差貢獻 : 為因子載荷矩陣 A中第 j列各元素的平方和 , 即 : ???piijj aS12 公共因子的方差貢獻反映了該因子對所有原始變總方差的解釋能力 , 其值越高 , 說明因子重要程度越高。 因子分析的個基本步驟 ? 確定待分析的原有若干變量 是否適合 于因子分析 ? 構(gòu)造因子變量 ? 利用旋轉(zhuǎn)使得因子變量更具有可解釋性 ? 計算因子變量的得分 確定待分析的原有若干變量是否適合于因子分析 ? 因子分析的 潛在要求 是原有變量之間要具有比較強的 相關(guān)性 。 ? 對原有變量作相關(guān)分析的方法是計算變量之間的 相關(guān)系數(shù)矩陣 。 ? SPSS在因子分析過程中提供了如下幾種檢驗方法來判斷變量 是否適 作因子分析。 ? 零假設(shè) 相關(guān)系數(shù)矩陣是一個單位陣。如果該值較大 , 且其對應(yīng)的相伴概率值小于用戶心中的顯著性水平 , 那么應(yīng)該 拒絕 零假設(shè) , 認為相關(guān)系數(shù)據(jù)不可能是單位陣 , 也即原始變量之間存在相關(guān)性 , 適合作因子分析 ; 相反 , 不宜于作因子分析。偏相關(guān)系數(shù)是在控制了其他變量對兩變量影響的條什下計算出來的相關(guān)系數(shù) , 如果變量之間存在較多的重疊影響 , 那么偏相關(guān)系數(shù)就會較小。 2. 反映像相關(guān)矩陣檢驗 (Anti image COrrelation matriX) 3. KMO(KaiserMeyerOlkin)檢驗 ? KMO統(tǒng)計量用于比較變量間簡單相關(guān)和偏相關(guān)系數(shù) , 計算公式如下 : ? ? ??? ??????jiijjiijjiijprrK M O222 KMO的取值范圍在 0和 1之間。如果 KMO越小 , 越不適合作因子分析。 構(gòu)造因子變量 ? 基于主成分模型的 主成分 分析法 ; ? 基于 因子分析模型 的 ?主軸因子法 ?極大似然法 ?最小二乘法 ? 主成分 分析通過坐標變換手段 , 將原有的 p個相關(guān)變量 xi, 作線性變化 , 轉(zhuǎn)換為另外一組不相關(guān)的變量 yi, 可以表示為 : ???????????????????ppppppppxppuxuxuyxuxuxuyxuxuxuy????22112222111212211111其中 122221 ???? pkkk uuu ?k = ? 、 p ? 主成分 分析放在一個多維坐標軸中看 , 是對 x x x3? xp組成的坐標系進行平移變換 , 使得新的坐標系原點和數(shù)據(jù)群點的重心重合 , 新坐標系的第一個軸與數(shù)據(jù)變化最大方向?qū)?yīng) (占的方差最大 , 解釋原有變量的能力也最強 ), 新坐標的第二個軸與第一個軸正交 (不相關(guān) ), 并且對應(yīng)數(shù)據(jù)變化的第二個方向 ? 因此稱這些新軸為第一主軸 u 第二主軸 u2? 若經(jīng)過舍棄少量信息后 , 原來的 p維空間降成 m維 , 仍能夠十分有效的表示原數(shù)據(jù)的變化情況。用原樣本點在主超平面上的投影近似地表示原來的樣本點。 j = ? 、 p , p為樣本原變量數(shù)目。 ? 求 m個變量的因子載荷矩陣 ??????????????????????????????mpmppmmmmpmppmmuuuuuuuuuaaaaaaaaaA???????????????????????221122221211212111212222111211,, 確定 m有兩種方法 : 一是 , 根據(jù)特征值的大小確定 , 一般取大于 l的特征值 ; 二是 , 根據(jù)因子的 累計方差貢獻率 來確定。 數(shù)據(jù)信息 , 主要反映在數(shù)據(jù)方差上 , 方差越大 , 數(shù)據(jù)中所包含的信息就越多 , 若一個事物一成不變 , 則無需對其進行研究。 因子變量的命名解釋 ? 經(jīng)過主成分分析得到的 u1, u2, … , um, 是對原變量的綜合 , 原變量都是有物理含義的變量。 ? 實際分析時 , 主要通過對載荷矩陣 A的值進行分析 , 得到因子變量和原變量的關(guān)系 ,從而對新的因子變量進行命名。 ? 載荷矩陣 A中 某一列 中也可能有多個 aij比較大 ,說明某個因子變量可能解釋多個原變量的信息。 ? 會使某個因子變量的含義模糊不清。這時 , 可以通過 因子矩陣 的 旋轉(zhuǎn) 來進行。 計算因子得分 因子變量確定后 , 對每一樣本數(shù)據(jù) , 我們希望得到它們在不同因子上的具體數(shù)據(jù)值 , 這些數(shù)值就是 因子得分 , 它和原變量的得分相對應(yīng)。 計算因子得分首先將因子變量表示為原有變量的線性組合 , 即 : pjpjjj xxxF ??? ???? ?2211 j = … 、 m ? 估計因子得分的方法有 : ?回歸法 ?Bartlette法 ?AndersonRubin法 SPSS中實現(xiàn)步驟 : 下表為 20名人學(xué)生關(guān)于價值觀的 9項測驗結(jié)果 ,包括合作性、對分配的看法、行為出發(fā)點、工作投入程度、對發(fā)展機會的看法、社會地位的看法、權(quán)力距離、對職位升遷的態(tài)度、以及領(lǐng)導(dǎo)風格的偏好。 合作性 分配 出發(fā)點 工作投入 發(fā)展機會 社會地位 權(quán)力距離 職位升遷 領(lǐng)導(dǎo)風格 16 16 13 18 16 17 15 16 16 18 19 15 16 18 18 18 17 19 17 17 17 14 17 18 16 16 16 17 17 17 16 19 18 19 20 19 16
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1