freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

統(tǒng)計(jì)學(xué)第四版主成分分析和因子分析(已修改)

2024-09-15 12:28 本頁(yè)面
 

【正文】 數(shù)據(jù)分析 (方法與案例 ) 作者 賈俊平 統(tǒng) 計(jì) 學(xué) 12 2 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 模型選擇是藝術(shù),而不是科學(xué)。 —— William Navidi 統(tǒng)計(jì)名言 第 12 章 主成分分析和因子分析 主成分分析 因子分析 12 4 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 學(xué)習(xí)目標(biāo) ? 主成分分析和因子分析的基本原理 ? 主成分分析和因子分析的異同 ? 主成分分析和因子分析的數(shù)學(xué)模型 ? 用 SPSS進(jìn)行主成分分析和因子分析 ? 用主成分分析和因子分析對(duì)實(shí)際問(wèn)題進(jìn)行綜合評(píng)價(jià) 12 5 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 在研究實(shí)際問(wèn)題時(shí) , 往往需要收集多個(gè)變量 。 但這樣會(huì)使多個(gè)變量間存在較強(qiáng)的相關(guān)關(guān)系 , 即這些變量間存在較多的信息重復(fù) , 直接利用它們進(jìn)行分析, 不但模型復(fù)雜 , 還會(huì)因?yàn)樽兞块g存在多重共線性而引起較大的誤差 ? 為能夠充分利用數(shù)據(jù) , 通常希望用較少的新變量代替原來(lái)較多的舊變量 , 同時(shí)要求這些新變量盡可能反映原變量的信息 ? 主成分分析和因子分子正式解決這類(lèi)問(wèn)題的有效方法 。 它們能夠提取信息 , 使變量簡(jiǎn)化降維 , 從而使問(wèn)題更加簡(jiǎn)單直觀 主成分分析和因子分析 (principal ponent analysis amp。 factor analysis) 12 6 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 因子分析得到的是什么? ? 因子分析方法在部分領(lǐng)域應(yīng)用的一些例子 ? 心理學(xué): 心理學(xué)家瑟斯登對(duì) 56項(xiàng)測(cè)驗(yàn)的得分進(jìn)行因子分析 , 得出了 7中主要智利因子:詞語(yǔ)理解能力 , 語(yǔ)言流暢能力 、 計(jì)數(shù)能力 、 空間能力 、 記憶力 、 知覺(jué)速度和推理能力 ? 教育學(xué): 某師范大學(xué)在對(duì)以幼兒園 3~ 6歲幼兒為對(duì)象 ,通過(guò) 80名幼兒教師對(duì) 480名幼兒好奇心行為特征描述的開(kāi)放式問(wèn)卷調(diào)查 , 編制出 60個(gè)項(xiàng)目的初始問(wèn)卷 , 對(duì) 500名幼兒的初測(cè)結(jié)果進(jìn)行探索性因子分析后 , 形成了 33個(gè)項(xiàng)目的正式問(wèn)卷 , 對(duì) 1000名幼兒的評(píng)價(jià)結(jié)果進(jìn)行驗(yàn)證性因子分析 , 結(jié)果表明:教師評(píng)價(jià)的 3~ 6歲幼兒好奇心結(jié)構(gòu)包括敏感 、 對(duì)未知事物的關(guān)注 、 好問(wèn) 、 喜歡擺弄 、 探索持久和好奇體驗(yàn) 6個(gè)因子 12 7 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 因子分析得到的是什么? ? 醫(yī)學(xué): 一位研究者對(duì)山東某縣 2020~ 2020年 3年的全死因調(diào)查資料中不同地區(qū)各惡性腫瘤標(biāo)化死亡率進(jìn)行因子分析后發(fā)現(xiàn) , 該縣居民惡性腫瘤的發(fā)病和死亡具有明顯的地區(qū)分布 。 在地區(qū)分布中 ,各種惡性腫瘤的死亡具有一定程度的聚集性 。 經(jīng)因子分析得到的 4個(gè)主因子可以解釋 10種惡性腫瘤死亡率的 % ; 10種惡性腫瘤中 , 被解釋的比例最小也在 62% 以上;而胃癌 、 白血病 、 膀胱癌 、 乳腺癌 、 結(jié)腸癌死亡率被解釋的比例均在77% 以上 , 表明這 10種惡性腫瘤之間存在中等偏強(qiáng)的內(nèi)在聯(lián)系和地區(qū)分布特點(diǎn) 12 8 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 因子分析得到的是什么? ? 地質(zhì)學(xué): 海南島的石綠鐵礦及外圍地區(qū)有透輝石透閃巖石和陽(yáng)起石兩種巖石 。 地質(zhì)工作者對(duì)兩種巖石標(biāo)本的 11種化驗(yàn)數(shù)據(jù)進(jìn)行了因子分析 , 分別得到 5種和 4種主要因子 。 結(jié)果表明 , 透輝石透閃巖石與陽(yáng)起石有明顯區(qū)別 , 前者的元素組合屬碳酸鹽沉積型 , 后者屬巖漿分異型 。 透輝石透閃巖石中鐵的沉積與泥質(zhì)成分有關(guān) , 屬于正常沉積 。 由此推斷石綠鐵礦的主要成礦為沉積作用 , 并據(jù)此提出了找礦標(biāo)志和找礦方向 ? 上市公司評(píng)價(jià): 某研究者選擇 35家能源類(lèi)上市公司 , 根據(jù)2020年的 12項(xiàng)經(jīng)營(yíng)指標(biāo)數(shù)據(jù) , 采用因子分析法分別按盈利能力 、 資產(chǎn)管理能力 、 償債能力及經(jīng)營(yíng)業(yè)績(jī)綜合評(píng)分等方面對(duì) 35家上市公司進(jìn)行了排名 。 其中:盈利能力排在前 5位的是:神火股份 、 海油工程 、 蘭花科創(chuàng) 、 潞安環(huán)能和中國(guó)石油;經(jīng)營(yíng)業(yè)績(jī)綜合得分排在前 5位的是:神火股份 、 潞安環(huán)能 、 蘭花科創(chuàng) 、海油工程和開(kāi)灤股份 主成分分析 主成分分析的基本原理 主成分分析的數(shù)學(xué)模型 主成分分析的步驟 第 12 章 主成分分析和因子分析 主成分分析的基本原理 主成分分析 12 11 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 主成分的概念由 Karl Pearson在 1901年提出 ? 考察多個(gè)變量間相關(guān)性一種多元統(tǒng)計(jì)方法 ? 研究如何通過(guò)少數(shù)幾個(gè)主成分 (principal ponent)來(lái)解釋多個(gè)變量間的內(nèi)部結(jié)構(gòu) 。 即從原始變量中導(dǎo)出少數(shù)幾個(gè)主分量 , 使它們盡可能多地保留原始變量的信息 , 且彼此間互不相關(guān) ? 主成分分析的目的:數(shù)據(jù)的壓縮;數(shù)據(jù)的解釋 ? 常被用來(lái)尋找判斷事物或現(xiàn)象的綜合指標(biāo) , 并對(duì)綜合指標(biāo)所包含的信息進(jìn)行適當(dāng)?shù)慕忉? 什么是主成分分析? (principal ponent analysis) 12 12 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 對(duì)這兩個(gè)相關(guān)變量所攜帶的信息 (在統(tǒng)計(jì)上信息往往是指數(shù)據(jù)的變異 )進(jìn)行濃縮處理 ? 假定只有兩個(gè)變量 x1和 x2, 從散點(diǎn)圖可見(jiàn)兩個(gè)變量存在相關(guān)關(guān)系 , 這意味著兩個(gè)變量提供的信息有重疊 主成分分析的基本思想 (以?xún)蓚€(gè)變量為例 ) ? 如果把兩個(gè)變量用一個(gè)變量來(lái)表示 ,同時(shí)這一個(gè)新的變量又盡可能包含原來(lái)的兩個(gè)變量的信息 , 這就是降維的過(guò)程 12 13 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 橢圓中有一個(gè)長(zhǎng)軸和一個(gè)短軸 , 稱(chēng)為主軸 。 在長(zhǎng)軸方向 , 數(shù)據(jù)的變化明顯較大 , 而短軸方向變化則較小 ? 如果沿著長(zhǎng)軸方向設(shè)定一個(gè)新的坐標(biāo)系 , 則新產(chǎn)生的兩個(gè)變量和原始變量間存在一定的數(shù)學(xué)換算關(guān)系 , 同時(shí)這兩個(gè)新變量之間彼此不相關(guān) , 而且長(zhǎng)軸變量攜帶了大部分的數(shù)據(jù)變化信息 , 而 主成分分析的基本思想 (以?xún)蓚€(gè)變量為例 ) 短軸變量只攜帶了一小部分變化的信息 (變異 ) ? 此時(shí) , 只需要用長(zhǎng)軸方向的變量就可以代表原來(lái)兩個(gè)變量的信息 。 這樣也就把原來(lái)的兩個(gè)變量降維成了一個(gè)變量 。長(zhǎng)短軸相差越大 , 降維也就越合理 12 14 統(tǒng)計(jì)學(xué)STATISTICS (第四版 ) 2020105 ? 多維變量的情形類(lèi)似 , 只不過(guò)是一個(gè)高維橢球 , 無(wú)法直觀地觀察 ? 每個(gè)變量都有一個(gè)坐標(biāo)軸 , 所以有幾個(gè)變量就有幾主軸 。 首先把橢球的各個(gè)主軸都找出來(lái) , 再用代表大多數(shù)數(shù)據(jù)信息的最長(zhǎng)的幾
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1