【正文】
基于主成分分析的免費(fèi)師范生生源多因素分析高玉梁(陜西師范大學(xué)計(jì)算機(jī)科學(xué)學(xué)院, 陜西 西安710062)摘 要:應(yīng)用主成分分析原理,以少數(shù)的綜合變量取代原有的多維變量,使數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)化,把原指標(biāo)綜合成幾個(gè)主成分,再以這幾個(gè)主成分的貢獻(xiàn)率為權(quán)數(shù)進(jìn)行加權(quán)平均,構(gòu)造出一個(gè)綜合評(píng)價(jià)函數(shù)。本文以目前國(guó)家正在實(shí)施的免費(fèi)師范生政策為背景,對(duì)陜西師范大學(xué)的免費(fèi)師范生進(jìn)行了系統(tǒng)性的問(wèn)卷式抽樣調(diào)查,并對(duì)調(diào)查結(jié)果進(jìn)行整理統(tǒng)計(jì)和主成分分析,從而提取出免費(fèi)師范生生源變化的主要影響因素(即特征)。本文所應(yīng)用的學(xué)科為模式識(shí)別,涉及到的理論方法是特征選擇與特征提取,同時(shí)深刻理解KL變換的定義、概念,以及在特征提取中的應(yīng)用。關(guān)鍵詞:主成分分析 綜合評(píng)估 特征選擇 特征提取Based on Principal Component Analysis in the Various Source of Tuitionfree Normal College StudentGao Yuliang(College of Computer Science,Shaanxi Normal University,Xi′an 710062,Shaanxi, China)Abstract: The theory of principle ponent analysis can use less prehensive variables to instead of the multivariate variables, this method can simplify the structure of the data and aggregate the original index into several principal the contribution rate of this principal ponent as right, count weighted average and make up a prehensive assessment function. The paper take the present country policy of Tuitionfree Normal College Student as a background,then the students in the Shaanxi Normal University has been carried on a systematic questionnaire and it uses the theory to analysis the statistical results, thus extract the major effect factors(That is characteristic) to the changing source of tuitionfree Normal College Student. The related subjects is Pattern Recognition, in this process, the feature selection and extraction are also used. At the same time , according to the analysis, it needs to understand something as definitions, concepts of KarhunenLoeve Transform and its application in feature extraction. Key words: principle ponent analysis prehensive assessmentfeature selection feature extraction 4 課題的背景及提出的意義 4 4 4 研究現(xiàn)狀 4 主成分分析理論簡(jiǎn)介 4 理論原理及基本思想 5 主成分分析理論在實(shí)驗(yàn)研究的應(yīng)用情況 5 6 6 6 6 7 KL變換 7 7 7 8 10 10 12 13 13 14 14 15 16 16 17 195 結(jié)論 21結(jié)束語(yǔ) 21附錄 【參考文獻(xiàn)】 21致 謝 22 課題的背景及提出的意義 2007年國(guó)家決定在六所教育部直屬的師范大學(xué)進(jìn)行師范生免費(fèi)教育,在這一政策實(shí)施三年以來(lái),事實(shí)已經(jīng)證明這六所大學(xué)(北京師范大學(xué)、華東師范大學(xué)、東北師范大學(xué)、華中師范大學(xué)、陜西師范大學(xué)、西南大學(xué))的生源較之以前發(fā)生了明顯的變化,至于是什么原因引起了這個(gè)變化呢?不外乎是個(gè)人、家庭、社會(huì)等諸多方面的因素直接或間接導(dǎo)致的,在這些因素中,大多數(shù)人也肯定是由于同樣的某些理由使他們選擇了報(bào)讀上述院校,鑒于這個(gè)事實(shí),本文就選用主成分分析方法去探討免費(fèi)師范生生源多因素這一問(wèn)題。免費(fèi)師范生生源因素眾多,而基于主成分分析的免費(fèi)師范生生源多因素分析的目的則在于在我們對(duì)這種分析方法的原理充分理解下,靈活地運(yùn)用一種科學(xué)理論去解釋現(xiàn)實(shí)問(wèn)題,培養(yǎng)理論聯(lián)系實(shí)際的能力。同時(shí),在免費(fèi)師范生生源問(wèn)題日益得到社會(huì)各界重視的前提下,運(yùn)用一種科學(xué)理論去分析這一熱門(mén)話題,一方面得出的結(jié)論具有較高的可信度,反之,另一方面如果結(jié)論和人們的直觀感覺(jué)相一致,也同時(shí)對(duì)主成分分析方法的科學(xué)性和合理性進(jìn)行了驗(yàn)證。 研究現(xiàn)狀 主成分分析理論簡(jiǎn)介主成分分析是將多個(gè)變量通過(guò)線性變換以選出較少個(gè)數(shù)重要變量的一種多元統(tǒng)計(jì)分析方法,又稱主分量分析。在實(shí)際課題中,為了全面分析問(wèn)題,往往提出很多與此有關(guān)的變量(或因素),因?yàn)槊總€(gè)變量都在不同程度上反映這個(gè)課題的某些信息。但是,在用統(tǒng)計(jì)分析方法研究這個(gè)多變量的問(wèn)題時(shí),變量個(gè)數(shù)太多自然就增加課題的復(fù)雜性。在很多情形,變量之間是有一定的相關(guān)關(guān)系的,可以解釋為這兩個(gè)變量反映此課題的信息有一定的重疊。主成分分析是對(duì)于原先提出的所有變量,建立盡可能少的新變量,使得這些新變量是兩兩不相關(guān)的,而且這些新變量在反映的信息方面盡可能保持原有的信息。它是模式識(shí)別學(xué)科中特征選擇所運(yùn)用到的方法之一。 理論原理及基本思想 設(shè)法將原來(lái)眾多具有一定相關(guān)性變量重新組合成一組新的互相無(wú)關(guān)的幾個(gè)綜合變量,同時(shí)根據(jù)實(shí)際需要從中可以取出幾個(gè)較少的綜合變量盡可能多地反映原來(lái)變量的信息的統(tǒng)計(jì)方法,這即是主成分分析理論的原理之所在,它也是數(shù)學(xué)上處理降維的一種方法。 通常數(shù)學(xué)上的處理就是將原來(lái)P個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用F1(選取的第一個(gè)線性組合,即第一個(gè)綜合指標(biāo))的方差來(lái)表達(dá),即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來(lái)P個(gè)指標(biāo)的信息,再考慮選取F2即選第二個(gè)線性組合,為了有效地反映原來(lái)信息,F(xiàn)1已有的信息就不需要再出現(xiàn)再F2中,用數(shù)學(xué)語(yǔ)言表達(dá)就是要求Cov(F1, F2)=0,則稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四,……,第m個(gè)主成分,這m個(gè)主成分包含原來(lái)P個(gè)指標(biāo)的所有信息。 主成分分析理論在實(shí)驗(yàn)研究的應(yīng)用情況 “多元統(tǒng)計(jì)分析”是近幾十年來(lái)迅速發(fā)展起來(lái)的一門(mén)學(xué)科。隨著微機(jī)的普遍使用及統(tǒng)計(jì)軟件的推廣普及,回歸分析、判別分析、聚類分析因子分析、對(duì)應(yīng)分析等等,各種多元統(tǒng)計(jì)方法已廣泛應(yīng)用于自然科學(xué)各學(xué)科乃至社會(huì)科學(xué)各個(gè)領(lǐng)域。主成分分析是一種常用的多元統(tǒng)計(jì)分析方法,相對(duì)于其他統(tǒng)計(jì)學(xué)方法,它更強(qiáng)調(diào)用數(shù)據(jù)本身來(lái)指導(dǎo)分析過(guò)程,而不是依賴于事先給定的某些假設(shè)。 主成分分析在地震預(yù)測(cè)中的應(yīng)用。根據(jù)主成分分析可以得到反應(yīng)地震強(qiáng)度異常特征的綜合指標(biāo)形,發(fā)現(xiàn)該指標(biāo)在2次地震前出現(xiàn)明顯的異常變化,震后異?;謴?fù),綜合指標(biāo)