【正文】
College StudentGao Yuliang(College of Computer Science,Shaanxi Normal University,Xi′an 710062,Shaanxi, China)Abstract: The theory of principle ponent analysis can use less prehensive variables to instead of the multivariate variables, this method can simplify the structure of the data and aggregate the original index into several principal the contribution rate of this principal ponent as right, count weighted average and make up a prehensive assessment function. The paper take the present country policy of Tuitionfree Normal College Student as a background,then the students in the Shaanxi Normal University has been carried on a systematic questionnaire and it uses the theory to analysis the statistical results, thus extract the major effect factors(That is characteristic) to the changing source of tuitionfree Normal College Student. The related subjects is Pattern Recognition, in this process, the feature selection and extraction are also used. At the same time , according to the analysis, it needs to understand something as definitions, concepts of KarhunenLoeve Transform and its application in feature extraction. Key words: principle ponent analysis prehensive assessmentfeature selection feature extraction 4 課題的背景及提出的意義 4 4 4 研究現(xiàn)狀 4 主成分分析理論簡(jiǎn)介 4 理論原理及基本思想 5 主成分分析理論在實(shí)驗(yàn)研究的應(yīng)用情況 5 6 6 6 6 7 KL變換 7 7 7 8 10 10 12 13 13 14 14 15 16 16 17 195 結(jié)論 21結(jié)束語(yǔ) 21附錄 【參考文獻(xiàn)】 21致 謝 22 課題的背景及提出的意義 2007年國(guó)家決定在六所教育部直屬的師范大學(xué)進(jìn)行師范生免費(fèi)教育,在這一政策實(shí)施三年以來(lái),事實(shí)已經(jīng)證明這六所大學(xué)(北京師范大學(xué)、華東師范大學(xué)、東北師范大學(xué)、華中師范大學(xué)、陜西師范大學(xué)、西南大學(xué))的生源較之以前發(fā)生了明顯的變化,至于是什么原因引起了這個(gè)變化呢?不外乎是個(gè)人、家庭、社會(huì)等諸多方面的因素直接或間接導(dǎo)致的,在這些因素中,大多數(shù)人也肯定是由于同樣的某些理由使他們選擇了報(bào)讀上述院校,鑒于這個(gè)事實(shí),本文就選用主成分分析方法去探討免費(fèi)師范生生源多因素這一問(wèn)題。在實(shí)際課題中,為了全面分析問(wèn)題,往往提出很多與此有關(guān)的變量(或因素),因?yàn)槊總€(gè)變量都在不同程度上反映這個(gè)課題的某些信息。它是模式識(shí)別學(xué)科中特征選擇所運(yùn)用到的方法之一。因此在所有的線性組合中選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。主成分分析是一種常用的多元統(tǒng)計(jì)分析方法,相對(duì)于其他統(tǒng)計(jì)學(xué)方法,它更強(qiáng)調(diào)用數(shù)據(jù)本身來(lái)指導(dǎo)分析過(guò)程,而不是依賴于事先給定的某些假設(shè)。生物樣品特征譜的復(fù)雜多變性,對(duì)生物的每一個(gè)細(xì)小特征都進(jìn)行處理分析已經(jīng)是不現(xiàn)實(shí)的一種方法,因此很多的統(tǒng)計(jì)分析方法自然就被排除了,而主成分分析對(duì)于高維度的分子生物學(xué)數(shù)據(jù)則似乎是一種最恰當(dāng)?shù)姆治龇椒?。所謂模式識(shí)別技術(shù),是隨著現(xiàn)代科學(xué)技術(shù)的發(fā)展,特別是計(jì)算機(jī)技術(shù)的發(fā)展而形成的一種模擬人的各種識(shí)別能力和方法的技術(shù)。在模式識(shí)別中,被觀測(cè)的每個(gè)對(duì)象成為一個(gè)樣品。 模式識(shí)別建立在對(duì)模式特征量化的基礎(chǔ)上,也就是說(shuō),首先要對(duì)表征模式的各種特征加以量測(cè)或量化,得到每一模式的特征數(shù)值集合或特征向量,然后根據(jù)不同類型模式具有不同的特征數(shù)值集合,進(jìn)行自動(dòng)辨別。由于模式識(shí)別是由計(jì)算機(jī)自動(dòng)處理的來(lái)完成的,在模式維數(shù)很高的情況下,計(jì)算量太大,且識(shí)別精度并不一定隨著維數(shù)增多而提高,因此就很有必要對(duì)已有的眾多特征進(jìn)行選擇與提取,也就是說(shuō)需要選擇最有代表性的特征,另外,針對(duì)不同的研究對(duì)象,還需要進(jìn)行不同的特征組合。目前比較普遍使用的降維映射方法仍然是線性映射,即各個(gè)新特征Yi(i=1,2,…,v,vn)與舊特征X1,X2,…,Xn之間的關(guān)系為 Yi=Ai1+Ai2X2+…+AinXn,i=1,2,…,v 其中各Aij是常數(shù)在本文的免費(fèi)師范生生源多因素分析中,我們采用的是線性映射的主成分分析這一方法來(lái)進(jìn)行特征選擇這一過(guò)程。這些因素造成了KL變換在工程實(shí)踐中不能廣泛使用。滿足以上條件的新特征y1,y2,……,yn,分別稱為樣品點(diǎn)的第…、n個(gè)主成分,其中樣品的數(shù)學(xué)模型如下:X=(x1,x2,……,xn)T=,m為樣品的個(gè)數(shù).由以上的變換可以看出主成分是原變量的線性組合,是對(duì)原變量信息的一種改組,主成分不增加總信息量,也不減少總信息量。 在求和ui就相當(dāng)于解以上方程,具體解法可在各種計(jì)算方法中找到??梢宰C明,當(dāng)經(jīng)過(guò)上述形式的線性變換后,如果對(duì)應(yīng)于X的協(xié)方差矩陣是Sx,那么對(duì)應(yīng)于Y的協(xié)方差矩陣就是Sy=USxUT,注意到UT的每列恰好是Sx的一個(gè)特征向量并利用條件④就可以得到:SxUT==UT∧ ⑦其中∧是以,…,為主對(duì)角線元素的對(duì)角陣,再利用教歸一條件又可得到: Sy=USxUT=UUT∧=∧ ⑧這就是說(shuō):新特征y1,y2,……,yn兩兩之間的協(xié)方差為零,即它們是不相關(guān)的。1) 根據(jù)樣品協(xié)方差公式⑤求出原有特征的協(xié)方差矩陣Sx或相關(guān)系數(shù)矩陣R;2) 用任意一種計(jì)算方法求出Sx或R的全部特征值,…,和對(duì)應(yīng)的特征向量u1,u2,…,un,并對(duì)求出的特征值按從大到小的順序排列,即≥≥…≥,特征向量也應(yīng)按照對(duì)應(yīng)特征值的順序排列。嚴(yán)格說(shuō)來(lái),只有前幾個(gè)綜合變量才稱得上主成分,后幾個(gè)綜合變量實(shí)為次成分。到這里,關(guān)于主成分分析方法就基本完成,但是在分析實(shí)際問(wèn)題時(shí)仍然還會(huì)有一些額外的處理,比如說(shuō)具體實(shí)踐問(wèn)題時(shí),為了消除各項(xiàng)指標(biāo)由于量綱單位不同所帶來(lái)的不可比性,將各項(xiàng)指標(biāo)先用相應(yīng)的方法進(jìn)行標(biāo)準(zhǔn)化處理,以方便分析過(guò)程,而上述所給的例子就沒(méi)有這個(gè)問(wèn)題,只是單純的數(shù)學(xué)式的方法求解過(guò)程。目前,免費(fèi)師范生政策已經(jīng)在國(guó)家實(shí)施三年,社會(huì)對(duì)該項(xiàng)政策的關(guān)注也越來(lái)越明顯,主要體現(xiàn)在究竟該政策能否對(duì)國(guó)家的師資隊(duì)伍進(jìn)行充實(shí),能否對(duì)教育事業(yè)的發(fā)展起到振興作用,而這一點(diǎn)就和免費(fèi)生選擇這幾所免費(fèi)院校的初衷直接相關(guān),也就是說(shuō)生源多因素問(wèn)題對(duì)這項(xiàng)政策的結(jié)果有著實(shí)質(zhì)