freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計-主成分分析-wenkub.com

2025-08-02 09:47 本頁面
   

【正文】 在此,我非常感謝我的指導(dǎo)教師謝娟英老師,感謝馬箐等幾位幫助我完成畢業(yè)設(shè)計的研究生學(xué)長們,感謝她們給予我的莫大的幫助,同時感謝那些對我畢業(yè)設(shè)計提出寶貴建議的同學(xué)朋友們。盡管謝老師的日常工作很忙,但她仍然不忘記抽出寶貴的時間來對我們的畢業(yè)設(shè)計進(jìn)行指導(dǎo)和關(guān)注。對貢獻(xiàn)率較高的主成分分析歸納,得出影響免費(fèi)師范生生源最主要的因素有特征x8(是否喜歡教師這個職業(yè))、x21(支教對人生價值的實現(xiàn))、x4和x5(父母的學(xué)歷),x1(個人性別),x11(免費(fèi)師范生志愿的決定人),x17(國家政策性影響)以及x16(免費(fèi)師范生的弊) 與x23(免費(fèi)師范生的利)的對比等等,這些因素在很大程度上對免費(fèi)師范生的生源起到了關(guān)鍵性的影響,換句話說絕大數(shù)免費(fèi)師范生報考免費(fèi)院校的原因都源自上述因素。標(biāo)準(zhǔn)化結(jié)果如下:\n39。fprintf(39。sco=vector1*vector2。fprintf(39。 if sumrate break。)newrate=newy/sum(newy)sumrate=0。%g\n39。 %對特征根進(jìn)行排序,y為排序結(jié)果,i為索引fprintf(39。)std=CORRCOEF(vector) %計算相關(guān)系數(shù)矩陣fprintf(39。 %矩陣大小,a為行數(shù),b為列數(shù)for i=1:a for j=1:b std(i,j)= vector(i,j)/cwsum(j)。下面主要主要介紹利用Matlab的矩陣計算功能編程實現(xiàn)主成分分析。對上面得出的標(biāo)準(zhǔn)化矩陣,求出24個特征兩兩之間的相關(guān)系數(shù)矩陣R,矩陣R是一個主對角線均為1的對稱矩陣,該24階對稱方陣如下:由相關(guān)系數(shù)矩陣可以看出第4個和第5個特征的相關(guān)性比較大,它們都是關(guān)于父母親學(xué)歷的特征。上述截圖中題號(行)表示一個樣品的所有各項特征(X1X24),而列則表示所有樣品的某一特征數(shù)據(jù),最后一行均值表示所有樣品點(diǎn)中每項特征的總體均值,結(jié)果精確到小數(shù)點(diǎn)后一位。對陜西師范大學(xué)的若干年級、院系進(jìn)行有針對性的問卷式調(diào)查,本次共抽查涵蓋2002002009三個年級至少八個院系的300名免費(fèi)師范生,學(xué)生對問卷進(jìn)行五分鐘的作答,最終收集到的有效問卷為273份。主成分分析方法的不足在于有時的數(shù)據(jù)標(biāo)準(zhǔn)化處理丟失了原有信息,另外該方法是對原有數(shù)據(jù)的線性組合,實際中指標(biāo)之間、主成分與原始數(shù)據(jù)之間有時都呈現(xiàn)非線性關(guān)系,這樣用主成分分析方法去分析這類數(shù)據(jù),必然導(dǎo)致評價結(jié)果與事實偏差很大。下面以兩個簡單的例子說明主成分分析方法的過程及步驟:假設(shè)有兩批樣品,每批樣品數(shù)為N=4,特征數(shù)為n=2,兩批樣品的原始資料見下表, 兩批樣品的原始資料樣品集樣品集樣品特征X1 X2 X3 X4樣品特征X1 X2 X3 X4x1x21 1 2 21 1 2 2x1x21 1 2 21 1 2 2根據(jù)上面所講的計算步驟,首先計算每批樣品的協(xié)方差矩陣,結(jié)果為: :特征值=20/3,=0 特征向量u1=(1/,1/)T,u2=(1/,1/)T :特征值=16/3,=4/3 特征向量u1=(1/,1/)T,u2=(1/,1/)T 由此可知,對于兩組樣品利用主成分分析所得的新特征都是: 即 新特征y1,y2所表示的變換即將主成分所在的坐標(biāo)系旋旋轉(zhuǎn)45。在Sx中,主對角線之和S11+S22+…+Snn等于原有各特征方差之和。下面,我們來詳細(xì)敘述主成分分析的計算步驟?,F(xiàn)在我們需要說明的是用以上方法求出的各個ui就可以滿足前面所說的3個條件1)、2)、3)。因此,在實際應(yīng)用中,選擇哪種矩陣進(jìn)行主成分分析,應(yīng)視具體的研究目的而定,下面的問題討論均以協(xié)方差矩陣為例。而KL變換就常常作為對這些變換性能的評價標(biāo)準(zhǔn)。求特征值與特征向量并不是一件容易的事,維數(shù)較高時甚至求不出來。特征選擇通常包括兩方面的內(nèi)容:一方面是對單個特征的選擇,即對每個特征分別進(jìn)行評價,從中找出那些對識別作用最大的特征,如KW檢驗、直方圖方法、不確定性選擇等等;另一方面是從大量原有特征出發(fā),構(gòu)造少數(shù)有效的新特征,有時也稱為降維映射,如主成分分析、對應(yīng)分析。所謂從少到多,是指在設(shè)計識別方案的初期階段應(yīng)盡量多地列舉出各種可能與分類有關(guān)的特征,這樣可以充分利用各種有用的信息,改善分類效果,這一步驟稱為特征提取或特征抽提,如利用KL變換的分類來進(jìn)行特征提取。例如,在研究地震危險區(qū)域劃分時,每個樣品是一塊區(qū)域,與之對應(yīng)的特征可以取該區(qū)域內(nèi)的各項地質(zhì)地貌特征,如主活動斷裂數(shù),主活動斷裂的端點(diǎn)及交匯點(diǎn)個數(shù),區(qū)域內(nèi)的最大高程等。模式識別當(dāng)前主要運(yùn)用在地球環(huán)境的調(diào)查研究、生物醫(yī)學(xué)工程、生產(chǎn)管理自動化、軍事偵查等領(lǐng)域。在研究較復(fù)雜的經(jīng)濟(jì)問題時,利用多元統(tǒng)計分析中的主成分分析,可從多個經(jīng)濟(jì)指標(biāo)中找出起支配作用的共同因素,從而抓住主要矛盾,以較少的變量進(jìn)行定量分析,對企業(yè)的經(jīng)濟(jì)效益進(jìn)行公正的評價。根據(jù)主成分分析可以得到反應(yīng)地震強(qiáng)度異常特征的綜合指標(biāo)形,發(fā)現(xiàn)該指標(biāo)在2次地震前出現(xiàn)明顯的異常變化,震后異常恢復(fù),綜合指標(biāo)形可以較好地反映地震活動異常增強(qiáng)的特征。 主成分分析理論在實驗研究的應(yīng)用情況 “多元統(tǒng)計分析”是近幾十年來迅速發(fā)展起來的一門學(xué)科。 通常數(shù)學(xué)上的處理就是將原來P個指標(biāo)作線性組合,作為新的綜合指標(biāo)。在很多情形,變量之間是有一定的相關(guān)關(guān)系的,可以解釋為這兩個變量反映此課題的信息有一定的重疊。同時,在免費(fèi)師范生生源問題日益得到社會各界重視的前提下,運(yùn)用一種科學(xué)理論去分析這一熱門話題,一方面得出的結(jié)論具有較高的可信度,反之,另一方面如果結(jié)論和人們的直觀感覺相一致,也同時對主成分分析方法的科學(xué)性和合理性進(jìn)行了驗證。本文以目前國家正在實施的免費(fèi)師范生政策為背景,對陜西師范大學(xué)的免費(fèi)師范生進(jìn)行了系統(tǒng)性的問卷式抽樣調(diào)查,并對調(diào)查結(jié)果進(jìn)行整理統(tǒng)計和主成分分析,從而提取出免費(fèi)師范生生源變化的主要影響因素(即特征)。本文所應(yīng)用的學(xué)科為模式識別,涉及到的理論方法是特征選擇與特征提取,同時深刻理解KL變換的定義、概念,以及在特征提取中的應(yīng)用。 研究現(xiàn)狀 主成分分析理論簡介主成分分析是將多個變量通過線性變換以選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法,又稱主分量分析。主成分分析是對于原先提出的所有變量,建立盡可能少的新變量,使得這些新變量是兩兩不相關(guān)的,而且這些新變量在反映的信息方面盡可能保持原有的信息。最經(jīng)典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標(biāo))的方差來表達(dá),即Var(F1)越大,表示F1包含的信息越多。隨著微機(jī)的普遍使用及統(tǒng)計軟件的推廣普及,回歸分析、判別分析、聚類分析因子分析、對應(yīng)分析等等,各種多元統(tǒng)計方法已廣泛應(yīng)用于自然科學(xué)各學(xué)科乃至社會科學(xué)各個領(lǐng)域。 主成分分析在生命科學(xué)研究中的應(yīng)用。 此外,主成分分析方法已經(jīng)被作為一種科學(xué)的分析方法廣泛地運(yùn)用于工農(nóng)業(yè)生產(chǎn)、環(huán)境保護(hù)、商業(yè)盈利等等,并且主成分分析方法的應(yīng)用領(lǐng)域會隨著技術(shù)的進(jìn)步越來越廣闊。模式識別技術(shù)是在計算機(jī)上實現(xiàn)的,而計算機(jī)只識別數(shù)字和字符,故所有模式都必須首先數(shù)值化或符號化,才能進(jìn)行自動識別,也就是說前提是對模式的特征測量數(shù)值化。又如,在醫(yī)學(xué)診斷中,每個樣品是一個患者,特征便可取與診斷有關(guān)的各項病理指標(biāo)等,如體溫、血壓、白血球數(shù)目等。 這里產(chǎn)生的問題是特征數(shù)值向量的分量個數(shù)很多(或維數(shù)很多),但是否都能有效地代表各類模式,針對不同的對象,是否都需要那么多特征來進(jìn)行辨別,這是需要考慮的問題。在模式識別技術(shù)中最常使用的特征選擇
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1