freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析主成分分析-展示頁

2024-09-02 20:43本頁面
  

【正文】 偷盜罪 auto 汽車犯罪 ALABAMA ALASKA ARIZONA ARKANSAS CALIFORNIA COLORADO CONNECTICUT DELAWARE FLORIDA GEORGIA HAWAII IDAHO ILLINOIS INDIANA IOWA KANSAS KENTUCKY LOUISIANA MAINE MARYLAND MASSACHUSETTS MICHIGAN MINNESOTA MISSISSIPPI 0bbca224c509b9c88ed2d108f0e53c72 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 7 of 30 MISSOURI MONTANA NEBRASKA NEVADA NEW HAMPSHIRE NEW JERSEY NEW MEXICO NEW YORK NORTH CAROLINA NORTH DAKOTA OHIO OKLAHOMA OREGON PENNSYLVANIA RHODE ISLAND SOUTH CAROLINA SOUTH DAKOTA TENNESSEE TEXAS UTAH VERMONT VIRGINIA WASHINGTON WEST VIRGINIA WISCONSIN WYOMING 1. 建立數(shù)據(jù)文件 程序如下: data princ1 。這七種犯罪是: murder(殺人罪), rape(強奸罪),robbery(搶劫罪), assault(斗毆罪), burglary(夜盜罪), larceny(偷盜罪), auto(汽車犯罪),試作主 成分 分析。 ? partial語句 —— 指明對偏相關陣或偏協(xié)方差矩陣進行分析時,被偏出去的這些數(shù)值變量的名字。 ? var 語句 —— 指明分析的數(shù)值變量。 0bbca224c509b9c88ed2d108f0e53c72 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 6 of 30 ? noprint—— 不打印輸出分析結(jié)果。如果沒有規(guī)定此項,主 成分 得分的方差等于相應的特征值。 ? n=個數(shù) —— 指定主分量個數(shù)。 ? outstat=數(shù)據(jù)集名 —— 生成一個包括變量的平均數(shù)、標準差、相關系數(shù)、特征值、特征向量的輸出數(shù)據(jù)集。 ? type= cov或 type= corr—— 指明數(shù)據(jù)集類型,例如, data= new type= corr:表明new為一相關系數(shù) corr數(shù)據(jù)集。 prinp 過程的結(jié)果表包括每一變量的簡單統(tǒng)計數(shù)、相關系數(shù)或方 差-協(xié)方差矩陣、特征值和特征向量等。 by 變量 。 weight 變量 。 var 變量列表 。分析結(jié)果可以存儲到數(shù)據(jù)集中,供其他過程調(diào)用。 計算出主成分之后,應對要使用的前若干個主成分作出符合實際背景和意義的解釋。 Kaiser( 1960)主張將特征值小于 1 的主 成分 予以放棄,而只保留特征值大于 1 的主 成分 。在實際研究里,研究者如果用不超過五或六個主 成分 ,就能解釋變異之 70%~80%,已可令人滿意。這些綜合變量集中了原始變量的大部分信息。此外,為了達到最大變異的目的,我們可用主 成分 分析將原來的變量轉(zhuǎn)變?yōu)?成分 ,在獲得所要的 成分 之后,可將各變量的原始數(shù)據(jù)轉(zhuǎn)換為 成分 數(shù)據(jù),以供進一步深入的統(tǒng)計分析。實際計算時首先對數(shù)據(jù)進行標準化處理,這樣所得出的協(xié)方差陣與相關陣就是相同的。設 ??? ?nj jii xnx 11 ,令 njpiS xxxiiijiji ,2,1。一般情況下,如果前 m個主 成分 的累積貢獻率大于等于 85%,則就取 m個主 成分 ,就已經(jīng)能夠反映全部 p個變量的絕大部分信息了。我們可以求出協(xié)方差矩陣 V 的特征根和 特征向量,不妨設為 1? ≥ 2?≥?≥ m? 0,其所對應的特征向量分別為 1a , 2a ,?, ma ,那么, xaxaxa m??? , 21 ? 就是向量 x 的第一主成分、第二主成分,?,第 m 主成分。1~1Xnx? ,其中 )1,1,1( 1~ ?? ,協(xié)方差矩陣的估計量為 XXMnV ?? 01 ,其中 ]1~1~1[ 39。 三、 樣本資料數(shù)據(jù) 的主成分分析 在實際分析中,我們一般得到如表( )所示的數(shù)據(jù)資料,設 ),( 21 ?? pXXXx ?,第 i 個樣品的數(shù)據(jù)為 ),( 21 ??? ipiii xxxx ?,樣本資料數(shù)據(jù)用矩陣表示為 錯誤 !未定義書簽。我們進一步還可以考慮第 k主 成分 與 p 個變量 x1, x2, ?, xp的相關系數(shù),稱其為因子負荷量,記為L( Zk, xi) (對相關陣的主 成分 或標準化后的數(shù)據(jù) ),有 : ? ? piaxZL ikkik ,2,1, ??? ? () 其中 , 錯誤 !未定義書簽。 () 為第 k個主 成分 的貢獻率 , 它反映了第 k個主 成分 提取全部信息的多少。要特別注意,它 不同于最小二乘回歸的幾何表示,回歸是最小化所有數(shù)據(jù)點到擬合直線的垂直偏差的平方和。 用開頭 i 個主 成分 形成的 i 維子空間,從幾何上看,當采用從每個數(shù)據(jù)點到子空間的垂直距離的平方和作為度量時,這個 i 維子空間對數(shù)據(jù)點給出了最好的擬合。第一主 成分 則是這個橢圓的長軸方向, 因為原坐標系的 100 點按長軸方向旋轉(zhuǎn)后數(shù)據(jù)最離散,具有最大的方差,設定旋轉(zhuǎn)方向的表示為單元圓上的一個單位方向,與長軸平行的單位方向 ),( 2111aa 具有 1221211 ??aa ,因此,不難求出第一主 成分 的系數(shù)向量 ),( 2111aa 的 具體值。 p 維隨機向量 X 的主 成分 其實就是 p 個變量 pxxx , 21 ? 的一些特殊的線性組合,在幾何上這些線性組合正好把 pxxx , 21 ? 構(gòu)成的原坐標系統(tǒng)經(jīng)過旋轉(zhuǎn)后產(chǎn)生新坐標系統(tǒng),這個新坐標系統(tǒng)的軸方向上具有最大的變異,同時提供了協(xié)方差陣的最簡潔的表示(非對角線上為 0)。當 ji? 時 0),( ??????? jijjiji aaVaaxaxaC O V ? () 所以 , 主成分之間是不相關的。根據(jù)限制性條件下的拉格朗日極值理論可以證明,在此情況下的 )( xaVar ? 的最大值等價于求 : aaVaaa ???0max () 的值,就等于矩陣 V 的最大 特征根 1? , a 就是 1? 對應的特征向量。 對于綜合變量 Z ,我們要選擇 一組系數(shù) ),( 21 paaaa ???使得 Z 的方差最大;由于 VaaxaVar ??? )( ,對任意給定的常數(shù) c , VaacxacV ar ??? 2)( ,如果對 a 不加以限制,上述問題就變得毫無意義。 。但是對大量的實際問題中提出來的數(shù)據(jù),各變量之間往往存在著不同程度的相關關系,這時要搞清這些數(shù)據(jù)之間的關系,就必須在高維空間中加以研究,這顯然是比較麻煩的,為了克服這一困難,一個很自然的想法就是采取 降維的方法,也就是利用全部 p 個變量來重新構(gòu)造 q 個新的綜合變量( pq? ) , 并使得這些較少的變量既能盡可能多地反映原來 p 個變量的統(tǒng)計特性 , 并且它們之間又是相互獨立的。 ? 錯誤 !未定義書簽。 錯誤 !未定義書簽。 表 p 個變量的 n 組樣品數(shù)據(jù) 樣品號 變量 1 2 ? n 1X 2X ? pX 11x 21x ? 1nx 12x 22x ? 2nx 錯誤 !未定義書簽。用一句話來說,主 成分 分析是將多個變量化為少數(shù)綜合變量的一種多元統(tǒng)計方法。0bbca224c509b9c88ed2d108f0e53c72 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 1 of 30 第三十五課 主 成分 分析 一、 主 成分 的導出 主 成分 分析( principal ponent analysis)是 1901 年提出,再由 Hotelling( 1933)加以發(fā)展的一種統(tǒng)計方法。其主要目的是在于將許多變量減少,并使其改變?yōu)樯贁?shù)幾個相互獨立的線性組合形成的變量(主 成分 ),而在經(jīng)由線性組合而得的 成分 之方差會變?yōu)樽畲?,使得原?p 維資料在這些 成分 上顯示最大的個別差異來。設有 n 組樣品 ,每組樣品有 p 個變量,記 n 組樣品數(shù)據(jù)見表 。 錯誤 !未定義書簽。 px1 錯誤 ! 未定義書簽。 如果 p 個變量是相互獨立的,則可以將問題化為單變量逐個處理,這是比較簡單的。 假定 ?x 1(x , 2x , ? , )?px是一組隨機變量,并且 ??Ex ,協(xié) 方差陣 VxD ?)( 錯誤 !未定義書簽??紤] 1x , 2x , ? ,px的一個線性組合(或稱線性變換): 0bbca224c509b9c88ed2d108f0e53c72 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 2 of 30 xaxaxaxaZ pp ?????? ?2211 () 這里 ),( 21 paaaa ??? 。于是限制 1??aa ,求 )( xaVar ? 的最大值。若記矩陣 Σ *的 p 個特征值 1? ≥ 2? ≥?≥ m? 1?m? = ? = p? = 0,且 m 個非零特征值所對應的特征向量分別為 1a , 2a ,?, ma ,則 : 1111m a x VaaVaaaa ?????? ? 222011m a x VaaVaaaa aa ?????? ?? ? ? mmmmiaa aa VaaVaai???????? ?? ?)1,2,1(01 m a x ? 那么 , 把矩陣 V 的非 0 特征根 1? ≥ 2? ≥?≥ m? 0 所對應的單位特征向量 1a , 2a ,?,ma 分別作為 ?x 1(x , 2x , ? , )?px 的系數(shù)向量, xaxaxa m??? , 21 ? 分別稱為隨機向量 x 的第 1 主成分、第 2 主成分,?,第 m 主成分。而且可以看到,主 成分 分析主要就是由觀察數(shù)據(jù)陣 X 得到協(xié)方差 V 的估計 V? ,從 V? 出發(fā)計算它的特征值和特征向量。例如,我們有一個 p =2 維隨機向量 X 的 n =100 個點構(gòu)成一個橢圓形狀, 如 圖 35- 10bbca224c509b9c88ed2d108f0e53c72 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 3 of 30 所示。而橢圓的短軸與長軸是垂直的,是第二個主 成分 的方向,因為短軸是與長軸不相關方向中具有最大的方差,同樣與短軸平行的單位方向 ),( 2212aa 具有 1222212 ??aa ,同求第一主成分 的系數(shù)向量一樣,我們也能容易
點擊復制文檔內(nèi)容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1