freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析聚類分析-閱讀頁(yè)

2024-09-08 17:31本頁(yè)面
  

【正文】 oc standard mean=0 std=1 out=abc。)或由 factor 過(guò)程產(chǎn)生因子得分,然后由 fastclus 過(guò)程加以聚類。類的劃分通過(guò)計(jì)算每類第一主 成分 或重心 成分 的最大方差而確定,因此,同每一類有聯(lián)系的是該類中這些變量的線性組合。對(duì)于含有很多變量的變量集,常常用信息損失很少的類分量集替代。 varclus 過(guò)程生成的輸出數(shù)據(jù)集,可由 score 過(guò)程計(jì)算出每類的得分。根據(jù)規(guī)定的選項(xiàng),選中的類應(yīng)該是:或者用它的類分量所解釋的方差百分比最小,或者同第二主 成分 有關(guān) 的特征值為最大 。先計(jì)算出開(kāi)頭兩個(gè)主 成分 ,再進(jìn)行斜交旋轉(zhuǎn),并把每個(gè)變量分配到旋轉(zhuǎn)分量對(duì)應(yīng)的類里,分配原則為使變量與這個(gè)主 成分 的相關(guān)系數(shù)最大。通過(guò)迭代,變量被重新分配到這些類里,使得由這些類分量所解釋的方差最大。 ④ 當(dāng)每一類滿足用戶規(guī)定的準(zhǔn)則時(shí),過(guò)程停止迭代。準(zhǔn)則缺省時(shí),每類只要有一個(gè)特征值大于 1,則過(guò)程停止。 var 變量表 。 seed 變量表 。 weight 變量 。 run; ( 1) proc varclus 語(yǔ)句 選項(xiàng)列表 。 ① 有關(guān)輸入輸出數(shù)據(jù)集選項(xiàng)有: ? data=輸入數(shù)據(jù)集 —— 可以是原始數(shù)據(jù)或 type =corr、 ucorr、 cov、 ucor、 sscp或 factor類型的數(shù)據(jù)集。 ? outtree=輸出數(shù)據(jù)集 —— 包含聚類過(guò)程的樹(shù)狀結(jié)構(gòu)信息,供 tree 過(guò)程調(diào)用。 ? maxc=n —— 最大聚類個(gè)數(shù)。 ? percent=n —— 指定類分量必須解釋的方差百分比。 ? maxiter= n—— 規(guī)定在交替最小二乘法階段中的最大迭代次 數(shù)。 ? cov—— 用協(xié)方差矩陣聚類。 ? initial= group| input|random|seed—— 規(guī)定初始化類的方法。 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 17 of 62 ? simple—— 打印均值和標(biāo)準(zhǔn)差。 ? summary—— 只打印最后的匯總表。 ( 2) 其他語(yǔ)句。 4. Tree 聚類樹(shù)型輸出過(guò)程 本過(guò)程利用 cluster過(guò)程和 varclus 過(guò)程生成的數(shù)據(jù)集來(lái)繪制樹(shù)狀結(jié)構(gòu)圖。 tree 過(guò)程可以把輸入數(shù)據(jù)集中的任何數(shù)值變量都能夠用來(lái)規(guī)定這些類的高度,還可根據(jù)用戶的要求生成一個(gè)輸出數(shù)據(jù)集,其中包含一個(gè)變量,其值用以標(biāo)識(shí)在這個(gè)樹(shù)里指定水平上不相交的類。 name 變量 。 height 變量 。 copy 變量表 。 by 變量表 。 按選項(xiàng)控制的性質(zhì)可以分成以下 3 類。 ? out=輸出數(shù)據(jù)集 —— 輸出繪制樹(shù)形結(jié)構(gòu)圖的有關(guān)數(shù)據(jù)到指定數(shù)據(jù)集。 ? ncl =n—— 規(guī)定在 out=的輸出數(shù)據(jù)集中所希望的類個(gè)數(shù)。 n 的缺省值為 0。 ? hor—— 要求樹(shù)狀圖的取向?yàn)樗椒较?,且?shù)根在左邊。 ③ 有關(guān)樹(shù)高度和樹(shù)葉控制的選項(xiàng): ? height=常規(guī)變量 —— 規(guī)定在樹(shù)狀圖中用以確定高度軸的常規(guī)變量。 ? maxh=n—— 指定在高度軸上打印的最大值。 ? ntich=n—— 指定在高度軸上刻度之間的間隔個(gè)數(shù)。 ? pos=n—— 指定在高度軸上打印位置的個(gè)數(shù)。 ? tickpos=n—— 指定在高度軸上每個(gè)刻度間隔打 印位置的個(gè)數(shù)。缺省值為空格。缺省值為 X。缺省值為“ .”。缺省值為“ X”。 ? des—— 把選項(xiàng) sort 的排列順序反過(guò)來(lái)。 ? noprint—— 只創(chuàng)建 out=的輸出數(shù)據(jù)集而不繪制樹(shù)狀圖。 ( 2) 其他語(yǔ)句。 name變量同 parent 變量聯(lián)合確定樹(shù)的結(jié)構(gòu)。 ? parent語(yǔ)句 —— 規(guī)定一個(gè)字符或數(shù)值變量,用以標(biāo)識(shí)每個(gè)觀察的父輩節(jié)點(diǎn)。 ? height語(yǔ)句 —— 規(guī)定一個(gè)數(shù)值變量用于定義這個(gè)樹(shù)中每個(gè)節(jié) 點(diǎn)(類)的高度。 ? copy 語(yǔ)句 —— 把語(yǔ)句中列出的一個(gè)或幾個(gè)變量復(fù)制到 out=的輸出數(shù)據(jù)集中。 六、 實(shí)例分析 例 試對(duì) 1976 年 74 個(gè)國(guó)家 (地區(qū)) 每 100000 人口的出 生 率和死亡率數(shù)據(jù)進(jìn)行聚類分析(使用 cluster 和 tree 過(guò)程)。 表 1976 年 74 個(gè)國(guó)家 (地區(qū)) 的出 生 率和死亡率 country birth death country birth death AFGHANISTAN 52 30 KOREA,DEM PEO REP 43 12 LGERIA 50 16 KOREA,REPUBLIC OF 26 6 ANGOLA 47 23 MADAGASCAR 47 22 ARGENTINA 22 10 MALAYSIA 30 6 AUSTRALIA 16 8 MEXICO 40 7 AUSTRIA 12 13 MOROCCO 47 16 BANGLADESH 47 19 MOZAMBIQUE 45 18 BELGIUM 12 12 NEPAL 46 20 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 19 of 62 BRAZIL 36 10 NETHERLANDS 13 8 BULGARIA 17 10 NIGERIA 49 22 BURMA 38 15 PAKISTAN 44 14 CAMEROON 42 22 PERU 40 13 CANADA 16 7 PHILIPPINES 34 10 CHILE 22 7 POLAND 20 9 CHINA 31 11 PORTUGAL 19 10 CHINESE TAIWAN 26 5 RHODESIA 48 14 COLOMBIA 34 10 ROMANIA 19 10 CUBA 20 6 SAUDI ARABIA 49 19 CZECHOSLOVAKIA 19 11 SOUTH AFRICA 36 12 ECUADOR 42 11 SPAIN 18 8 EQYPT 39 13 SRI LANKA 26 9 ETHIOPIA 48 23 SUDAN 49 17 FRANCE 14 11 SWEDEN 12 11 GERMAN DEM REP 12 14 SWITZERLAND 12 9 GERMANY, FED REP OF 10 12 SYRIA 47 14 GHANA 46 14 TANZANIA 47 17 GREECE 16 9 THAILAND 34 10 GUATEMALA 40 14 TURKEY 34 12 HUNGARY 18 12 USSR 18 9 INDIA 36 15 UGANDA 48 17 INDONESIA 38 16 UNITED KINGDOM 12 12 IRAN 42 12 UNITED STATES 15 9 IRAQ 48 14 UPPER VOLTA 50 28 ITALY 14 10 VENEZUELA 36 6 IVORY COAST 48 23 VIETNAM 42 17 JAPAN 16 6 YUGOSLAVIA 18 8 KENYA 50 14 ZAIRE 45 18 1. 建立數(shù)據(jù),并繪制原始數(shù)據(jù)散點(diǎn)圖。 title 39。 input country $20. birth death 。 AFGHANISTAN 52 30 ALGERIA 50 16 ? ? ? ZAIRE 45 18 。||39。 plot death*birth / hpos=86 vpos=26 。 提交運(yùn)行程序后,輸出結(jié)果 如 圖 所示。從圖 ,按出 生 率和死亡率來(lái)區(qū)分 74 個(gè)國(guó)家 (地區(qū)) ,直觀上可以區(qū)分成三類:低出 生 率和低死亡率的國(guó)家 (地區(qū)) (富裕發(fā)達(dá)的國(guó)家 或地區(qū) ),高出 生 率和高死亡率的國(guó)家 (地區(qū)) (貧窮落后的國(guó)家 或地區(qū) ),中出 生 率和低死亡率的國(guó)家 (地區(qū)) (中等發(fā)展中的國(guó)家 或地區(qū) )。 菜單方法,選擇菜單命令 Globals/SAS/Assist/Data analysis/Multivariate/Cluster analysis(聚類分析 )。CLUSTER ANALYSIS OF BIRTH AND DEATH RATES IN 74 COUNTRIES39。 proc cluster data=vital out=tree method=amp。 var birth death。 proc tree data=tree noprint out=out ncl=amp。 copy birth death。||39。 title2 PLOT OF amp。mm。 %mend。 每個(gè)聚類分析由名為 %analyze 的宏命令實(shí)現(xiàn)。例如,針對(duì)于 %analyze(two k=6,3) 宏命令,輸入?yún)?shù)變量 mm=“ two k=6”, nn=“ 3”?!辈僮鞣?,表示取出變量中的值。mm,而不是 method=mm。下面我們僅給出了用 average 法聚類的輸出結(jié)果及選擇 8 類后的散點(diǎn)圖, 如 表 和圖 所示。 cluster 過(guò)程的結(jié)果輸出包括協(xié)方差陣的特征值( Eigenvalue),兩相鄰特征值之差( Difference),各特征值占總方差的百分比( Proportion)和累計(jì)百分比( Cumulative)。用 average 法聚類的結(jié)果表明( print=15,只輸出顯示聚類成 15 類后各合并過(guò)程), ncl列為聚類數(shù); Clusters Joined 標(biāo)題下的兩列為每一次聚類成 1 個(gè)新類的 2個(gè)樣品,標(biāo)有 obn 表示是原始樣品中的第 n 號(hào)樣品,標(biāo)有 cln 表示是在上面聚類過(guò)程中已經(jīng)聚成的第 n 類; freq列為新類中所含的樣品數(shù); sprsq列為半偏 R2,表示每一次合并對(duì)信息的損失程度; rsq 列為 R2,表示累計(jì)聚類結(jié)果,即 rsqn=rsqn1- sprsqn; ersq 列為在均勻零假設(shè) CLUSTER ANALYSIS OF BIRTH AND DEATH RATES IN 74 COUNTRIES PLOT OF 8 CLUSTERS FROM METHOD=AVERAGE Plot of DEATH*BIRTH. Symbol is value of CLUSTER. DEATH 30 | 8 29 | 28 | 8 27 | 26 | 25 | 24 | 23 | 11 22 | 1 1 1 21 | 20 | 3 19 | 3 3 18 | 3 17 | 6 33 3 16 | 6 3 3 15 | 6 6 14 | 5 6 6 3 33 3 13 | 5 66 12 | 5 5 4 2 2 66 11 | 5 4 4 2 6 10 | 4 4 4 4 2 2 9 | 4 44 4 4 7 8 | 4 4 4 7 | 4 4 2 6 |
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1