freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析判別分析(編輯修改稿)

2024-09-24 17:33 本頁面
 

【文章內(nèi)容簡(jiǎn)介】 密度估計(jì)的輸出 SAS數(shù)據(jù)集。 ? testout=數(shù)據(jù)集名 —— 生成一個(gè)輸出 SAS數(shù)據(jù)集。包含來自 testdata指定數(shù)據(jù)集的所有數(shù)據(jù),后驗(yàn)概率和每個(gè)觀測(cè)被分 入 的類。當(dāng) canonical選項(xiàng)指定時(shí),該數(shù)據(jù)集還包括典型變量得分的新變量。 ? testoutd=數(shù)據(jù)集名 —— 生成一個(gè)包含 testdata 指定數(shù)據(jù)集的所有數(shù)據(jù)和對(duì)每一觀測(cè)的組 密度估計(jì)的輸出 SAS數(shù)據(jù)集。 2. 有關(guān)判別分析的類型和規(guī)則選項(xiàng) ? method= normal | npar—— 確定導(dǎo)出分類準(zhǔn)則的方法,默認(rèn)值為 method= normal。當(dāng)指定 method= normal時(shí),基于類內(nèi)服從多元正態(tài)分布,并導(dǎo)出線性或二次判別函數(shù);當(dāng)ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 12 of 70 指定 method=npar時(shí),采用非參數(shù)方法。 ? pool= no| test | yes—— 確定平方距離的度量,是以合并協(xié)方差陣還是組內(nèi)協(xié)方差陣為基礎(chǔ),默認(rèn)值為 pool= yes。當(dāng) pool= yes 時(shí),采用合并協(xié)方差陣得出線性判別函數(shù);當(dāng)pool= no 時(shí),采用單個(gè)組內(nèi)協(xié)方差陣得出二次判別函數(shù);當(dāng) method= normal時(shí), pool=test要求對(duì)組內(nèi)協(xié)方差陣的齊性的似然比檢驗(yàn)進(jìn)行 Bartlett修正,當(dāng)不加選擇項(xiàng) short時(shí),線性判別函數(shù)會(huì)直接給出,而二次型判別函數(shù)需通過建立輸出數(shù)據(jù)集方式獲得。 ? slpool= p—— 指定齊性檢驗(yàn)的顯著水平。只 有 當(dāng) pool=test 指定時(shí)才選擇 slpool=選項(xiàng)。如果 pool=test 而 slpool=未指定,顯著水平為 。 ? threshold= p—— 指定分類中可以接受的最小后驗(yàn)概率 p值。缺省值 p=0。如果某觀察樣品歸屬于某組的最大后驗(yàn)概率值小于這個(gè) p 值,那么這個(gè)觀察樣品歸入 OTHER(已知組外的組)組。 ? anova 和 manova 選項(xiàng) —— 分別要求輸出對(duì)各類的單個(gè)變量與多個(gè)變量的均數(shù)、均值向量之間進(jìn)行一元或多元方差分析的結(jié)果,其作用就是檢驗(yàn)判別函數(shù)的判別效果。 ? listerr 和 crosslisterr 選項(xiàng) —— listerr 表示要求僅僅輸出由后驗(yàn)概率產(chǎn)生錯(cuò)誤分類的那些樣品點(diǎn)的有關(guān)信息, crosslisterr 表示要求以交叉表的形式輸出實(shí)際類別與分類結(jié)果之間一致和不一致的有關(guān)信息。 3. 有關(guān)非參數(shù)法的選項(xiàng) ? k=數(shù)值 —— 為 k最近鄰規(guī)則指定一個(gè) k值。觀察 x分入一個(gè)組基于從 x的 k個(gè)最近鄰得到的信息。 ? r=數(shù)值 —— 為核密度估計(jì)指定一個(gè)半徑 r 值。 ? kernel=biw/epa/nor/tri/uni—— 為估計(jì)組密度指定一個(gè)核密度,缺省值為 uni。 ? metric=diagonal/full/identity—— 為平方距離的計(jì)算指定量度。缺省值為 full。 4. 其他主要語句 ? var 語句 —— 指定用于進(jìn)行判別分析的變量子集,建立起關(guān)于此變量子集的判別函數(shù)式。 ? priors 語句 —— 指定先驗(yàn)概率,它有 3種指定方法, ① priors equal,表示各類先驗(yàn)概率相等,缺省值; ② priors proportional, 表示各類先驗(yàn)概率等于各類樣本頻率; ③ priors a=p1 b=p2 c=p3, 其中 a、 b 和 c 是分類標(biāo)志, p p2 和 p3 是先驗(yàn)概率, p1+p2+p3=1。 五、 Candisc 典型判別分析過程 candisc 過程完成典型判別分析,計(jì)算平方 Mahalanobis 距離并做單變量與多變量的單向方差分析并且計(jì)算類均值間基于合并類內(nèi)協(xié)方差陣的平方距離( Mahalanobis 距離)。該過程產(chǎn)生包括典型系數(shù)和典型變量得分的輸出數(shù)據(jù)集。 典型判別分析是與主成 分 分析和典型相關(guān)有關(guān)的降維方法。給定兩組或更多組帶有幾個(gè)定量變量的觀察,典型判別分析得出與組有最大可能多重相關(guān)的變量的線性組合。最大的多重相關(guān)叫做第一典型相關(guān)。線性組合的系數(shù)稱為典型系數(shù)或典型權(quán)重。線性組合定義的變量稱為第一典型變量或典型成 分 。第二典型相關(guān)由與第一典型變量無關(guān)的線性組合得到,該組合應(yīng)與組有最大可能多重相關(guān)。抽取典型變量的過程可以重復(fù)直到典型變量的個(gè)數(shù)等于原始變量的個(gè)數(shù)或類的個(gè)數(shù)減一。 candisc 得出的典型變 量,如同主成分概括全變差一樣來概括類ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 13 of 70 間變差。典型判別分析相當(dāng)于執(zhí)行了以下步驟: ? 變換變量使合并的類內(nèi)協(xié)方差陣為單位陣; ? 計(jì)算變換后的變量的類均值; ? 對(duì)均值做主成 分 分析,以每一類中的觀察個(gè)數(shù)為權(quán)重; ? 特征值等于每一個(gè)主成 分 方向上的類間偏差與類內(nèi)偏差之比; ? 把主成 分 變量反變換到原始變量的空間,獲得典型變量。 典型變量間不相關(guān),但典型系數(shù)并不正交。因此,典型變量并不代表原始變量空間中的正交方向。對(duì)每一個(gè)典型相關(guān), candisc 檢驗(yàn)總體中該相關(guān)及更小的典型相關(guān)為零的假設(shè)。采用 F 近似值比一般的 2? 近似值能給出更好的小樣本結(jié)果。每一類內(nèi)變量應(yīng)該具有近似的多元正態(tài)分布,為了概率水平有效,方差陣應(yīng)該是共同的。第一典型相關(guān)大于等于組與任何一個(gè)原始變量間的多重相關(guān)。 該過程產(chǎn)生一個(gè)包含每一典型變量得分的輸出數(shù)據(jù)集。可以利用 print 過程列出這些值,還可以用 plot 過程作出典型變量對(duì)的散點(diǎn)圖以助于直觀地解釋組的不同。另一個(gè)輸出數(shù)據(jù)集包含由 factor 過程利用旋轉(zhuǎn)算法得到的典型系數(shù)。 candisc 過程一般由下列語句控制: proc candisc 選項(xiàng)列表 ; class 變量; by 變量表; freq 變量; var 變量表; weight 變量; run; 1. proc candisc 語句 選項(xiàng)列表 中的選項(xiàng)按性質(zhì)可以分成以下 4 類: ( 1) 數(shù)據(jù)集選項(xiàng) ? data=數(shù)據(jù)集名 —— 指定欲進(jìn)行分析的數(shù)據(jù)集。默認(rèn)時(shí),采用最新生成的數(shù)據(jù)集。 ? out=數(shù)據(jù)集名 —— 生成一個(gè)包含原始數(shù)據(jù)和典型變量得分的 SAS 數(shù)據(jù)集。 ? outstat=數(shù)據(jù)集名 —— 生成一個(gè)包含各種統(tǒng)計(jì)量的輸出 SAS 數(shù)據(jù)集。 ( 2) 典型變量選 項(xiàng) ? ncan= n —— 指定將被計(jì)算的典型變量的個(gè)數(shù)。 n 的值必須小于或等于變量的個(gè)數(shù)。如果指定 ncan= 0,過程打印典型相關(guān)而不是典型系數(shù)、結(jié)構(gòu)或均值。如果 ncan為負(fù)值,典型分析將被抑制。 ? prefix=前綴名 —— 為命名典型變量指定前綴。 ( 3) 奇異性選項(xiàng) ? singular = p—— 指定判別全樣本相關(guān)陣和合并類內(nèi)協(xié)方差陣奇異的標(biāo)準(zhǔn),這里 0< p 1。默認(rèn)值為 singular =108。 ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 14 of 70 ( 4) 打印選項(xiàng) 按打印的內(nèi)容可以分成以下 5 類: ① 控制相關(guān)陣打印的選項(xiàng): ? bcorr—— 類間相關(guān)。 ? pcorr—— 合并類內(nèi)相關(guān)(基于合并類內(nèi)協(xié)方差的偏相關(guān))。 ? tcorr—— 全樣本相關(guān)。 ? wcorr—— 每一類水平的類內(nèi)相關(guān)。 ② 控制協(xié)方差陣打印的選項(xiàng): ? bcov—— 類間協(xié)方差。 ? pcov—— 合并類內(nèi)協(xié)方差。 ? tcov—— 全樣本協(xié)方差。 ? wcov—— 每一類水平的類內(nèi)協(xié)方差。 ③ 控制 sscp 矩陣打印的選項(xiàng): ? bsscp—— 類間 sscp 陣。 ? psscp—— 合并類內(nèi)修正 sscp 陣。 ? tsscp—— 全樣本修正 sscp 陣。 ? wsscp—— 每一類水平的類內(nèi)修正 sscp 陣。 ④ 其他選項(xiàng): ? anova—— 檢驗(yàn)總體中每一變量類均值相等的假設(shè)的單變量統(tǒng)計(jì)量。 ? distance—— 類均值間的平方 Mahalanobis 距離。 ? simple—— 全樣本和類內(nèi)的簡(jiǎn)單描述性統(tǒng)計(jì)量。 ? stdmean—— 全樣本和合并的類內(nèi)標(biāo)準(zhǔn)化類均值。 ? all—— 產(chǎn)生以上所有打印選項(xiàng)。 ⑤ 抑制打印的選項(xiàng): ? noprint—— 不打印。 ? short—— 只打印典型相關(guān)表和多元檢驗(yàn)統(tǒng)計(jì)數(shù)字。 2. 一般語句 ? class 語句 —— class 變量的值定義分析的組。類水平由 classs 變量的值確定。 class變量可以是數(shù)值型或字符 型。 ? var語句 —— var語句指定分析中包括的定量變量。如果省略 var語句,分析將包括未在其他語句中列出的全部定量變量。 其他語句的說明我們?cè)谶@里省略了。 六、 實(shí)例分析 例 Fisher 于 1936 年發(fā)表的鳶尾花( Iris)數(shù)據(jù)被廣泛地作為判別分析的例子。數(shù)據(jù)是對(duì) 3 種鳶尾花:剛毛鳶尾花( setosa 第 1 組)、變色鳶尾花( versicolor 第 2 組)和佛吉尼亞鳶尾花( virginica 第 3 組)各抽取一個(gè)容量為 50的樣本,測(cè)量其花萼長(zhǎng)( sepallen) x花萼寬( sepalwid) x2 、花瓣長(zhǎng)( petallen) x花瓣寬( petalwid) x4,單位為 mm,分組標(biāo)記為S,數(shù)據(jù)見表 。 表 150 個(gè)樣品的鳶尾花數(shù)據(jù) ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 15 of 70 X1 X2 X3 X4 S X1 X2 X3 X4 S X1 X2 X3 X4 S X1 X2 X3 X4 S 50 33 14 02 1 64 28 56 22 3 65 28 46 15 2 67 31 56 24 3 63 28 51 15 3 46 34 14 03 1 69 31 51 23 3 62 22 45 15 2 59 32 48 18 2 46 36 10 02 1 61 30 46 14 2 60 27 51 16 2 65 30 52 20 3 56 25 39 11 2 65 30 55 18 3 58 27 51 19 3 68 32 59 23 3 51 33 17 05 1 57 28 45 13 2 62 34 54 23 3 77 38 67 22 3 63 33 47 16 2 67 33 57 25 3 76 30 66 21 3 49 25 45 17 3 55 35 13 02 1 67 30 52 23 3 70 32 47 14 2 64 32 45 15 2 61 28 40 13 2 48 31 16 02 1 59 30 51 18 3 55 24 38 11 2 63 25 50 19 3 64 32 53 23 3 52 34 14 02 1 49 36 14 01 1 54 30 45 15 2 79 38 64 20 3 44 32 13 02 1 67 33 57 21 3 50 35 16 06 1 58 26 40 12 2 44 30 13 02 1 77 28 67 20 3 63 27 49 18 3 47 32 16 02 1 55 26 44 12 2 50 23 33 10 2 72 32 60 18 3 48 30 14 03 1 51 38 16 02 1 61 30 49 18 3 48 34 19 02 1 50 30 16 02 1 50 32 12 02 1 61 26 56 14 3 64 28 56 21 3 43 30 11 01 1 58 40 12 02 1 51 38 19 04 1 67 31 44 14 2 62 28 48 18 3 49 30 14 02 1 51 35 14 02 1 56 30 45 15 2 58 27 41 10 2 50 34 16 04 1 46 32 14 02 1 60 29 45 15 2 57 26 35 10 2 57 44 15 04 1 50 36 14 02 1 77 30 61 23
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1