freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析判別分析-免費閱讀

2024-09-20 17:33 上一頁面

下一頁面
  

【正文】 Prob Step Entered Removed In R**2 Statistic F Lambda Lambda 1 PETALLEN 1 2 SEPALWID 2 3 PETALWID 3 4 SEPALLEN 4 Average Squared Variable Number Canonical Prob Step Entered Removed In Correlation ASCC Label 1 PETALLEN 1 Petal Length in mm. 2 SEPALWID 2 Sepal Width in mm. ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財經(jīng)大學(xué)經(jīng)濟信息管理系 IS/SHUFE Page 18 of 70 3 PETALWID 3 Petal Width in mm. 4 SEPALLEN 4 Sepal Length in mm. 表 使用 變量 petallen 進行判別分析 Discriminant Analysis of Fisher (1936) Iris Data Discriminant Analysis 150 Observations 149 DF Total 1 Variables 147 DF Within Classes 3 Classes 2 DF Between Classes Class Level Information Prior SPECIES Frequency Weight Proportion Probability Setosa 50 Versicolor 50 Virginica 50 Discriminant Analysis Test of Homogeneity of Within Covariance Matrices Notation: K = Number of Groups P = Number of Variables N = Total Number of Observations Number of Groups N(i) = Number of Observations in the i39。 run。 run。原始輸入數(shù)據(jù)中分類變量 species 只可取 2 和 3 三種值,分別代表三個類別。 petalwid=39。 input sepallen sepalwid petallen petalwid species 。 2=39。 ? var語句 —— var語句指定分析中包括的定量變量。 ? simple—— 全樣本和類內(nèi)的簡單描述性統(tǒng)計量。 ? tcov—— 全樣本協(xié)方差。 ( 3) 奇異性選項 ? singular = p—— 指定判別全樣本相關(guān)陣和合并類內(nèi)協(xié)方差陣奇異的標準,這里 0< p 1。默認時,采用最新生成的數(shù)據(jù)集。對每一個典型相關(guān), candisc 檢驗總體中該相關(guān)及更小的典型相關(guān)為零的假設(shè)。線性組合的系數(shù)稱為典型系數(shù)或典型權(quán)重。缺省值為 full。如果某觀察樣品歸屬于某組的最大后驗概率值小于這個 p 值,那么這個觀察樣品歸入 OTHER(已知組外的組)組。當(dāng)指定 method= normal時,基于類內(nèi)服從多元正態(tài)分布,并導(dǎo)出線性或二次判別函數(shù);當(dāng)ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財經(jīng)大學(xué)經(jīng)濟信息管理系 IS/SHUFE Page 12 of 70 指定 method=npar時,采用非參數(shù)方法。 ? outcross=數(shù)據(jù)集名 —— 生成一個輸出 SAS 數(shù)據(jù)集,包括來自 data 指定數(shù)據(jù)集的所有數(shù)據(jù),后驗 概率和每個觀測通過交叉確認被分入的類。該數(shù)據(jù)集中定量變量的名字必須與 data指定數(shù)據(jù)集中相匹配。 testid 變量 。 discrim 過程一般由下列語句控制: proc discrim 選項列表 。 三、 應(yīng)注意的幾個問題 ? 判別分析方法首先根據(jù)已知所屬組的樣本給出判別函數(shù),并制定判別規(guī)則,然后再判斷每一個新樣品應(yīng)屬于哪一組。即表示組與組之間系統(tǒng)因素引起的變異 SSR 比組內(nèi)隨機因素引起的變異 SSE 達到了最大值,此時才能使不同組之間的鑒別力達到最大。設(shè) ),( 21 paaaa ??? ,則 xay ?? 。符號“ *”代表一組,而符號“ +”則代表另一組。 如果利用以上判別準則,對全部 n1+n2 組樣品進行判別,記第一類中的樣品,而被判入第二類的有 m1 個;第二類的而被判入第一類的有 m2 個,則誤判概率可表示為: 222111 /,/ nmPnmP ?? () G 1 G 21u 2uu x21 , GGx 被誤判來自來自樣品ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財經(jīng)大學(xué)經(jīng)濟信息管理系 IS/SHUFE Page 7 of 70 二、 Fisher 線性函數(shù)判別 在分類判別問題中,關(guān)鍵問題之一是尋找一個合適的判別函數(shù)。 有兩點值得注意: ① 我們這里的判別函數(shù)和判別規(guī)則并沒有涉及分布的類型,只要二階矩存在就可以了; ② 這種判別規(guī)則符合習(xí)慣,但不可能完全判別準確,會發(fā)生誤判。 4. 多類判別 對于兩類線性判別及非線性判別,都是求得一個判別函數(shù),對于任一組樣品(或待判別樣品)將其代入判別函數(shù),求得判別得分,再依判別分界點,而決定將其判屬于哪一類。 可見 , 當(dāng) VVV ?? 21 時,我 們得到了線性判別函數(shù),因此使用線性判別函數(shù)判別;當(dāng)21 VV? 時,我們得到了二次判別函數(shù),因此使用二次判別函數(shù)判別。即 y 到母體 iG 的 距離定義為 : )()(),( 1 iii uyVuyGyd ???? ? () 那么 : )()2(2),(),( 2112121 uuVuuyGydGyd ??????? ? () 若令 : ed6e74e0641c5cc279a1942ed79030e9 商務(wù)數(shù)據(jù)分析 電子商務(wù)系列 上海財經(jīng)大學(xué)經(jīng)濟信息管理系 IS/SHUFE Page 3 of 70 )()2()( 21121 uuVuuyyw ????? ? () 上述判別規(guī)則可寫成: 當(dāng) 0)( ?yw 時, 1Gy? ;當(dāng) 0)( ?yw 時, 2Gy? 。這種判別哪個樣品歸屬于哪個組的判別準則稱為最大后驗概率準則。 判別分析方法通常要給出一個判別指標 —— 判別函 數(shù),同時還要指定一種判別規(guī)則。下面我們介紹 : ? 距離判別分析方法 ? Fisher 線性函數(shù)判別方法 一、 距離 判別分析 如果假設(shè)每組內(nèi)分布為多元正態(tài)分布,基于多元正態(tài)分布理論的參數(shù)法將導(dǎo)出一個線性或二次的距離判別函數(shù)。如果此最大后驗概率小于指定的 閾 值( threshold),則將樣品 x 判歸于除 k 組以外的其他組。 若 1u 、 2u 和 V 已知 ,則 )(yw 是 y 的線性函數(shù),稱為線性判別函數(shù)。 一般情況下,我們并不知道兩個總體的特征,即 1u 、 2u 和 1V 、 2V 是未知的,只有從兩個總體 中 抽取 樣品,假設(shè)從兩個總體各抽取了 1n 和 2n 個樣品1, 21 nxxx ?;2, 21 nyyy ?。但是,許多實際問題所提出的可能是多類判別的問題。 5. 誤判的概率 下 面我們?nèi)砸哉龖B(tài)總體為例簡單討論一下誤判的概率。如果判別函數(shù)比較復(fù)雜,那么在實際使用中就非常不方便,因此為方便起見,有時尋找 在某種意義下為最優(yōu)的線性判別函數(shù)。一個簡單的想法是:我們不妨在這個平面上畫一條直線 L ,能將兩組盡可能地分開,一組為這條直線的這一邊,另一組為這條直線的另一邊。將每個觀察到的資料代入到線性函數(shù)中得到變量 y 值: i p kpkikiik xaxaxay ???? ?2211 () 從本質(zhì)上說,這是將 p 維數(shù)據(jù)投影到某個具體方向 a 上。 下面我們看如何求出判別函數(shù) xay ?? 中的系數(shù) a 來。常用的判別方法有距離判別、貝 葉斯判別、典型判別等。 class 變量 。 var 變量表 。當(dāng) testdata選項指定時,也可以用 testclass、 testfreq和 testid語句。當(dāng) canonical選項指定時,該數(shù)據(jù)集還包含典型變量得分的新變量。 ? pool= no| test | yes—— 確定平方距離的度量,是以合并協(xié)方差陣還是組內(nèi)協(xié)方差陣為基礎(chǔ),默認值為 pool= yes。 ? anova 和 manova 選項 —— 分別要求輸出對各類的單個變量與多個變量的均數(shù)、均值向量之間進行一元或多元方差分析的結(jié)果,其作用就是檢驗判別函數(shù)的判別效果。 4. 其他主要語句 ? var 語句 —— 指定用于進行判別分析的變量子集,建立起關(guān)于此變量子集的判別函數(shù)式。線性組合定義的變量稱為第一典型變量或典型成 分 。采用 F 近似值比一般的 2? 近似值能給出更好的小樣本結(jié)果。 ? out=數(shù)據(jù)集名 —— 生成一個包含原始數(shù)據(jù)和典型變量得分的 SAS 數(shù)據(jù)集。默認值為 singular =108。 ? wcov—— 每一類水平的類內(nèi)協(xié)方差。 ? stdmean—— 全樣本和合并的類內(nèi)標準化類均值。如果省略 var語句,分析將包括未在其他語句中列出的全部定量變量。Versicolor39。 format species speame.。Petal Width in mm.39。現(xiàn)在 format 過程自定義了 2 和 3 轉(zhuǎn)換成指定的字符串顯示。 proc discrim data=iris method=normal pool=test anova short crosslisterr。 proc print data=plotiris。th Group 1 __ N(i)/2 || |Within SS Matrix(i)| V = N/2 |Pooled SS Matrix| _ _ 2 | 1 1 | 2P + 3P 1 RHO = | SUM | |_ N(i) N _| 6(P+1)(K1) DF = .5(K1)P(P+1) _
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1