freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

spss聚類分析與判別分析-文庫吧

2025-07-16 17:23 本頁面


【正文】 w Var”對話框進(jìn)行了設(shè)置,將聚類成三類時,各個樣本的類歸屬情況保存為一個變量,因此在 SPSS數(shù)據(jù)編輯窗口中就新增了一個變量的值,如圖 88所示。 圖 88 層次聚類分析結(jié)果保存 層次聚類分析中的 R型聚類 統(tǒng)計學(xué)上的定義和計算公式 定義:層次聚類分析中的 R型聚類是對研究對象的觀察變量進(jìn)行分類,它使具有共同特征的變量聚在一起。以便可以從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個數(shù)。 計算公式: R型聚類的計算公式和 Q型聚類的計算公式是類似的,不同的是 R型聚類是對變量間進(jìn)行距離的計算, Q型聚類則是對樣本間進(jìn)行距離的計算。 ? 研究問題 對一個班同學(xué)的各科成績進(jìn)行聚類,分析哪些課程是屬于一個類的。聚類的依據(jù)是 4門功課的考試成績,數(shù)據(jù)如表 82所示。 SPSS中實(shí)現(xiàn)過程 表 82 學(xué)生的四門課程的成績 姓 名 數(shù) 學(xué) 物 理 語 文 政 治 hxh yaju yu shizg hah john watet jess wish Iiakii ? 實(shí)現(xiàn)步驟 圖 89 在菜單中選擇“ Hierarchical Cluster”命令 圖 810 “Hierarchical Cluster Analysis”對話框(二) 圖 811 “Hierarchical Cluster Analysis: Method”對話框(二) 圖 812 “Hierarchical Cluster Analysis: Plots”對話框(二) 圖 813 “Hierarchical Cluster Analysis: Statistics”對話框(二) ( 1)首先是層次 R型聚類分析的結(jié)果,該結(jié)果是 SPSS輸出結(jié)果文件中的第一個表格。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二個表格如下表所示。 ( 3)輸出的結(jié)果文件中第三個表格如下表所示。 ( 4)輸出的結(jié)果文件中第四個表格如下表所示。 ( 5)輸出的結(jié)果文件中第五個表格如下表所示。 ( 6)輸出的結(jié)果文件中第六部分如下: 快速聚類分析 SPSS層次聚類分析對計算機(jī)的要求比較高,在大樣本的情況下,可以采用快速聚類分析的方法。采用快速聚類分析,得到的結(jié)果比較簡單易懂,對計算機(jī)的性能要求也不高,因此應(yīng)用也比較廣。 定義:快速聚類分析是由用戶指定類別數(shù)的大樣本資料的逐步聚類分析。它先對數(shù)據(jù)進(jìn)行初始分類,然后逐步調(diào)整,得到最終分類。快速聚類分析的實(shí)質(zhì)是 KMean聚類。 統(tǒng)計學(xué)上的定義和計算公式 和層次聚類分析一致,快速聚類分析也以距離為樣本間親疏程度的標(biāo)志。但兩者的不同在于:層次聚類可以對不同的聚類類數(shù)產(chǎn)生一系列的聚類解,而快速聚類只能產(chǎn)生固定類數(shù)的聚類解,類數(shù)需要用戶事先指定。 另外,在快速聚類分析中,用戶可以自己指定初始的類中心點(diǎn)。如果用戶的經(jīng)驗(yàn)比較豐富,則可以指定比較合理的初始類中心點(diǎn),否則,需要增加迭代的次數(shù),以保證最終聚類結(jié)果的準(zhǔn)確性。 計算公式如下。 快速聚類分析計算過程如下。 ? 首先需要用戶指定聚類成多少類(比如 k類)。 ? 然后 SPSS確定 k個類的初始類中心點(diǎn)。SPSS會根據(jù)樣本數(shù)據(jù)的實(shí)際情況,選擇 k個由代表性的樣本數(shù)據(jù)作為初始類中心。初始類中心也可以由用戶自行指定,需要指定 K組樣本數(shù)據(jù)作為初始類中心點(diǎn)。 ? 計算所有樣本數(shù)據(jù)點(diǎn)到 k個類中心點(diǎn)的歐氏距離, SPSS按照距 k個類中心點(diǎn)距離最短原則,把所有樣本分派到各中心點(diǎn)所在的類中,形成一個新的 k類,完成一次迭代過程。其中歐氏距離( Euclidean Distance)的計算公式為 ? SPSS重新確定 k個類的中心點(diǎn)。 SPSS計算每個類中各個變量的變量值均值,并以均值點(diǎn)作為新的類中心點(diǎn)。 ? 重復(fù)上面的兩步計算過程,直到達(dá)到指定的迭代次數(shù)或終止迭代的判斷要求為止。 ? 研究問題 為研究不同公司的運(yùn)營特點(diǎn),調(diào)查了 15個公司的組織文化、組織氛圍、領(lǐng)導(dǎo)角色和員工發(fā)展 4方面的內(nèi)容。現(xiàn)要將這 15個公司按照其各自的特點(diǎn)分成 4種類型,數(shù)據(jù)如表 83所示。 SPSS中實(shí)現(xiàn)過程 表 83 不同公司的特點(diǎn) 公 司 組 織 文 化 組 織 氛 圍 領(lǐng) 導(dǎo) 角 色 員 工 發(fā) 展 Microsof IBM Dell Apple 聯(lián)想 NPP 北京電子 清華紫光 北大方正 TCL 娃哈哈 Angel Hussar 世紀(jì)飛揚(yáng) Vinda ? 實(shí)現(xiàn)步驟 圖 815 在菜單中選擇“ KMeans Cluster”命令 圖 816 “KMeans Cluster Analysis”對話框 圖 817 “KMeans Cluster Analysis: Options”對話框 圖 818 “KMeans Cluster Analysis: Iterate”對話框 圖 819 “KMeans Cluster :Save New Variable”對話框 圖 820 指定初始類中心點(diǎn) 本例中選中的選項(xiàng)較多,這里按照各個結(jié)果分別解釋。 ( 1) SPSS輸出結(jié)果文件中的第一部分如下表所示。 結(jié)果和討論 ( 2)輸出的結(jié)果文件中第二部分如下表所示。 ( 3)輸出的結(jié)果文件中第三部分是快速聚類分析后的各個類包含樣本的情況。 ( 4)輸出的結(jié)果文件中第四部分如下表所示。 ( 5)輸出的結(jié)果文件中第五個部分如下表所示。 ( 6)輸出的結(jié)果文件中第六個部分如下表所示。 ( 7)輸出結(jié)果的最后一個表格列出了 4個類中分別包括的樣本數(shù),如下表所示。 ( 8)在步驟 5中曾指定了將樣本所屬類以及樣本和類中心點(diǎn)的距離,作為樣本的 2個新變量保存到 SPSS的數(shù)據(jù)編輯窗口中。 SPSS運(yùn)行后,數(shù)據(jù)編輯窗口如圖 821所示,其中我們可以看到新增加了兩個變量(圖中加深的兩列),分別表示樣本所屬類以及樣本和類中心點(diǎn)的距離。 判 別 分 析 前面 3節(jié)講述了不同種聚類分析的方法,不論是哪種方法,聚類分析都是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類。 本節(jié)講述的判別分析,也是一種比較常用的分類分析方法。判別分析先根據(jù)已知類別的事物的性質(zhì),利用某種技術(shù)建立函數(shù)式,然后對未知類別的新事物進(jìn)行判斷以將之歸入已知的類別中。 有學(xué)者在研究中提出,可以利用判別分析來對聚類分析結(jié)果的準(zhǔn)確性進(jìn)行檢驗(yàn)。聚類分析分成幾類后,即可以作為判別分析的類別輸入,進(jìn)行判斷。 定義:判別分析先根據(jù)已知類別的事物的性質(zhì)(自變量),建立函數(shù)式(自變量的線性組合,即判別函數(shù)),然后對未知類別的新事物進(jìn)行判斷以將之歸入已知的類別中。 統(tǒng)計學(xué)上的定義和計算公式 判別分析有如下的假定: ? 預(yù)測變量服從正態(tài)分布。 ? 預(yù)測變量之間沒有顯著的相關(guān)。 ? 預(yù)測變量的平均值和方差不相關(guān)。 ? 預(yù)測變量應(yīng)是連續(xù)變量,因變量(類別或組別)是間斷變量。 ? 兩個預(yù)測變量之間的相關(guān)性在不同類中是一樣的。 在分析的各個階段應(yīng)把握如下的原則: ? 事前組別(類)的分類標(biāo)準(zhǔn)(作為判別分析的因變量)要盡可能準(zhǔn)確和可靠,否則會影響判別函數(shù)的準(zhǔn)確性,從而影響判別分析的效果。 ? 所分析的自變量應(yīng)是因變量的重要影響因素,應(yīng)該挑選既有重要特性又有區(qū)別能力的變量,達(dá)到以最少變量而有高辨別能力的目標(biāo)。 ? 初始分析的數(shù)目不能太少。 這些判別函數(shù)是各個獨(dú)立預(yù)測變量的線性組合。程序自動選擇第一個判別函數(shù),以盡可能多地區(qū)別各個類,然后再選擇和第一個判別函數(shù)獨(dú)立的第二個判別函數(shù),盡可能多地提供判別能力。程序?qū)凑者@種方式,提供剩下的判別函數(shù)。判別函數(shù)的個數(shù)為 k。 圖 822 判別分析的示意圖 ? 研究問題 調(diào)查了 15個公司的組織文化、領(lǐng)導(dǎo)角色和員工發(fā)展 3個方面內(nèi)容作為預(yù)測變量,因變量為公司對員工的吸引力。為符合研究問題,將公司對員工的吸引力根據(jù)被測的實(shí)際填答情形,劃分為高吸引力組( group=1)、中吸引力組( group=2)和低吸引力組( group=3)。數(shù)據(jù)如表 84所示。 SPSS中實(shí)現(xiàn)過程 表 84 不同類的不同公司特點(diǎn) 公 司 組 織 文 化 領(lǐng) 導(dǎo) 角 色 員 工 發(fā) 展 Group Microsoft 1 IBM 1 Dell 1 Apple 1 聯(lián)想 1 NPP 2 北京電子 3 清華紫光 1 北大方正 1 TCLE 3 世紀(jì)成 2 Angel 1 Hussar1 3 世紀(jì)飛揚(yáng) 3 Vinda 3 ? 實(shí)現(xiàn)步驟 圖 823 在菜單中選擇“ Discriminant”命令 圖 824 “Discriminant Analysis”對話框 圖 825 “Discriminant Analysis: De
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1