freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

spss聚類分析與判別分析-wenkub

2022-08-30 17:23:04 本頁面
 

【正文】 齡、工資收入、教育程度、存款等,將這些資料作為自變量。 層次聚類分析有兩種形式,一種是對樣本(個案)進行分類,稱為 Q型聚類,它使具有共同特點的樣本聚齊在一起,以便對不同類的樣本進行分析;另一種是對研究對象的觀察變量進行分類,稱為 R型聚類。 統(tǒng)計學(xué)上的定義和計算公式 層次聚類分析中,測量樣本之間的親疏程度是關(guān)鍵。 樣本數(shù)據(jù)之間的親疏程度主要通過樣本之間的距離、樣本間的相關(guān)系數(shù)來度量。 1.連續(xù)變量的樣本距離測量方法 ( 1)歐氏距離( Euclidean Distance) 兩個樣本之間的歐氏距離是樣本各個變量值之差的平方和的平方根,計算公式為 ( 2)歐氏距離平方( Squared Euclidean Distance) 兩個樣本之間的歐氏距離平方是各樣本每個變量值之差的平方和,計算公式為 ( 3) Chebychev距離 兩個樣本之間的 Chebychev距離是各樣本所有變量值之差絕對值中的最大值,計算公式為 ( 4) Block距離 兩個樣本之間的 Block距離是各樣本所有變量值之差絕對值的總和,計算公式為 ( 5) Minkowski距離 兩個樣本之間的 Minkowski距離是各樣本所有變量值之差絕對值的 p次方的總和,再求 p次方根。 2.連續(xù)變量的樣本親疏程度的其他測量方法 3.順序或名義變量的樣本親疏程度測量方法 對于此類變量,可以計算一些有關(guān)相似性的統(tǒng)計指標來測定樣本間的親疏程度。 所謂小類,是在聚類過程中根據(jù)樣本之間親疏程度形成的中間類,小類和樣本、小類與小類繼續(xù)聚合,最終將所有樣本都包括在一個大類中。 ( 2)最長距離法( Furthest Neighbor) 以當前某個樣本與已經(jīng)形成小類中的各樣本距離的最大值作為當前樣本與該小類之間的距離。每一小類的重心就是該類中所有樣本在各個變量上的均值代表點。數(shù)據(jù)如表 81所示。 ( 3)輸出的結(jié)果文件中第三個表格為層次聚類分析的凝聚狀態(tài)表,包括: ( 4)輸出的結(jié)果文件中第四個表格如下表所示。 圖 88 層次聚類分析結(jié)果保存 層次聚類分析中的 R型聚類 統(tǒng)計學(xué)上的定義和計算公式 定義:層次聚類分析中的 R型聚類是對研究對象的觀察變量進行分類,它使具有共同特征的變量聚在一起。聚類的依據(jù)是 4門功課的考試成績,數(shù)據(jù)如表 82所示。 ( 4)輸出的結(jié)果文件中第四個表格如下表所示。 定義:快速聚類分析是由用戶指定類別數(shù)的大樣本資料的逐步聚類分析。但兩者的不同在于:層次聚類可以對不同的聚類類數(shù)產(chǎn)生一系列的聚類解,而快速聚類只能產(chǎn)生固定類數(shù)的聚類解,類數(shù)需要用戶事先指定。 快速聚類分析計算過程如下。初始類中心也可以由用戶自行指定,需要指定 K組樣本數(shù)據(jù)作為初始類中心點。 ? 重復(fù)上面的兩步計算過程,直到達到指定的迭代次數(shù)或終止迭代的判斷要求為止。 ( 1) SPSS輸出結(jié)果文件中的第一部分如下表所示。 ( 5)輸出的結(jié)果文件中第五個部分如下表所示。 SPSS運行后,數(shù)據(jù)編輯窗口如圖 821所示,其中我們可以看到新增加了兩個變量(圖中加深的兩列),分別表示樣本所屬類以及樣本和類中心點的距離。 有學(xué)者在研究中提出,可以利用判別分析來對聚類分析結(jié)果的準確性進行檢驗。 ? 預(yù)測變量之間沒有顯著的相關(guān)。 在分析的各個階段應(yīng)把握如下的原則: ? 事前組別(類)的分類標準(作為判別分析的因變量)要盡可能準確和可靠,否則會影響判別函數(shù)的準確性,從而影響判別分析的效果。程序自動選擇第一個判別函數(shù),以盡可能多地區(qū)別各個類,然后再選擇和第一個判別函數(shù)獨立的第二個判別函數(shù),盡可能多地提供判別能力。為符合研究問題,將公司對員工的吸引力根據(jù)被測的實際填答情形,劃分為高吸引力組( group=1)、中吸引力組( group=2)和低吸引力組( group=3)。 ( 3)輸出的結(jié)果文件中第三部分如下表所示。 ( 7)輸出的結(jié)果文件中第七個部分如下表所示。 ( 11)輸出的結(jié)果文件中第十一個部分如下表所示。 ( 15)輸出的結(jié)果文件中第十五個部分如下: ( 16)在實現(xiàn)過程中曾指定了將判別分析的結(jié)果作為樣本的變量保存到 SPSS的數(shù)據(jù)編輯窗口中。 小 結(jié) 判別分析是指先根據(jù)已知類別的事物的性質(zhì),建立函數(shù)式,然后對未知類別的新事物進行判斷以將之歸入已知的類別中。 SPSS與問卷分析 劉文平 提 綱 ? 編碼與數(shù)據(jù)錄入 編碼 ?注意變量類型與尺度 數(shù)據(jù)錄入 ? 統(tǒng)計分析 ? 統(tǒng)計制圖 編碼與錄入 ? 單選題 例 1 當前貴組織機構(gòu)是否設(shè)有面向組織的職 業(yè)生涯規(guī)劃系統(tǒng)? A有 B 正在開創(chuàng) C沒有 D曾經(jīng)有過但已中斷 編碼 :只定義一個變量, Value值 4 分別代表 A、 B、 C、 D 四個選項。 編碼與錄入(續(xù)) ? 多項選擇題 例 3 你認為開展保持黨員先進性教育活動的最重要的目標是哪三項: 1( ) 2 ( ) 3( ) A、提高黨員素質(zhì) B、加強基層組織 C、堅持發(fā)揚民主 D、激發(fā)創(chuàng)業(yè)熱情 E、服務(wù)人民群眾 F、促進各項工作 編碼 :定義三個變量分別代表題目中的 3三個括號,三個變量 Value值均同樣的以對應(yīng)的選項定義,即:“ 1” A,“ 2” B,“ 3” C,“ 4” D,“ 5” E,“ 6” F 錄入 :錄入的數(shù)值 6分別代表選項 ABCDEF,相應(yīng)錄入到每個括號對應(yīng)的變量下。 A、提高黨員素質(zhì) B、加強基層組織 C、堅持發(fā)揚民主 D、激發(fā)創(chuàng)業(yè)熱情 E、服務(wù)人民群眾 F、促進各項工作 編碼 :以 ABCDEF6個選項分別對應(yīng)定義 6個變量,每個變量的Value都做同樣的如下定義:“ 1” 未選,“ 2” 排第一,“ 3” 排第二,“ 4” 排第三。 編碼與錄入(續(xù)) ? 開放性數(shù)值題和量表題 這類題目要求被調(diào)查者自己填入數(shù)值,或者打分 例 6 你的年齡(實歲): ______ 編碼 :一個變量,不定義 Value值 錄入 :即錄入被調(diào)查者實際填入的數(shù)值。 適用范圍:單選題(例 1),排序題(例 4),多選題的方法二(例 3) 頻數(shù)分析也是問卷分析中最常用的方法。 實現(xiàn): Descriptive statistics……Descriptives ,需要的統(tǒng)計量點擊按鈕 Statistics… 中選擇 . 統(tǒng)計分析(續(xù)) ? 多重反應(yīng)下的頻次分析 適用范圍:多選題的二分法(例 2) 實現(xiàn):第一步在 Multiple Response……Define Sets 把一道多選問題中定義了的所有變量集合在一起,給新的集合變量取名,在Dichotomies Counted value中輸入 1。 實現(xiàn):第一步根據(jù)分析的目的來確定交叉分析的選項,確定控制變量和解釋變量(如上例中不同工作性質(zhì)的人是控制變量,使用交通工具是解釋變量)。比如,研究購買該產(chǎn)品的顧客和不購買的顧客的收入是否有明顯差異。如當問到你喜歡什么顏色時,你可能喜歡紅色,也喜歡藍色和綠色。目前,市場研究或許多領(lǐng)域?qū)δ呈挛镌u價的研究中常常遇到這樣的問題。如對下面問題有 9個可能的答案,每個可選擇的答案由一個變量表示,每個變量的值只能有表明“是”和“否”的兩個代碼。 多選變量的概念與分類 (續(xù) ) ? 多選變量的分類與代碼 :多選變量的分類取決于對問題的設(shè)計和對數(shù)據(jù)的整理及其數(shù)據(jù)文件的建立。 ?紅 ?橙 ?黃 ?綠 ?青 ?藍 ?紫 ?黑 ?白 ?說不清 這是一個問題,每個問題可以有三個答案。當然也可以使用數(shù)字編碼。 2. Frequencies:對多選變量集進行頻數(shù)分布分析 3. Crosstabs:對多選變量集與其他變量集或與原基本變量進行交叉表分析。如果讓你按喜歡程度排一下順序,你的回答可能是:紅色第一,藍色第二,綠色第三。 ? 可以選多個,分為限選和不限選: 限選:如在 11種工作種類中,選你最喜歡的,最多可選 4種( Var1Var4);求所有人最喜歡哪種(哪種被選的頻率最高)?( 4個分類變量) 不限選:如在所列的 20種電器中,你家所擁有的電器,不限選( Var1Var20),求哪種電器最普遍?( 20個二分變量) 多選變量的概念與分類 (續(xù) ) ? 多選變量的分類與代碼 :多選變量的分類取決于對問題的設(shè)計和對數(shù)據(jù)的整理及其數(shù)據(jù)文件的建立。 編號 調(diào)查內(nèi)容 選 項 1 您喜歡紅色嗎 □是 □否 2 您喜歡橙色嗎 □是 □否 3 您喜歡黃色嗎 □是 □否 4 您喜歡綠色嗎 □是 □否 5 您喜歡青色嗎 □是 □否 6 您喜歡藍色嗎 □是 □否 7 您喜歡紫色嗎 □是 □否 8 您喜歡黑色嗎 □是 □否 9 您喜歡白色嗎 □是 □否 左邊的表格為向顧客發(fā)放的顏色調(diào)查,在選擇服裝時,您喜歡什么顏色作為主體顏色,在答案的 “ □ ” 中打 “ ?” (可多選) 這是一組問題,每個問題均有兩個答案,回答者只能選擇其中一種。 多選分類變量集及其編碼( 多選分類法 ):多選分類變量集是由若干
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1