【正文】
能有效的利用其它軟件產(chǎn)生的數(shù)據(jù),SPSS軟件編輯窗口除可以使用 *.sav擴展名數(shù)據(jù)文件,還可以直接打開和保存下述類型的文件: SPSS DOS版本產(chǎn)生的數(shù)據(jù)文件 *.sys; Excel 報表程序產(chǎn)生的數(shù)據(jù)文件 *.xls; DBASE 數(shù)據(jù)庫格式文件 *.dbf; SAS統(tǒng)計軟件產(chǎn)生的數(shù)據(jù)文件。 開放題和簡單單選題的錄入 一、在 spss中定義變量 錄入數(shù)據(jù)的第一步是定義變量屬性,隨后才能進行數(shù)據(jù)錄入。 二、開放題的錄入 三、單選題的錄入 單選題的錄入可以采用字符直接錄入、字符代碼 +值標簽、數(shù)值代碼 +值標簽三種方式。 一、多重二分法( Multiple Dichotomy Method) 所謂多重二分法,是在編碼的時候,對應每一個選項都要定義一個變量,有幾個選項就有幾個變量,這些變量均為二分類,他們各自代表對一個選項的選擇結(jié)果。 二、多重分類法( Multiple Category Method) 多重分類法,也是利用多個變量對一個多選題的答案進行定義,應該用多少個變量,由被訪者實際可能給出的最多答案數(shù)而定。 三、多選題錄入在 spss中的實現(xiàn) 外部數(shù)據(jù)的獲取 SPSS讀入非 SPSS類型的文件數(shù)據(jù),有三種主要方式:直接打開,利用文本導向讀入文本數(shù)據(jù)以及利用數(shù)據(jù)庫 OBDC接口讀入數(shù)據(jù)。 電子表格數(shù)據(jù)如何導入 spss中 SPSS中可以直接讀入許多常用格式的數(shù)據(jù)文件,選擇菜單 File Open Data或直接單擊快捷鍵工具欄上的 快捷按鈕,系統(tǒng)就會彈出 Open File 對話框,單擊“文件類型”列表框,在里面能夠看到可以直接打開的數(shù)據(jù)文件格式。 文本數(shù)據(jù)如何導入 spss中 第一步:首先,在 Open File 文件框中選中文件,單擊“打開”,系統(tǒng)會自動啟動文本倒入向?qū)υ捒颉? 第二步:選擇“ NO”并單擊“下一步”按鈕。 用某種字符區(qū)分 固定寬度 第三步:分別選擇“ Delimited”和“ yes”,然后單擊“下一步”按鈕。 第四步 第五步 第六步 第七步 數(shù)據(jù)的保存 ? 存為 spss格式 存為其他數(shù)據(jù)格式 第 3章 數(shù)據(jù)管理 ? 變量級別的數(shù)據(jù)管理 對變量進行操作的內(nèi)容主要集中于 Transform菜單中,包括新變量的生成、記錄的排序、對變量進行計數(shù)等。 ◇ 計算新變量: 就是用 Compute過程。 ◇變量轉(zhuǎn)換: 包括 Recode、 Visual Bander、 Count、 Rank Case、Automatic Recode這五個過程。 ◇專用過程: 包括建立時間序列、缺失值代替和設(shè)定隨機種子三個過程。 ◇ Run Pending Transforming: 用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作。 計算產(chǎn)生新變量 變量值自動編碼 設(shè)定隨機數(shù)種子 創(chuàng)建代替缺失值變量 創(chuàng)建時間序列變量 運行其它轉(zhuǎn)換程序 變量值重新編碼 創(chuàng)建計數(shù)變量 觀測量排秩 連續(xù)變量進行分段 計算新變量 ? 計算新變量的功能就是在原有 spss數(shù)據(jù)文件的基礎(chǔ)上,根據(jù)用戶的要求,使用 spss算術(shù)表達式及函數(shù),對所有記錄或滿足 SPSS條件表達式的記錄,計算出一個新結(jié)果,并將結(jié)果存入一個用戶指定的變量中。 ? 一、常用基本概念 ? ( 1) spss算術(shù)表達式 spss算術(shù)表達式是由常量、 spss變量名、 spss的算術(shù)運算符、圓括號等組成的式子。 ? ( 2) spss函數(shù) spss提供了多達 70多種函數(shù),分為八大類:算術(shù)函數(shù)、統(tǒng)計函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時間函數(shù)、缺失值函數(shù)和其它函數(shù)。 ? ( 3) spss條件表達式 通過 spss的算術(shù)表達式和函數(shù)可以對所有記錄計算一個結(jié)果,如果僅希望對部分記錄進行計算,則應當利用 spss的條件表達式指定對那些記錄進行計算。 二、 pute過程的分析實例 ? 例 統(tǒng)計英語成績在 60分以上的學生的數(shù)學和語文的平均成績。 例 計算工人工資的所得稅。 學生自己練習。 對變量值進行分組合并 一、對連續(xù)變量進行分組 在 SPSS中可以將連續(xù)變量轉(zhuǎn)換為離散(等級或定序)變量,按照某種一一對應的關(guān)系生成新變量值,可以將新值賦給原變量。 Recode過程和 Visual Bander過程都可以完成這一任務,但前者給為簡單和常用。 例 當學生英語成績小于 60時取值為“不及格”,大于等于 60且小于 70為“及格”,大于等于 70且小于 80為“較好”,大于等于 80為“優(yōu)秀”。 二、分類變量類別的合并 Recode過程也常用于合并某個分類變量的幾個水平為一個水平。 將上例 grade中優(yōu)秀、良好和及格三個等級合并為一個等級“ PASS”,將 grade的等級“不及格”轉(zhuǎn)換為“ NOPASS”。 連續(xù)變量的可視化分段 ?VISUAL Bander 用于將連續(xù)變量進行分段,該過程使用百分位數(shù)、標準差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式。 ?例 對數(shù)學成績進行分段,假設(shè)現(xiàn)在希望按變量 math將學生分為 5組, 60分 ?以下為第一組, 60分以上的按照等間距的方式分為 4組。 將字符變量轉(zhuǎn)換為數(shù)值變量 ? 用 automatic recode將字符變量轉(zhuǎn)換為數(shù)值變量。 變量的編秩 ? 所謂編秩,就是對記錄按照某個變量值大小來排序。 Rank case過程就是用來排序的一個專用過程。 例:根據(jù)性別分組計算數(shù)學成績的秩次。 Transform菜單中的其它功能 ? ( 1) count過程 如果用戶需要對滿足某項條件的數(shù)據(jù)進行計數(shù),可以使用Count命令。 先在 Target Variable中指定一個變量 ( 可以是已經(jīng)存在的變量或新變量 ) , 并定義變量標簽 , 然后指定要統(tǒng)計的變量加到 Numeric Variables框中 , 再單擊 Define Values按紐 , 打開 Value to Count對話框 。 Value:輸入某個值為清點對象; Systemmissing:以系統(tǒng)的缺失值為清點對象; Systemor user missing:以系統(tǒng)或用戶指定的缺失值為清點對象; Range:指定數(shù)值的計數(shù)區(qū)域:其中包括: ( ) through( )在框內(nèi)指定下限和上限 lowest through( ) : 在框內(nèi)只指定上限; ( ) highest through: 在框內(nèi)只指定下限。 ?( 2) random Number Seed過程: 用于設(shè)定偽隨機函數(shù)的隨機種子。 文件級別的數(shù)據(jù)管理(一) 數(shù)據(jù)編輯窗口的 Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個菜單是 SPSS統(tǒng)計軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對變量、觀測量的編輯處理;對變量數(shù)據(jù)的變換;對觀察量數(shù)據(jù)整理。 ( 1)簡單命令 :包括插入變量、插入記錄和到達某條記錄,他們的功能實際上都可以用鼠標在數(shù)據(jù)表界面上直接完成,很少會使用菜單來調(diào)用。 ( 2)常用的簡單過程 :包括排序、拆分文件、選擇記錄和加權(quán)記錄。 ( 3)變量與數(shù)據(jù)文件屬性導向 :用于定義數(shù)據(jù)字典,或者將于定義的數(shù)據(jù)字典直接引入當前數(shù)據(jù)文件。 ( 4) 數(shù)重構(gòu)過導向: 用于進行數(shù)據(jù)轉(zhuǎn)置 , 或者對重復測量數(shù)據(jù)表進行長型 、 寬型記錄間的轉(zhuǎn)換 。 ( 5) 文件合并過程: 將幾個數(shù)據(jù)文件合并為一個大的 spss數(shù)據(jù)文件 , 含橫向合并和縱向合并兩種情況 。 ( 6) 正交設(shè)計過程: 實際上是聯(lián)合分析模塊的一部分 , 用于生成實施聯(lián)合分析所需要的設(shè)計 。 ( 7) 其他過程 :包括定義日期變量過程 、 數(shù)據(jù)匯總過程和查找重復記錄導向 。 定義變量屬性 定義變量日期 插入觀測量 拷貝數(shù)據(jù)屬性 插入一個變量 定位觀測量 觀測量排序 重構(gòu)數(shù)據(jù)結(jié)構(gòu) 分類或不分類匯總 正交設(shè)計 數(shù)據(jù)文件轉(zhuǎn)置 合并數(shù)據(jù)文件 標識重復觀測量 拆分數(shù)據(jù)文件 選擇觀測量 觀測量加權(quán) 記錄排序 ? 一、排序的兩種方法 : ? ( 1)在數(shù)據(jù)表格的變量名處單擊右鍵,彈出的右鍵菜單最后兩項就是“ sort Ascending”和“ Sort Descending”。 ? ( 2)對于多變量排序,則需要使用 Sort Cases過程來進行。 ? 二、多變量排序需要注意的三點: ? ( 1)在多重排序中,制定排序變量名是很關(guān)鍵的,先指定的變量在排序時必然優(yōu)先于后制訂的變量。 ? ( 2)可以指定按某變量值升序排序的同時按另一變量值降序排序,或相反。 ? ( 3)排序以后,原來記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。 記錄拆分 ? Split File 分割文件的功能是把當前工作分割成兩個或兩個以上的組,隨后的分析將對每個組進行。 記錄篩選 ? Select Cases:當用戶不需要分析全部的數(shù)據(jù),而是按要求分析其中的一部分,使用該選擇。 All case:選擇所有數(shù)據(jù); If condition is satisfied: 按指定條件選擇數(shù)據(jù)。 Random Sample of cases:對觀察值進行隨機抽樣。 Use filter variable: 用指定變量作過濾。先選擇一個變量,系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為 0的觀測單位標上刪除記號,系統(tǒng)對標有刪除記號的觀測單位不作分析。 Based on time or case range: 順序抽樣。單擊 Range按紐,打開 Select Case: Range對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結(jié)束。 加權(quán)記錄 ? Weight Cases:設(shè)定某變量為頻數(shù)變量。 數(shù)據(jù)匯總 ? 所謂分類匯總就是按指定的分類變量對觀測值進行分組,對每組記錄的各變量求指定的描述統(tǒng)計量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當前數(shù)據(jù)文件。 一、匯總的概念 二、進行分類匯總的方法 打開“ data”菜單,選擇“ Aggregate”,展開 aggregate data”對話框。 在左側(cè)的源變量框中選擇一個或多個變量作為分類變量進入分類變量( Break Variable[s])框中。 在左側(cè)的源變量框中選擇一個或多個變量作為要求匯總的變量進入?yún)R總變量 ( Aggregate Variable[s])框中,即要求這些變量的值進行分類匯總 。 “ nameamp。 label” (名稱與標簽):單擊此按鈕可以修改組合后所生成新變量名稱以及標簽:可以在 name后面的矩形框中輸入新變量名。在 Label后面的矩形框中輸入新變量標簽。單擊“ continue”按鈕繼續(xù)。 “ Function”(函數(shù)) 選擇此項可以確定匯總變量的描述內(nèi)容;系統(tǒng)默認函數(shù)為平均數(shù)。 (二) ? 數(shù)據(jù)字典的定義與應用 ? 在大型的數(shù)據(jù)分析項目中 , 數(shù)據(jù)管理是非常重要的一個環(huán)節(jié) ,為了保證工作質(zhì)量 , 數(shù)據(jù)處理人員往往會事先定義好一個非常詳細的數(shù)據(jù)格式 , 包括變量格式 、 變量標簽 、 標簽值 、 缺失值定義等 , 這被稱為數(shù)據(jù)字典 。 ? 一、變量屬性定義導向: Define Variable Properties 具體說來,可以列出所選變量的所有值;分辨沒有值標簽的值,并且提供自動給出值標簽的功能;可以將另一個變量的屬性拷貝到所選變量,也可以將所選變量的屬性拷貝到其他變量。 二、復制數(shù)據(jù)文件屬性導向 ? Copy Data Properties 過程用于將定義好的數(shù)據(jù)字典直接應用到當前文件中。 操作時不僅可以將一個外部數(shù)據(jù)文件相關(guān)屬性拷貝到當前數(shù)據(jù)文件中,還可以進行自行定義,只選擇某些變量,或者某些屬性進行拷貝,這無疑大大提高了連續(xù)性項目對原有資源的利用程度。 查找重復記錄 ? Identifying Duplicate Cases:用于查找重復記錄。 運行結(jié)束后,結(jié)果窗口會給出本次操作的信息匯總: S t a t i s t i c sI n d i c a t o r o f e a c h l a s t ma t c h i n g c a s e a s P r i m a r y120V a l i dM i s s i n gNI nd i c a t or of e a c h l a s t m a t c h i ng c a s e a s P r i m a r y3 2 5 . 0 2 5 . 0 2 5 . 09 7 5 . 0 7 5 . 0 1 0 0 . 012 1 0 0 . 0 1 0 0 . 0D u p l i c a t e C a s eP