【正文】
失值 Spss中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。 “ mmm”表示要求書寫英文月份單詞的前三個字母組成的縮寫。 ( 3)單擊右下角的“ uesr prompts”按鈕,添加對程序的交互分析界面。 二、雙擊 文件,安裝程序向導將給出每一步操作的提示。 SPSS的基本功能包括數據管理、統(tǒng)計分析、圖表分析、輸出管理等,具體內容包括描述統(tǒng)計、列聯分析,總體的均值比較、相關分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數檢驗等多個大類,每個類中還有多個專項統(tǒng)計方法。 spss操作入門 spss軟件的啟動與退出 ? 單擊 Windows 的 [開始 ]按鈕,在 [程序 ]菜單項 [SPSS for Windows]中找到 [SPSS for Windows]并單擊。 第二個問題,重點介紹如何用 SPSS直接讀取 Excel類型和文本格式的數據,以及如何用 ODBC接口讀取數據庫文件。可以輸入用“ /”或“ —”作分隔符的具體日期,回車后,系統(tǒng)將自動將輸入的格式轉化為指定的格式,顯示在單元各種。 Variable View表用來定義和修改變量的名稱、類型及其他屬性,如圖所示。 Align:數據對齊格式(默認為右對齊)。 ◇專用過程: 包括建立時間序列、缺失值代替和設定隨機種子三個過程。 將字符變量轉換為數值變量 ? 用 automatic recode將字符變量轉換為數值變量。 ( 6) 正交設計過程: 實際上是聯合分析模塊的一部分 , 用于生成實施聯合分析所需要的設計 。 數據匯總 ? 所謂分類匯總就是按指定的分類變量對觀測值進行分組,對每組記錄的各變量求指定的描述統(tǒng)計量,結果可以存入新數據文件,也可以替換當前數據文件。 二、長型格式轉換為寬型格式: Restructure。 ? 橫向合并遵循三個條件: ? 第一,如果不是按照記錄號對應的規(guī)律進行合并,則兩個數據文件必須至少有一個變量名相同的公共變量,這個變量是兩個數據文件橫向合并的依據,成為關鍵變量。 ? ( 1) Frequencies:產生原始數據的頻數表,并能計算各種百分位數。 ? 常用的截尾均數有 5%截尾均數 , 即兩端各去掉 5%的數據 。 ? ?NXX i? ?? 22?? ?122??? ?nXXS i 百分位數、四分位數與四分位數間距 分位差是對極差指標的一種改進,是從變量數列中剔除了一部分極端值后重新計算的類似于極差的指標。 ( 2) 選擇 ” 性別 ” 作為 因 子 變 量 , 送入Factor List欄 。 ( 3) Report values 輸出頻數表時同時輸出缺失值。 ??? ?? X在 SPSS中的 Descriptive過程可以將原變量轉換為標準正態(tài)分布的得分,只需要選中主對話框左下角的 Save standardized values as variables 復選框即可。 M E s t i m a t o r s1 7 4 . 6 6 1 7 4 . 7 4 1 7 4 . 7 0 1 7 4 . 7 51 6 2 . 8 0 1 6 2 . 8 1 1 6 2 . 8 2 1 6 2 . 8 1性別男女身高H u b e r 39。 ?根據類別的有序性,分類變量可以分為有序分類變量( Ordinal Variable)和無序分類變量( Nominal Variable)。 如進行三維以上的列聯表 , 可以將其它變量作為控制變量選到 Layer框中 。 分析實例 操作步驟: Analyze Multiple Response Frequencies Define Sets過程 該過程指定變量組成一個多重響應或多重兩分數集,并應用于頻數表和交叉列表。 C a s e P r o c e s s i ng S um m a r y219 1 0 0 . 0 % 0 . 0 % 219 1 0 0 . 0 %性別 * 血型N P e r c e n t N P e r c e n t N P e r c e n tV a l i d M i s s i n g To t a lC a s e s性別 * 血型 C r o s s t a b u l a t i o n16 8 17 31 722 2 . 2 % 1 1 . 1 % 2 3 . 6 % 4 3 . 1 % 1 0 0 . 0 %2 3 . 9 % 2 6 . 7 % 4 5 . 9 % 3 6 . 5 % 3 2 . 9 %7 . 3 % 3 . 7 % 7 . 8 % 1 4 . 2 % 3 2 . 9 %51 22 20 54 1473 4 . 7 % 1 5 . 0 % 1 3 . 6 % 3 6 . 7 % 1 0 0 . 0 %7 6 . 1 % 7 3 . 3 % 5 4 . 1 % 6 3 . 5 % 6 7 . 1 %2 3 . 3 % 1 0 . 0 % 9 . 1 % 2 4 . 7 % 6 7 . 1 %67 30 37 85 2193 0 . 6 % 1 3 . 7 % 1 6 . 9 % 3 8 . 8 % 1 0 0 . 0 %1 0 0 . 0 % 1 0 0 . 0 % 1 0 0 . 0 % 1 0 0 . 0 % 1 0 0 . 0 %3 0 . 6 % 1 3 . 7 % 1 6 . 9 % 3 8 . 8 % 1 0 0 . 0 %C o u n t% w i t h i n 性別% w i t h i n 血型% o f T o t a lC o u n t% w i t h i n 性別% w i t h i n 血型% o f T o t a lC o u n t% w i t h i n 性別% w i t h i n 血型% o f T o t a l男女性別T o t a lA AB B O血型T o t a l 多選題的統(tǒng)計描述 ? 多選題的描述指標體系 在多選題分析中比較特別的描述指標有: ( 1)應答人數:是指選擇了本項人數。類:有,屬性,類:有進行分類。、方差為值為的抽樣分布近似服從均樣本通常要求充分大時的隨機樣本,當為的總體中,抽取容量、方差為從均值這一定理可以表述為:中心極限定理。 有效性 是指如果兩個統(tǒng)計量都符合上述要求,則應當選取誤差更小的一個作為估計值。 ? ( 5)約 68%的個體的取值與平均數在距離一個標準差之內。 ( 4) Spread vs level with Levene Test欄 , 對所有的散布 —層次圖 , 同時輸出回歸直線的斜率以及方差齊性的 Levene?s檢驗 。 ? 方差齊性的檢驗:用 Levene檢驗比較各組的方差是否相等。 m i nm a x XXR ?? 方差和標準差 ? 一、方差( Variance)和標準差( Standard Deviation)的定義 ? 將離均差平方和( Sum of Squares of Deviation from Mean, SS)除以觀察例數 N,就得到方差: ? 方差越大,數據分布離散程度越大。 中位數 ? 中位數( Median)是將總體各單位的標志值按大小順序排列,處于中間位置的那個標志。 第 4章 連續(xù)性變量的統(tǒng)計描述與參數估計 ? 連續(xù)變量的統(tǒng)計描述概述 ? 統(tǒng)計描述中的可用工具 ? ( 1)各種初步匯總描述方法 ? 頻數、百分位數。 Unpaired variable:不匹配變量欄。 操作時不僅可以將一個外部數據文件相關屬性拷貝到當前數據文件中,還可以進行自行定義,只選擇某些變量,或者某些屬性進行拷貝,這無疑大大提高了連續(xù)性項目對原有資源的利用程度。先選擇一個變量,系統(tǒng)自動在數據管理器中將該變量值為 0的觀測單位標上刪除記號,系統(tǒng)對標有刪除記號的觀測單位不作分析。 ( 2)常用的簡單過程 :包括排序、拆分文件、選擇記錄和加權記錄。 二、分類變量類別的合并 Recode過程也常用于合并某個分類變量的幾個水平為一個水平。 用某種字符區(qū)分 固定寬度 第三步:分別選擇“ Delimited”和“ yes”,然后單擊“下一步”按鈕。 Values: 變量值標簽。 特點:定必變量是測量尺度的最高水平,它除了具有其他三種測量尺度的全部特點外,還具有可計算兩個側度至之間筆直的特點,因此它可以進行加、減、乘、除運算,而定居變量值可進行加減運算。 關于日期型格式的幾點說明: “m”在年與日(字母 y與 d)之間表示月份;在時與秒(字母 h與 s)之間表示“分”鐘。 ( 2)單擊 Syntax框下的“ Edit”按鈕,對程序進行編輯。 spss的安裝 一、啟動 Windows 后,把 SPSS 系統(tǒng)安裝軟盤(或光盤)插入軟驅(或光驅),并找到 SPSS的安裝程序的可執(zhí)行文件 。 一、功能強大 ( 1)囊括了各種成熟的統(tǒng)計方法與模型,為統(tǒng)計分析用戶提供了全方位的統(tǒng)計學算法,為各種研究提供了相應的統(tǒng)計學方法。 SPSS的 5個窗口 ( 1)數據編輯窗口( SPSS Data Editor) Spss處理數據的工作全在此窗口進行。 ? 統(tǒng)計軟件中數據的錄入格式 ? ( 1)不同觀測對象的數據不能在同一記錄中出現,即同一觀測數據應當獨占一行。 二、變量的測量尺度 在 SPSS中使用 Measure屬性對變量的測量尺度進行定義。 如果輸入變量名后回車,將給出變量的默認屬性。 Measure: 數據的測度方式。 ◇ Run Pending Transforming: 用于執(zhí)行編程中被掛起的數據整理操作。 變量的編秩 ? 所謂編秩,就是對記錄按照某個變量值大小來排序。 ( 7) 其他過程 :包括定義日期變量過程 、 數據匯總過程和查找重復記錄導向 。 一、匯總的概念 二、進行分類匯總的方法 打開“ data”菜單,選擇“ Aggregate”,展開 aggregate data”對話框。 選擇 Data Restructure,系統(tǒng)就會彈出下圖導向。 ? 第二,如果是使用關鍵變量進行合并的對應,則兩個數據文件都必須事先按關鍵變量進行升序排列。 控制頻數表輸出范圍類型的最大數目 ( 2) Descriptive過程 ? 該過程用于一般性的統(tǒng)計描述,相對于 Frequencies過程而言,它不能繪制統(tǒng)計圖。 二、幾何均數 幾何均數適用于原始數據分布不對稱,但經過對數轉換后稱對稱分布的資料。常用的分位差有四分位差、十分位差、百分位差。 有了因子變量 , SPSS會把所有的觀測個體按照因子變量的取值分成若干各組 , 再 分 組 考 察Dependent List中的各個變量 , 如果不選擇因子變量 , SPSS會對全部觀測來做探索分析 。 單擊 OK,得到相應的輸出結果如表所示。 四、偏度和峰度 ? ( 1)偏度( Skewness):偏度是用來描述變量取值分布形態(tài)的統(tǒng)計量,只分布不對稱的方向和程度。sM E s t i m a t o raT u k e y 39。 當集中趨勢顯著時,用眾數( Mode)作為總體的代表值。 多控制變量可以是同層次的也可以是逐層疊加的 。 Frequencies過程 該過程對定義的多重響應或多重兩分數提供一個頻數表。 Adj. standardize 為修正的標準化殘差 。類的有于類又有屬個個體中既有屬于。 對于任意可信度的區(qū)間情況,總體均值在 100( 1a) %可信區(qū)間為: nSuXnSuX 2/2/ ?? ? ????的正態(tài)分布。 一致性 是指樣本容量越大,估計值離真實值的差異應當越小。 ? ( 4)曲線無論向左或向右延伸,都越來越接近橫軸,但不會與橫軸相交,以橫軸為漸近線。 None:不產生回歸直線的斜率和方差齊性檢驗; Power Estimation轉換冪值估計(對每組數據產生一個中位數自然對數及四個分位數的自然對數的散點圖)選項; Transformed 變換原始數據選擇項; Untransformed不變換變換原始數據選擇項。 ? 正態(tài)分布檢驗:檢驗數據是否服從正態(tài)分布。 ? 二是它容易受個別極端值的影響 , 不符合穩(wěn)健型的要求 。但有時對于定序變量,求平均等級也可以使用平均數。 Indicate case source as variable: 指示記錄來源的變量選項。 ? 第二,為方便 spss數據文件的合并,在不同的數據文件中,最好起相同的名字,變量類型和變量長度也要盡量相同。 二、復制數據文件屬性導向 ? Copy Data Properties 過程用于將定義好的數據字典直接應用到當前文件中。 Use filter vari