【正文】
如圖 所示 。用 SET 語句拼接 A和 B 數(shù)據(jù)集后,新生成的數(shù)據(jù)集 C 就含有三個變量 COMMON、 X 和 Y,觀測的數(shù)目仍然是所有這些數(shù)據(jù)集的觀測總和,但原數(shù)據(jù)集中沒有的變量在拼接后新數(shù)據(jù)集中為缺失值。 Set A B 。 Run 。 圖 不相同變量的數(shù)據(jù)集拼接結(jié)果 O B S C O M M O N X O B S C O M M O N Y1 9801 1 1 9801 42 9802 2 2 9802 53 9803 3 3 9803 6D A T A A D A T A B 圖 含有不相同的變量 X 和 Y 的兩個數(shù)據(jù)集 c72cc4be0bbf221015743448a2d35f94 SAS 系統(tǒng)和數(shù)據(jù)分析 電子商務(wù)系列 上海財經(jīng)大學(xué)經(jīng)濟信息管理系 IS/SHUFE Created by Page 4 of 9 3. 按關(guān)鍵字排序后拼接數(shù)據(jù)集 如果要求新生成的數(shù)據(jù)集 C按共同的關(guān)鍵字例如 COMMON排序觀測,那么預(yù)先要數(shù)據(jù)集 A和 B也已按 COMMON 關(guān)鍵字排序好 ,可通過排序過程 PROC SORT 和 BY 指明關(guān)鍵字。 By Common 。 By Common 。 Set A B 。 Proc print data=C 。 拼接生成的新數(shù)據(jù)集 C 的結(jié)果 如圖 所示 。 二、 數(shù)據(jù)集的合并 數(shù)據(jù)集的合并是通過使用 MERGE 語句把兩個或兩個以上數(shù)據(jù)集中的兩條觀測或兩條以上 的觀測合并為新生數(shù)據(jù)集中的一條觀測。新生成的數(shù)據(jù)集中的觀測總數(shù)為這些數(shù)據(jù)集中觀測個數(shù)的最大值。如果在幾個數(shù)據(jù)集中有共同的變量,則在合并后新生成的數(shù)據(jù)集中只有一個變量,其值為列在MERGE語句中最后一個含有該變量的數(shù)據(jù) 集中的觀測值。 生成新數(shù)據(jù)集 C 的程序如下: Data C 。 Proc print data=C 。 合并的新數(shù)據(jù)集 C 的結(jié)果 如圖 所示。且每一個數(shù)據(jù)集必須預(yù)先按關(guān)鍵字排序好。如果兩個數(shù)據(jù)集中觀測的關(guān)鍵字值是多對多匹配,要注意新生成的數(shù)據(jù)集中相同關(guān)鍵字值的觀測數(shù)為各數(shù)據(jù)集中這個關(guān)鍵字值的觀測數(shù)的最大值,相同關(guān)鍵字值的觀測按順序一對一合并,無論哪一個數(shù)據(jù)集中這個相同關(guān)鍵字值的觀測沒有了,都取這個相同關(guān)鍵字值的最后一條觀測繼續(xù)合并。 要合并生成一個新的 訂 單銷售數(shù)據(jù)集 SALES 的程序如下: Proc sort data= ORDERS 。 Proc sort data= PRODUCTS 。 Data SALES 。 By P_ID 。 Run 。 O B S P _ I D Q u