freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas培訓(xùn)班講義ppt課件-資料下載頁

2025-01-18 11:57本頁面
  

【正文】 、關(guān)閉 SAS系統(tǒng) ? Title, footnote:添加標(biāo)題和腳注 ? Filename:對一個外部文件定義標(biāo)記 ? Libname:對一個 SAS數(shù)據(jù)庫定義標(biāo)記 ? Filename例, libname例 118 全程語句 ? Missing語句規(guī)定表示缺失值的字符 ,通常出現(xiàn)在 data語句中,但其作用范圍是全局的。 ? Page語句使得日志跳到新一頁 ? Skip語句使得日志跳過規(guī)定的行數(shù) ? %include語句從外部文件讀出 SAS語句或數(shù)據(jù)行并執(zhí)行: ? Missing例 ,page例 ,skip例 ,Include1例 119 Tabulate制表過程 (Tabulate例 ) ? 由分類變量、分析變量和統(tǒng)計量關(guān)鍵詞組成的表達(dá)式構(gòu)成描述性統(tǒng)計報表。 ? Tabulate過程的 Table語句的操作符(星號、空格、園括號,逗號) ,即嵌套(使用 *號) ,即平行(使用空格) (使用園括號) 120 Tabulate制表過程 ? :如果包含二維,次序為行、列;如果包含三維,次序為頁、行、列。 (維表達(dá)式間用逗號隔開; ) 5. 用 定義 Pctn統(tǒng)計量的分母 ? 分類變量必須在 class語句中說明 ? 分析變量必須在 var語句中列出 121 Tabulate制表過程 ? Proc tabulate過程的其他語句 1. missing選項:要求把缺失值作為分類變量的有效水平 2. order=freq | data | internal | formatted 規(guī)定報表中分類變量值出現(xiàn)的次序 freq: 按頻數(shù)下降的次序 data: 按原數(shù)據(jù)集中出現(xiàn)的先后次序 internal: 按非格式化值的次序 formatted: 按格式化值的次序 122 Tabulate制表過程 ? Label語句用來對變量加標(biāo)簽 ? Keylabel語句用來對統(tǒng)計量加標(biāo)簽 ? 統(tǒng)計量: N(字符型變量的默認(rèn)統(tǒng)計量 ), Nmiss, Mean, Std, Min, Max, Range, Sum(數(shù)值型變量默認(rèn)統(tǒng)計量 ), Var, Pctn(頻數(shù) N的百分?jǐn)?shù),后面參數(shù)為列變量則是行百分比,后面參數(shù)為行變量則是列百分比 ) ? F或 format表示輸出使用一定的格式, 如: a*f=。 123 Tabulate制表過程 ? 全類變量 all,當(dāng) all嵌入某個交叉時, all不考慮分類變量的水平,而用 all來生成子集和及總和。 如 B*(A all)、 (all B)* (all A) ? Tabulate1例 124 上機練習(xí) ? 按 tabulate1例,模擬編制類似數(shù)據(jù),練習(xí)各種制表方法 125 第五部分 SAS/stat 模塊 ? STAT模塊的過程介紹 126 Freq過程( freq_cows,_eye例 ) ? Freq過程用于產(chǎn)生單向到 n向的頻數(shù)表或交叉表以及針對表格的各種統(tǒng)計量。 ? 用星號連接起來的變量,最后一個變量的值形成列,倒數(shù)第二個變量的值形成行,其余變量的每一個水平形成一層。 如: table a*b*c*d。 ? 使用 chisq卡方統(tǒng)計量,檢驗變量間的相關(guān)性,原假設(shè)為變量間不相關(guān) 127 SAS宏 ? 利用宏可以減少在完成一些共同任務(wù)時必須輸入的文本量 ? 利用宏可以使程序模塊化,使程序易讀、便于修改、移植、方便重復(fù)使用 128 SAS宏變量 ? 宏變量屬于 SAS宏語言,與普通變量的區(qū)別是可以獨立于 DATA步 ? 可以在 SAS程序中除數(shù)據(jù)行之外的任何地方定義并使用宏變量 ? %let語句定義宏變量并分配一個值給宏變量(如: %let dsn=3) ? 當(dāng)引用一個宏變量的值,放 amp。號在宏變量前 129 SAS宏變量(macro_str,_var,_auto例 ) ? 使用 %str函數(shù)圍住宏變量的值,使得在這個值內(nèi)部的分號作為這個文本的部分,而不是 %let語句的結(jié)束 ? 使用 %put語句在 LOG窗口顯示宏變量的值 ? SAS/BASE中的自動宏變量,如: sysver, systime(給出 SAS程序或會話開始執(zhí)行的時間 )。 130 SAS宏 ? 用 %macro語句開始一個宏,同時給出這個宏的名字。如: %macro dsn。 用 %mend語句結(jié)束一個宏,其后給出宏名字。如: %mend dsn。 ? 放一個百分?jǐn)?shù)符號( %)在宏名字的前面以調(diào)用一個宏,如 %dsn ? Macro例 131 宏參數(shù) ? 被定義在一個 %macro語句的宏名字后括號內(nèi)的宏變量稱為宏參數(shù),可以直接給出宏參數(shù)的值,也可以在調(diào)用這個宏時給出這些參數(shù)的值。 ? 對參數(shù)分配的值只在這個宏執(zhí)行時有效,而宏變量從用戶創(chuàng)建直到 SAS會話結(jié)束前都存在 ? macroP1例、 macroP2例 132 SAS錯誤的處理 ? 一、句法錯誤:當(dāng)程序語句與 SAS語言準(zhǔn)則不一致時發(fā)現(xiàn)的錯誤,如關(guān)鍵詞拼錯,少掉分號等。 ? 二、詞義錯誤:元素在當(dāng)前程序語句中的用法是無效時產(chǎn)生,如 do over a ? 三、數(shù)據(jù)錯:當(dāng)有些數(shù)據(jù)值不適合用戶規(guī)定的格式時出現(xiàn) 133 SAS錯誤的處理 ? 四、運行錯:當(dāng) SAS執(zhí)行程序時在數(shù)值上出現(xiàn)的錯誤,如用 0作為除數(shù), infile引用的文件地址不存在等 ? 常見錯誤: 遺漏 run語句,在活動窗口的標(biāo)題欄里顯示 proc(或 data) step running 134 SAS錯誤的處理 ? 遺漏分號,在 log窗口中顯示錯誤,將下一個有效的語句解釋為無效的語句 ? 引號不配對, log信息指明字符串太長或語句被混淆 ? 無效選項, log指明選項無效或不認(rèn)識 ? 出現(xiàn)錯誤時可以同時按下 ctrl+break中斷程序 135 SAS錯誤的處理 ? 注意有漢字輸入的程序中可能帶來的輸入法兼容性錯誤,解決方法是重新輸入,并檢查錯誤 136 數(shù)據(jù)挖掘模塊 (Data miner) ? 大型數(shù)據(jù)遠(yuǎn)在天邊,近在眼前 ? 數(shù)據(jù)的迅速增加與數(shù)據(jù)分析方法的滯后之間的矛盾 → 數(shù)據(jù)挖掘應(yīng)運而生 ? 數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取出隱藏在數(shù)據(jù)之后的有用的信息 ,揭示潛藏在大型數(shù)據(jù)里的事物規(guī)律 137 數(shù)據(jù)挖掘的應(yīng)用 ? 天文學(xué)上的應(yīng)用: SKICAT (Sky Image Cataloging and Analysis Tool),自動分類和測量觀測到的天體 ? 金融投資:對大量即時數(shù)據(jù)進(jìn)行自動分析和學(xué)習(xí)提高。 ? 市場營銷:通過數(shù)據(jù)分析了解客戶購物行為的一些特征 138 從一個數(shù)據(jù)挖掘?qū)嵗勂? ? 市場營銷的一個例子:投放宣傳品的數(shù)據(jù)挖掘: ? 界定商業(yè)問題 ? 數(shù)據(jù)轉(zhuǎn)為信息 ? 基于信息的商業(yè)行為 ? 結(jié)果評估 139 數(shù)據(jù)挖掘 DMsample ? 數(shù)據(jù)挖掘中的數(shù)據(jù)角色: Raw:原始數(shù)據(jù) Training: 用于建模的訓(xùn)練數(shù)據(jù) Validation: 調(diào)整模型估計量值的數(shù)據(jù) Test: 檢驗?zāi)P偷臄?shù)據(jù) Score:得分?jǐn)?shù)據(jù),記錄分析結(jié)果 140 數(shù)據(jù)挖掘 DMsample ? 抽樣帶來的兩個問題: ? 多大比例的樣本能真實的反應(yīng)整體 ? 樣本的質(zhì)量問題如何決定樣本的有效性。高質(zhì)量的樣本應(yīng)該是整體的一個精確微縮,它保存了單個變量的分布和變量之間的關(guān)系。 141 數(shù)據(jù)挖掘 DMsample ? 抽樣的方法決定前述兩個問題的解決 ? 簡單隨機抽樣 ? 分層隨機抽樣 ? 過度抽樣 142 數(shù)據(jù)挖掘 DMmodify ? 變量屬性 : target-目標(biāo)變量 input-可以進(jìn)行預(yù)測的變量 reject-不可以進(jìn)行預(yù)測的變量 id-標(biāo)識變量 143 數(shù)據(jù)挖掘 DMmodify ? 數(shù)據(jù)類型 ? Unary- 1個值變量 binary- 2個值變量 nominal-多于 2個值的名義變量 ordinal-多于 2個不多于 10個值的數(shù)值變量 interval-多于 10個值的數(shù)值變量 144 數(shù)據(jù)挖掘 DMmodel ? DM視目標(biāo)事件的值為排序第一的值,調(diào)整排序 ? 考慮成本和利潤: 錯誤的投放:成本¥ 10 正確的投放:利潤¥ 90-¥ 10=¥ 80 ? Target profile:創(chuàng)建決策矩陣 利潤矩陣 成本 先驗概率 145 數(shù)據(jù)挖掘 DMmodify ? 數(shù)據(jù)集按角色分塊 ? 缺失值處理: replacement填充 interval類型變量填充為均值 binary, nominal, ordinal類型變量填充為出現(xiàn)概率最大的值 146 數(shù)據(jù)集按角色分塊 147 數(shù)據(jù)挖掘 DMmodel ? 建立模型: ? 回歸模型:建立單個或多個分析變量與一個目標(biāo)變量之間的關(guān)系 (一般線性回歸和 Logistic 回歸 ) ? 聚類模型:對多維數(shù)據(jù)進(jìn)行降維處理 148 多維數(shù)據(jù)的煩惱 149 數(shù)據(jù)挖掘 DMassess ? 模型的評估: lift chart 給每個客戶一個評分,說明其購買的可能性 ? 目標(biāo)客戶得分 150 SEMMA ? Sample ? Explore ? Modify ? Model ? Assess 151 第六部分 SAS/ets 過程 ? Tscsreg過程對面板數(shù)據(jù)( Panel data)的回歸分析 ? 先要對分層的變量進(jìn)行排序 ? 使用 tscsreg過程,其中 id后接分層變量
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1