freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

調(diào)查技能培訓(xùn)教程-wenkub.com

2025-06-27 12:27 本頁面
   

【正文】 自動化能使處理過程效率更高,并提高數(shù)據(jù)的最終質(zhì)量。 數(shù)據(jù)處理是一個費錢、費時,需要耗費可觀資源并對最后的數(shù)據(jù)質(zhì)量有著很大的影響的過程。穩(wěn)健估計量則能克服這種局限性,因為它對分布的假定不太敏感。若賦予離群值的抽樣權(quán)數(shù)為1或0,這樣做對估計的影響太大,特別是對偏態(tài)總體的估計。簡單地忽略未經(jīng)處理的離群值會影響估計的效果,并導(dǎo)致估計量的方差增大;給離群值賦予 1 或 0 的權(quán)數(shù)會使估計結(jié)果發(fā)生偏倚。 離群值的處理 在手工審核系統(tǒng)中,對離群值進行檢查,如果確認是錯誤,就要回訪并校正。 與 分別稱為下四分位數(shù)間距與上四分位數(shù)間距。但是,由于它們對離群值比較敏感。 離群值也可以通過下面的容許區(qū)間進行確認: 這里, 和 分別是預(yù)先確定的下限和上限的值。 離群值的出現(xiàn),可能是由于數(shù)據(jù)固有的變異性。例如,某人的身高是2米,或體重是45公斤,這種情況可能并不少,但身高2米且體重只有45公斤的人,即是一個多變量離群值的例子。如果一個記錄值和抽樣權(quán)數(shù)的組合對估計有較大的影響,我們就稱這樣的觀測值為影響值。這有利于保證插補記錄中插補值與非插補值的組合不僅滿足審核規(guī)則而且具有多樣性。 插補方法應(yīng)減少無回答偏倚,并盡可能地保持不同變量之間的關(guān)系(即不應(yīng)破壞數(shù)據(jù)的多變量結(jié)構(gòu)); 插補得到的記錄應(yīng)該滿足所有的審核規(guī)則; 這通??梢酝ㄟ^只對盡可能少的變量進行插補而盡可能多地保留被調(diào)查者的原始回答數(shù)據(jù)來做到。插補方法是否適當(dāng)取決于調(diào)查的類型、目的、可用的輔助信息和錯誤的性質(zhì)。但是,如果要得到估計量的總方差的話,還必須估計插補方差。 經(jīng)過插補操作后,估計量的方差包括兩個分量:抽樣引起的方差分量(抽樣方差)和插補引起的方差分量(插補方差)。 插補后數(shù)據(jù)的方差估計 前面講到的所有插補方法都能為每一個缺失的或不一致的值生成一個單一的插補值,這些方法也都會在某種程度上扭曲插補變量的原始分布,并導(dǎo)致使用標(biāo)準方差估計公式得出的不適當(dāng)?shù)姆讲罟烙嫛? 舉例說,假設(shè)某份問卷中關(guān)于一位被調(diào)查者的背景資料是:受教育程度(大學(xué)),婚姻狀況(已婚),性別(女),年齡(10歲)。 盡可能保持數(shù)據(jù)文檔的原始頻數(shù)結(jié)構(gòu); 但是并不是所有審核失效的數(shù)據(jù)都需插補。 隨機性插補 任何用于定量數(shù)據(jù)的確定性插補都能通過加上隨機殘差變得具有非確定性。 最近鄰插補 最近鄰插補,就像熱平臺插補,也是基于匹配變量選擇一個供者記錄。 如果每次都使用相同的排序及選取方法,序貫熱平臺法是一種確定性的插補方法。 插補情況 受者 收入 汽車擁有 供者 7 70 有 4 9 90 然后,插補類中通過所有審核的記錄集就是供者記錄的集合,這些記錄用來插補受者中缺失的數(shù)據(jù)。 利用前期的數(shù)據(jù)進行插補,也稱前向插補,是比率或回歸插補的一個特例,只是直接用前期調(diào)查的數(shù)據(jù)來作為當(dāng)前調(diào)查的缺失數(shù)據(jù)的插補值。 比(率)或回歸插補 比率或回歸插補是使用輔助信息及其它記錄中的有效回答建立一個比率或回歸模型,該模型表明了兩個或多個變量之間的關(guān)系。 均值插補會得到較好的點估計,但由于在插補類均值這一點形成一個人為的“峰值”,從而破壞了分布狀態(tài)和變量之間的關(guān)系。對所有這些插補方法,最好是把類似的記錄歸為一組,就象進行無回答權(quán)數(shù)調(diào)整時一樣,這些組稱為插補類。所謂的供者插補方法,就是用一個供者來插補一個受者的所有缺失的或不一致的數(shù)據(jù)。 每一種確定性的插補方法都對應(yīng)著一種隨機插補方法。 比(率)/回歸插補; 隨機插補則含有隨機因素因此,每次得出的插補值可能會不一樣。插補是對審核過程中發(fā)現(xiàn)的所有缺失信息的記錄進行補充或用合適的數(shù)值進行替代,確保得出內(nèi)在一致的記錄。 各階段所進行的審核不應(yīng)與其它階段的審核相抵觸; 不論什么時候,開始一項調(diào)查時,總是要對數(shù)據(jù)做一些假定,審核時可以檢驗這些假定的合理性。 刪除無效記錄; 更好地理解數(shù)據(jù)和數(shù)據(jù)處理過程; 選擇性審核一般適于定量數(shù)據(jù)。 對大多數(shù)審核失效都應(yīng)該加以標(biāo)示,留待作插補處理。 進行插補; 其它相關(guān)的調(diào)查或數(shù)據(jù); 3)審核 審核是應(yīng)用各種檢查規(guī)則來辨別缺失、無效或不一致的錄入,這些會導(dǎo)致數(shù)據(jù)記錄的潛在錯誤。 采用計算機輔助數(shù)據(jù)收集方法; 采用紙張式收集數(shù)據(jù)的方法時,數(shù)據(jù)錄入是在數(shù)據(jù)收集完畢之后(通常是在對問卷進行一些“梳理”和初步審核之后)進行。 編碼具體方法很多,包括: 數(shù)據(jù)收集完畢之后,估計之前對數(shù)據(jù)進行加工處理的所有活動:主要包括數(shù)據(jù)的編碼、錄入、審核、插補、離群值的檢測和處理等。分配系數(shù)計算如下: 最優(yōu)分配的分配系數(shù) 按下式計算: 最優(yōu)分配法可以在規(guī)定的抽樣費用下,使估計值的抽樣方差最?。换蛘咴诮o定的總抽樣方差下,使費用最少。 換句話說,分配系數(shù) 等于該層總體大小的平方根與所有層總體大小平方根的總和之比。 2)與Y成比例分配 調(diào)查中,如果變量yhi (第h層中的第i個單元的指標(biāo))是關(guān)于大?。ɑ蛞?guī)模)的一種度量,那么第 層的樣本量 就可以是第 層大小或規(guī)模度量Yh的一個比例,這種分配方法稱為與Y成比例分配。 樣本分配方法 1 ) 比例分配 比例分配即是與N成比例分配,就是每一層的樣本量 與該層的總體大小 成比例的分配。 由此,對于第h層,其樣本量 等于該層的樣本分配系數(shù)ah 乘以總的樣本量 : 它還可能需要重新審查初始樣本量、數(shù)據(jù)需求、精度水平、調(diào)查計劃的要素和現(xiàn)場操作因素,并作必要的調(diào)整。 第4步:根據(jù)無回答情況進行調(diào)整,確定最終的樣本量 : 費用、時間和現(xiàn)場操作的限制 在實際中,在確定樣本量時,不考慮時間和費用這兩個極為重要的因素是不可思議的。 使用簡單隨機抽樣; 但由于時間的限制,出版商決定使用簡單隨機抽樣進行電話調(diào)查。 第4步:根據(jù)無回答再次進行調(diào)整,以確定最終的樣本量 : 其中, 為預(yù)計的回答率。 2)對于簡單隨機抽樣,給定比例估計 的精度(100%回答率) 于是公式(1)變?yōu)椋?若在以往調(diào)查中可得總體比例的一個較好估計 ,那么直接將它代入上面的公式就可以得到所需的樣本量;否則可以用 ,因為這時總體的方差最大。我們也可以從試調(diào)查中得到設(shè)計效應(yīng)的估計值。 3. 樣本設(shè)計和估計量 一般來說,當(dāng)樣本量采用簡單隨機抽樣的計算公式,而實際使用的是更復(fù)雜的抽樣方式時,為達到給定精度所需的樣本量,應(yīng)該在此基礎(chǔ)上乘以一個稱為設(shè)計效應(yīng)因子。 為確保樣本量對所有的研究指標(biāo)都足夠大,應(yīng)該根據(jù)最大變異程度或被認為最重要的指標(biāo),來確定樣本量。 樣本設(shè)計和所用的估計量; 二、精度(抽樣誤差)的幾種度量方法: 抽樣方差; 標(biāo)準差; 誤差限; 置信區(qū)間; 變異系數(shù)。 總體指標(biāo)的變異程度; 假定樣本中每個被調(diào)查者作出回答的概率都是相同的,用調(diào)查的總?cè)藬?shù)除以回答者的總?cè)藬?shù),得無回答調(diào)整因子: 無回答調(diào)整權(quán)數(shù)wnr即為設(shè)計權(quán)數(shù)與無回答調(diào)整因子的乘積: ,可得到如下估計值: 在收集關(guān)于吸煙習(xí)慣的信息的同時,收集了每個回答者的年齡和性別情況。事后分層需要對權(quán)數(shù)進行調(diào)整。 (續(xù)) 城市層中nr,1=150,農(nóng)村層nr,2=40 層 總體大小 樣本量 回答數(shù)量 城 市 N1=1000 n1=200 nr,1=150 農(nóng) 村 N2=100 n2=50 nr,2=40 步驟2:對無回答的設(shè)計權(quán)數(shù)進行調(diào)整。 對于自加權(quán)設(shè)計,這個比值也可以用原樣本的單元數(shù)與回答單元數(shù)的比值(回答率的倒數(shù))來表示。在一些特殊的情況下,對無回答進行調(diào)整后所得的均值或比例的估計值,與未作任何調(diào)整的估計值相比并沒有任何改進。城市層N1=1000,農(nóng)村層N2 =100。從中抽取樣本量為n=250的一個樣本,將樣本等比例地分配給各層,使得兩層的抽樣比都等于n/N=1/4。 設(shè)計權(quán)數(shù)指的是每個樣本單元所代表的調(diào)查總體的單元數(shù),設(shè)計權(quán)數(shù)等于樣本單元的入樣概率的倒數(shù)。  PPS抽樣的主要優(yōu)點是由于使用了輔助信息,提高了抽樣策略的統(tǒng)計效率,能顯著地減少抽樣誤差?!∠到y(tǒng)樣本(圖示)  三、與大?。ɑ蛞?guī)模)成比例的概率(PPS)抽樣  PPS抽樣是一種使用輔助信息從而使入樣概率不相等的抽樣技術(shù)。此時,我們可以使用并構(gòu)造一個概念抽樣框(只需要單元的排列順序),每隔k個抽一個單元直到總體的末尾?! ∪绻鸑不能被n整除,則可以使用圓形系統(tǒng)抽樣法來避免出現(xiàn)可能樣本量不一致的情況?!   ∨c其他抽樣技術(shù)相比,簡單隨機抽樣有以下優(yōu)點:;(輔助)信息,唯一需要的只是一個關(guān)于調(diào)查總體所有單元的一個完全的清單和與其如何聯(lián)系的信息;、總體估計與方差估計都有現(xiàn)成的標(biāo)準公式可以利用,因此技術(shù)發(fā)展已經(jīng)成熟。一個估計量就是一個用來計算估計值的公式。  一、簡單隨機抽樣(SRS)  所有概率抽樣的出發(fā)點和理論基礎(chǔ)。  概率抽樣有兩條基本準則:1) 單元是隨機抽取的;2) 調(diào)查總體中的每個單元都有一個非零的入樣概率,并且能計算出這些概率?! ∪⒎歉怕食闃拥娜秉c是:,需要對樣本的代表性做很強的假定?! ∮袝r,非概率抽樣是唯一可行的選擇(例如,在醫(yī)學(xué)實驗中,采用志愿者抽樣可能是取得數(shù)據(jù)的唯一途徑?! 〉诙?jié) 非概率抽樣  非概率抽樣是用一種主觀的(非隨機的)方法從總體中抽選單元。對被調(diào)查者提示或說明每份問卷應(yīng)該有一個唯一的識別號碼,即問卷編號。第一個問題應(yīng)與調(diào)查的目的直接相關(guān)。 措辭要簡單 定義縮略語或簡稱 確保問題適用 措辭要具體 避免意義雙關(guān)的問題 避免引導(dǎo)性問題 避免使用雙重否定 減少敏感問題或隱私問題的影響 確保問題讀起來順口問卷格式問題的順序問題的順序應(yīng)能鼓勵被調(diào)查者完成問卷,并維持他們對問卷的興趣;還應(yīng)利于被調(diào)查者回憶,并使被調(diào)查者覺得自然;應(yīng)該反映被調(diào)查者的邏輯,同時還要集中于調(diào)查的主題。如果一個問題被用于多項調(diào)查之中,運用相同的回答選項將有助于對調(diào)查結(jié)果進行比較。2)封閉式問題 在提出問題的同時,列出若干可能的答案供被調(diào)查者進行選擇。開放式問題的缺點:對被調(diào)查者來說,必須在沒有選項幫助的情況下確定問題的
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1