freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

調查技能培訓教程-閱讀頁

2025-07-15 12:27本頁面
  

【正文】 率。 確定樣本量的例子 例 某雜志出版商希望得到讀者對該雜志綜合滿意度的估計值。但由于時間的限制,出版商決定使用簡單隨機抽樣進行電話調查。 ; 使用簡單隨機抽樣; 由于事先沒有關于顧客滿意度的估計 ,方差應取最大,即 。 第4步:根據(jù)無回答情況進行調整,確定最終的樣本量 : 費用、時間和現(xiàn)場操作的限制 在實際中,在確定樣本量時,不考慮時間和費用這兩個極為重要的因素是不可思議的。最終確定的樣本量必須與可獲得的經費預算和允許的時限保持一致。它還可能需要重新審查初始樣本量、數(shù)據(jù)需求、精度水平、調查計劃的要素和現(xiàn)場操作因素,并作必要的調整。 分層抽樣中 樣本在各層中的分配 這種準則是先確定總的樣本量,然后再將確定的總樣本量n以某種方式分配到各個層。 由此,對于第h層,其樣本量 等于該層的樣本分配系數(shù)ah 乘以總的樣本量 : 用給定變異系數(shù)法要比總樣本量固定方法復雜,在下面樣本分配的例子中只用總樣本量固定方法。 樣本分配方法 1 ) 比例分配 比例分配即是與N成比例分配,就是每一層的樣本量 與該層的總體大小 成比例的分配。即各層的抽樣比 是相同的,等于總的抽樣比 。 2)與Y成比例分配 調查中,如果變量yhi (第h層中的第i個單元的指標)是關于大?。ɑ蛞?guī)模)的一種度量,那么第 層的樣本量 就可以是第 層大小或規(guī)模度量Yh的一個比例,這種分配方法稱為與Y成比例分配。 與Y成比例分配方法在商業(yè)調查中有著廣泛的應用。 但是通??蛻暨€希望層估計值 也具有較高的精度。 換句話說,分配系數(shù) 等于該層總體大小的平方根與所有層總體大小平方根的總和之比。 即分配系數(shù) 等于層大小度量的平方根與所有層大小度量平方根的總和之比。 最優(yōu)分配的分配系數(shù) 按下式計算: 最優(yōu)分配法可以在規(guī)定的抽樣費用下,使估計值的抽樣方差最??;或者在給定的總抽樣方差下,使費用最少。在這種情況下,與N成比例分配是使估計值的抽樣方差最小的分配形式。 奈曼分配下,分配系數(shù)表示為: 7)方差相等時的最優(yōu)分配 最優(yōu)分配的另一個特例是所有層方差都相等的情況。分配系數(shù)計算如下: 2)超額分配。 數(shù)據(jù)收集完畢之后,估計之前對數(shù)據(jù)進行加工處理的所有活動:主要包括數(shù)據(jù)的編碼、錄入、審核、插補、離群值的檢測和處理等。 編碼具體方法很多,包括: 在數(shù)據(jù)收集完畢之后進行手工編碼; 采用紙張式收集數(shù)據(jù)的方法時,數(shù)據(jù)錄入是在數(shù)據(jù)收集完畢之后(通常是在對問卷進行一些“梳理”和初步審核之后)進行。 采用計算機輔助數(shù)據(jù)收集方法; 對紙張式問卷進行預先編碼。 3)審核 審核是應用各種檢查規(guī)則來辨別缺失、無效或不一致的錄入,這些會導致數(shù)據(jù)記錄的潛在錯誤。 審核主要可分為三類:即有效性審核、一致性審核與分布審核。 關于調查主題的專業(yè)知識; 其它相關的調查或數(shù)據(jù); 數(shù)據(jù)收集完畢后,對審核失效,通常按下列方法進行處理: 進行插補; 有些時候,一條記錄(或整份問卷)不符合多條審核規(guī)則的要求,或者不符合少數(shù)幾條關鍵審核規(guī)則的要求,從而使得后續(xù)的處理失去意義。 對大多數(shù)審核失效都應該加以標示,留待作插補處理。 選擇性審核一般適于定量數(shù)據(jù)。 更好地理解數(shù)據(jù)和數(shù)據(jù)處理過程; 回訪被調查者; 刪除無效記錄; 審核的準則: 不論什么時候,開始一項調查時,總是要對數(shù)據(jù)做一些假定,審核時可以檢驗這些假定的合理性。 審核應該分階段進行; 各階段所進行的審核不應與其它階段的審核相抵觸; 插補是對審核過程中發(fā)現(xiàn)的所有缺失信息的記錄進行補充或用合適的數(shù)值進行替代,確保得出內在一致的記錄。 插補方法 插補方法可以歸為兩類—隨機插補和確定性插補。隨機插補則含有隨機因素因此,每次得出的插補值可能會不一樣。 推理插補; 比(率)/回歸插補; 序貫冷平臺插補; 每一種確定性的插補方法都對應著一種隨機插補方法。 隨機插補能更好地保持數(shù)據(jù)集的頻數(shù)結構,保持比確定性插補方法更真實的變異性。所謂的供者插補方法,就是用一個供者來插補一個受者的所有缺失的或不一致的數(shù)據(jù)。通常,這種推理是根據(jù)問卷上其它回答項的模式來進行的。對所有這些插補方法,最好是把類似的記錄歸為一組,就象進行無回答權數(shù)調整時一樣,這些組稱為插補類。 均值插補 用均值插補,缺失或不一致的值可用插補類的均值來代替。 均值插補會得到較好的點估計,但由于在插補類均值這一點形成一個人為的“峰值”,從而破壞了分布狀態(tài)和變量之間的關系。 均值插補通常在沒有輔助信息可用或只有少量記錄需要作插補處理時,才被采用。 比(率)或回歸插補 比率或回歸插補是使用輔助信息及其它記錄中的有效回答建立一個比率或回歸模型,該模型表明了兩個或多個變量之間的關系。 這時, 的插補值按如下公式計算: 式中: 是變量 第 個記錄的插補值; 是插補類中記錄的 值的均值; 是插補類中記錄的 值的均值。 這種方法常用于的商業(yè)調查中的定量變量,在這種調查中常可用前期數(shù)據(jù)來預測現(xiàn)期數(shù)據(jù)。 利用前期的數(shù)據(jù)進行插補,也稱前向插補,是比率或回歸插補的一個特例,只是直接用前期調查的數(shù)據(jù)來作為當前調查的缺失數(shù)據(jù)的插補值。 熱平臺插補 熱平臺插補是使用同一插補類中的供者記錄的信息來代替一個相似的受者記錄中缺失的或不一致數(shù)據(jù)。然后,插補類中通過所有審核的記錄集就是供者記錄的集合,這些記錄用來插補受者中缺失的數(shù)據(jù)。 插補情況 受者 收入 汽車擁有 供者 7 70 有 4 9 90 無 6 12 70 有 4 如果每次都使用相同的排序及選取方法,序貫熱平臺法是一種確定性的插補方法。 供者插補方法(局限于熱平臺插補和最近鄰插補)的優(yōu)點是,因為相似的供者(如公司和家庭等)具有相似的特征,因此插補出的數(shù)值應該是相當準確的。 冷平臺插補經常使用前期的調查或普查中的歷史數(shù)據(jù)。 最近鄰插補 最近鄰插補,就像熱平臺插補,也是基于匹配變量選擇一個供者記錄?!白罱笔峭ㄟ^兩個觀測對象之間的距離來定義的,兩個觀測對象之間的距離是由輔助數(shù)據(jù)計算的。 隨機性插補 任何用于定量數(shù)據(jù)的確定性插補都能通過加上隨機殘差變得具有非確定性。 但是并不是所有審核失效的數(shù)據(jù)都需插補。 確定哪些字段需要插補應遵循以下三條準則: 盡可能保持數(shù)據(jù)文檔的原始頻數(shù)結構; 舉例說,假設某份問卷中關于一位被調查者的背景資料是:受教育程度(大學),婚姻狀況(已婚),性別(女),年齡(10歲)。為了糾正審核失效,可以同時調整婚姻狀況和受教育程度,也可以只對年齡作調整,一般傾向于采用后者。 插補后數(shù)據(jù)的方差估計 前面講到的所有插補方法都能為每一個缺失的或不一致的值生成一個單一的插補值,這些方法也都會在某種程度上扭曲插補變量的原始分布,并導致使用標準方差估計公式得出的不適當?shù)姆讲罟烙嫛?插補時有一點特別重要,即應該盡量避免因插補而引起的估計量的方差估計被人為低估。 經過插補操作后,估計量的方差包括兩個分量:抽樣引起的方差分量(抽樣方差)和插補引起的方差分量(插補方差)。隨機插補方法的一個好處是,它能給插補后的完整的數(shù)據(jù)集加進一些噪聲。但是,如果要得到估計量的總方差的話,還必須估計插補方差。 插補方法是否適當取決于調查的類型、目的、可用的輔助信息和錯誤的性質。 以下是進行插補的幾條準則: 這通??梢酝ㄟ^只對盡可能少的變量進行插補而盡可能多地保留被調查者的原始回答數(shù)據(jù)來做到。 好的插補會為評估留下審查的線索,并保證插補的記錄具有內部一致性。 插補得到的記錄應該滿足所有的審核規(guī)則; 記錄中變量的插補和非插補的值都應該保留,以便對插補的程度和影響進行評估; 插補方法應減少無回答偏倚,并盡可能地保持不同變量之間的關系(即不應破壞數(shù)據(jù)的多變量結構); 插補系統(tǒng)應該能處理各種缺失或不一致的字段; 這有利于保證插補記錄中插補值與非插補值的組合不僅滿足審核規(guī)則而且具有多樣性。 5) 離群值的檢測和處理 離群值的檢測可以看作審核的一種類型,主要是用來發(fā)現(xiàn)和確認可疑的記錄。如果一個記錄值和抽樣權數(shù)的組合對估計有較大的影響,我們就稱這樣的觀測值為影響值。 應區(qū)別單變量離群值和多變量離群值。例如,某人的身高是2米,或體重是45公斤,這種情況可能并不少,但身高2米且體重只有45公斤的人,即是一個多變量離群值的例子。 數(shù)據(jù)中有錯誤(如,數(shù)據(jù)錄入錯誤); 離群值的出現(xiàn),可能是由于數(shù)據(jù)固有的變異性。 離群值的檢測 傳統(tǒng)上,離群值是通過測量它們和數(shù)據(jù)中心的相對距離來辯認的。 離群值也可以通過下面的容許區(qū)間進行確認: 這里, 和 分別是預先確定的下限和上限的值。落在這個區(qū)間之外的觀測值被認為是離群值。但是,由于它們對離群值比較敏感。這種方法用中位數(shù)度量數(shù)據(jù)的集中趨勢,四分位數(shù)間距度量數(shù)據(jù)的離散程度,因為這些統(tǒng)計量對離群值更為穩(wěn)?。床淮竺舾校?與 分別稱為下四分位數(shù)間距與上四分位數(shù)間距。任何落到這個區(qū)間之外的觀測值都被認為是一個離群值。 離群值的處理 在手工審核系統(tǒng)中,對離群值進行檢查,如果確認是錯誤,就要回訪并校正。有些情況下,如果認為離群值無妨大礙,可以不對離群值做任何處理。簡單地忽略未經處理的離群值會影響估計的效果,并導致估計量的方差增大;給離群值賦予 1 或 0 的權數(shù)會使估計結果發(fā)生偏倚。 估計時有三種方法可以處理離群值,即: 1) 改變數(shù)值 處理極值的一種方法是縮尾化,這種方法首先要將樣本數(shù)據(jù)按從小到大依次排序 :假設 是將樣本觀測值按從小到大的順序重新排列得到的有序樣本。若賦予離群值的抽樣權數(shù)為1或0,這樣做對估計的影響太大,特別是對偏態(tài)總體的估計。 3) 使用穩(wěn)健估計量 通常樣本均值和樣本方差估計量在正態(tài)性的假定下是最優(yōu)的。穩(wěn)健估計量則能克服這種局限性,因為它對分布的假定不太敏感。 數(shù)據(jù)處理是一個費錢、費時,需要耗費可觀資源并對最后的數(shù)據(jù)質量有著很大的影響的過程。離群值的檢測也可以用來確定可疑值。自動化能使處理過程效率更高,并提高數(shù)據(jù)的最
點擊復制文檔內容
教學教案相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1