freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

度量可靠性的評價與方法(參考版)

2025-02-26 15:30本頁面
  

【正文】 可靠性達到了那樣的等級后,相關性因度量誤差減小而增加的幅度很小。如果修正后的相關性令人滿意,就值得花時間和精力來增加度量項目并用其他方法減少度量誤差。適度的可靠性可以節(jié)省時間和精力。那么度量應該達到什么樣的可靠性標準呢? 可靠性的標準 ? 滿意的可靠性等級根據度量在研究中如何應用而有所不同。在度量缺乏可靠性的情況下,度量兩個本應相關的變量由于存在較大的隨機誤差,會使變量間的相關關系看起來缺乏顯著性。而現實中出于“面子”的考慮或其它原因,這種不懂裝懂的現象是常見的。 ? 在調查中提出問題時要注意只問那些被調查者可能知道答案的問題。 提高可靠性的方法 ? ( 2)被測因素在受試對象中的差異越大,測試越可靠。 ? 研究者可用同樣或略有差異的提法將一個問題反復多問幾次。 提高可靠性的方法 提高可靠性的方法主要有: ? ( 1)增加測試長度,即增加度量項目的個數。如果 α參數足夠大并且因子分析發(fā)現的維度與概念域中描述的一致,就可以得到一個令人滿意的度量設計。 ? 如果概念有多維, α參數要在每一維內分別計算,并在每一維內去除不符合概念域的項目。反之,項目間相關性較低說明某些項目不是來自正確的概念域,因而產生了誤差。 ? 所有項目與概念有關的部分稱為公共核。 ? ii216??21616? ijji ????? ?? ? ??????? ?66 1 120 0820 08 45 32 0 83.. . .六、提高可靠性的方法 ? 度量誤差的一個基本來源就是有關項目域的抽樣不充分,即缺乏內容有效性。下表是測試結果的協(xié)方差矩陣。每個項目的得分從1分(不可能)到 7分(可能)。 ? 我們設想用一個量表對實行 CIMS工程可能帶來目標效益的概率進行評估。 ? i2 ?t2α參數法 ( Cronbach α) 對于項目值域只有兩個值的情況,公式為: 其中: k = 量表中項目的個數; p = 第一種類型回答的比例; q = 第二種類型回答的比例; 量表的總方差。 ? α的取值從 0到 1,取值為 0表示完全不可靠,取值為 1表示完全可靠。 ? 一般認為, α參數法優(yōu)于二分法。 ? 若有 2n個度量項目,可能的劃分方式有 )!)(!(2)!2(nnn 種,對于有 10個項目的量表就有 126種項目分半劃分的可能,選擇項目劃分方式會引入主觀性。 ? 二分法存在的問題是,評價的準確與否依賴于項目如何劃分。 ? 假設沒有隨機誤差發(fā)生,所有的度量項目( items)所度量的都是同一個基本屬性,因此,具體項目之間的差異可以作為評價隨機誤差影響的基礎。 ? 通常兩次測試有相似的項目和同樣的回答方式,而只是在措詞和項目順序等方面有差別,如果兩次度量結果間顯示出高相關性,就可以排除由于措詞、問題順序以及其他因素導致的隨機干擾。實際研究中這一時間間隔通常取兩個星期。 ? 由于受試對象是人,兩次測試的時間間隔應足夠長,否則受試人對上次測試的記憶會影響第二次測試的回答,使兩次測試獲得不真實的高相關性。 五、度量可靠性評價 度量可靠性的評價分為 1.與度量穩(wěn)定性有關的可靠性評定 ( 1)反復測試可靠性 ( TestRetest Reliability) ( 2)平行測試可靠性 ( ParallelForm Reliability) 2.基于度量的內部一致性的可靠性評定 反復測試可靠性 ? 在兩次不同的時間,對完全相同的測試對象進行完全相同的度量。 ? 如果隨機誤差對度量影響很大,在個別項目上的得分就會有高有低,從而降低了項目之間的相關性。運用內部一致性的原理,我們可以通過檢查不同題目的測試結果是否一致,從而據此判斷隨機誤差的影響程度,并評估測試結果的可靠性。測試內影響因素就是指在一次測試中,在測試的不同問題或項目之間發(fā)生的隨機干擾。 ? 根據重復進行的度量之間的關系,可靠性又可分為反復測試可靠性( TestRetest Reliability)和平行測試可靠性( ParallelForm Reliability)。這樣,在不同情況下的度量結果的相關性(重復測試相關性)就為評價可靠性提供了基礎。 ? 影響可靠性的因素可分為不同測試間的影響因素和一次測試內的影響因素。 導致隨機誤差的因素 ? 隨機誤差降低度量的可靠性。這常見于上司對部屬的評價中。 循序效應偏差和評價者偏差 ? 循序效應 – 評價可能涉及若干層面,先做的評價影響后做的評價。 ? 對比效應( contrast effect) 受自我知覺的影響,評價者將評價對象評得與自我知覺完全相反。在某些情況下,被調查者會將他人的判斷作為參照系,傾向于迎合社會價值判斷而規(guī)避極端的回答。 ? 參照系偏差 指的是被調查者的主觀印象與某個特定的度量值不能準確對應造成的偏差。 ? 在度量過程中,常見的導致系統(tǒng)誤差的因素有 : – 分布誤差( distributional error) – 光暈偏差( halo bias ) – 參照系偏差( reference frame bias ) – 自我中心效應( egoecentric error) – 循序效應( sequential error) – 評估者偏差( evaluator bias ) ? 這些因素導致的系統(tǒng)誤差會降低度量的有效性。如果不能確定精確到什么程度合適,則盡量精確一些。精確度與準確性之間存在著某種程度的相克關系。精確和準確都是衡量度量成敗的重要標準。 ? 不應混淆精確和準確這兩個概念。 度量可靠性與有效性的關系 無效 有效 可靠 不可靠 精確和準確的關系 ? 可靠并不意味著正確。 ( 3)可靠的度量,既可能有效,也可能無效??煽啃耘c概念建構有效性之間,一般有下述四種關系: ( 1)有效的度量一定是可靠的度量。隨機誤差小,可靠性就強,反之就差。 幾種典型度量尺度的基本差別 ? 迦特曼( Guttman)尺度(也稱累積度量)包含這樣的假設:持有特定觀點的人將同意在某一維度與其觀點同一方向的項目,反對與其觀點不同方向的項目; ? 里克特( Likert)尺度(也稱求和度量)基于這樣的假設:同意每一個項目的概率的增加或減少,決定于對觀點的個人態(tài)度。 幾種典型度量尺度的基本差別 ? 里克特尺度、迦特曼尺度和瑟斯滕尺度的基本差別在于關于人的觀點和對個別項目給出的答案之間關系的假設不同。 ? 瑟斯滕尺度缺點是,尺度設置比較復雜和困難,剔除含糊的和無意義的題目需要花較多時間;題目設置及判斷賦值受主觀影響比較大,其結果的有效性不強。評分很不一致的內容應刪去。 ? 比如,將“員工士氣”作為變量,分數從 1到13,如果裁判認為某項內容很弱,則評 1分,某項內容很強,則評 13分,余類推。 瑟斯滕尺度的基本形式 ? 瑟斯滕尺度的基本形式是“間距相等”。含糊的、無關的陳述應舍棄。 瑟斯滕( Thur stone)尺度 ? 與里克特尺度和迦特曼尺度不同的是:瑟斯滕尺度的測試項目不要求具有單調性,判斷者只有當項目陳述近似于其觀點時才同意,而在里克特尺度和迦特曼尺度的測試項目中,判斷者的選項是連續(xù)變化的。 ? 每道題目的得分都是經專家事先評估給定的。 ? 我們把尺度型的答案個數占答案總個數的比例稱為再現系數,再現系數越高,度量的偏差越小?;旌闲偷拇鸢改J街笜说梅趾统叨鹊梅植煌耆恢拢贿m合于采用迦特曼尺度。所有得分加起來為總得分,這里稱“指標得分”; ? 另一種方式是按指標的趨強結構計分,在最強指標最佳教學身份上選擇“理論型”答案的給3分,在次強指標業(yè)務興趣上選擇“理論型”答案的給 2分,在最弱指標閱讀興趣上選擇“理論型”答案的給 1分,對各個問題的得分不相加,只計最高分,這里稱“尺度得分”。 迦特曼尺度適用于 “尺度型”答案模式 閱讀興趣 業(yè)務興趣 教學身份 人數 尺度型 總計= 383 + + + - + + - - + - - - 1 16 127 92 48 混合型 總計= 44 - + - - + - - + - + + + 18 14 5 7 “指標得分”與“尺度得分” ? 前例中對商學院教授理論傾向的度量,可以有兩種評分方式。 迦特曼尺度適用的答案模式 答案模式分為兩種。如果排除隨機誤差后,測試結果不具有包含性,則說明題目設置不是迦特曼尺度。 ? 迦特曼尺度要求題目的設置是一維尺度,也就是說題目的內容都是反映單一內涵,而不具有多層含義。這樣受試者對每道題的回答結果只能是“會”或“不會”。迦特曼尺度是“累積”模式,每題具有一個尺度值(得分),題目之間具有高分題內容包含低分題內容的的關系,滿足數值大的項目時,同時也滿足小數值項目。與里克特尺度一樣,迦特曼尺度也注重度量變量指標的強度。 迦特曼( Guttman)尺度 ? 迦特曼尺度又稱累積度量。 X軸反映社會價值評價的好壞, Y軸反映力量的強弱, Z軸反映積極和被動。 三維 語義差異度量 ? 語義差異判斷也可以將一個概念分成三個維度。 對領導作風的語義差異度量舉例 為了避免系統(tǒng)偏差,最好不把看上去接近的詞放在一側。 語義差異度量 ? 語義差異度量是里克特度量的一種變通形式,語義差異度量是通過對一個主題進行多角度回答來進行度量。但掩飾項目有其缺點:一是尋找相關性好又沒有明顯聯(lián)系的微妙項目比較難;二是對結果會有干擾。 ? 使用里克特尺度有時會設置一些掩飾項目。 ? 里克特尺度的不足是,沒有給出關于主題接受范圍的信息;當考慮多維的概念時,相同分數可能會由不同的觀點組合產生的,即得分一樣的結果,每道題的得分可能是不同或相反的(這不一定是一個缺點)。 里克特尺度的優(yōu)點和不足 ? 里克特尺度制作簡單,用途廣泛,結論可靠,調查內容有一定深度,可以用來測試具有多維尺度的內容,是一種應用范圍比較廣的方法。 里克特尺度設置方式舉例 項目 非常同意 同意 無意見 不同意 非常不同意 1. 服務人員態(tài)度友善(+) 2. 結帳速度很慢(-) 3. 商品價格合理(+) 4. 商品齊全(+) 5 . 營業(yè)時間不方便(-) 6 . 購物路線不清楚(-) ?? 2 2 2 2 2 2 ? 1 1 1 1 1 1 ? 0 0 0 0 0 0 - 1 - 1 - 1 - 1 - 1 - 1 ? - 2 - 2 - 2 - 2 - 2 - 2 ? 上表是超市對顧客滿意度的調查,里克特尺度的明顯特征是,為避免產生偏差,所有題目都按“正向提問”和“反向提問”分成數目相等的兩類,并分別以(+)和(-)號標識兩種提問,最后分別統(tǒng)計(+)項題目得分及(一)項題目得分。 里克特( Likert)尺度 ? 里克特度量要求概念是一維的,如果是多維概念的話,要求將其細分成多個一維子集。有五種答案則評分為 0- 4或1- 5。(也可不用“贊成”而用“同意”)。它的基本形式是給出一個陳述,按照同意的程度進行項目排列。 ? 分類往往能夠幫助我們理解數據,但應當注意最好以分類變量為自變量而不是因變量。 布萊克和簡 根據組合指標對研究對象分類 ? 當對研究對象進行二維或多維量度時,可以根據組合指標的量度結果對研究對象分類。例如,反映企業(yè)償債能力的指標可以包括利息保障倍數、資產負債率、流動比率、速動比率、強制性現金支出比率、到期債務支出比率、現金流動負債比率、現金總債務比率等,這些指標的重要程度是不同的,對兩個企業(yè)進行比較時,在 8項指標中有 5項指標較好的企業(yè)不一定償債能力比另一個企業(yè)強。“理論型”指標高的受試者在其他問題上也應顯示較強的理論傾向;“理論型”指標低的研究對象在其他問題上也應顯示較低的理論傾向。如果某項內容得分與指標總得分相關系數很低則應刪去。證實組合指標可用下列方法: ( 1)內部證實 證實指標首先是內部證實。 ? 第五,可用隨機數字作為未詳數據的數值。要具體情況具體分析。 未詳數據的處理 ? 第三,仔細分析未詳數據有可能發(fā)現它們所代表的意義。有人只填寫參加過的活動,沒參加過的就空在那里。 ? 第二,可以假定未詳數據為某一種答案。 未詳數據的處理 處理未詳數據(如填“不知道”)的方法有: ? 第一,如果未詳數據不多,可以把它們刪去。 ? 第二,決定每個問題的具體分數。例如,領導風格的取值范圍可以從
點擊復制文檔內容
醫(yī)療健康相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1