freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

度量可靠性的評價與方法-wenkub

2023-03-15 15:30:20 本頁面
 

【正文】 尺度 和 貨幣尺度 。 ? 一個指標反映所測度變量的某一個方面的內容,指標的取值是由尺度來表示的。 ? 關于概念的相關知識可以用來指導我們對度量方法和變量的選擇。同時,變量會涉及一些與擬測度概念無關的方面。假設命題通常是因果關系命題,研究的目的是要證明假設成立與否,構成假設的基本元素通常就是概念。 概念度量與理論的關系 ? 理論與具體的度量操作是兩個不同的層次,理論概念是一切度量的起點。(如診?。? 概念度量面臨的困難 ? 由于變量受環(huán)境及測試方法等各種因素的影響,使得每個測量都有偏差。 ? 操作性描述就是在理論框架的基礎上選擇合適的變量與尺度反映抽象概念。做管理研究,首先要對研究中涉及到的概念有準確而全面的把握和認識。 ? 為了正確地度量概念,首先必須明確概念域,在概念的定義中精確描述概念包含了什么以及要排除什么。 概念度量面臨的困難 ? 操作性描述必須具有客觀性,在給定條件下要可以重復操作并能得出相同或相近的結果。強調度量的可重復性和客觀性并不能保證度量的真實性,每個測量結果都只是對真實狀況的一種逼近。 ? 理論概念通常是從一組相關原理派生出來的,需要用抽象的、理論上的相關概念來描述。 ? 由于具體的量度往往不能充分反映理論概念的豐富內涵,因而,不能反過來用操作性描述的結果來描述抽象的理論概念。單一變量通常不能提供唯一正確的度量。比如,在黑夜用一把夜光尺去測量一頭大象的身體。 ? 在被測度內容上的值域范圍或取值的類別集稱為尺度( scale)。用不同尺度表示的指標取值表明被測企業(yè)相對于其它企業(yè)在盈利能力方面的優(yōu)劣程度。 ? 對某些抽象概念(如技術能力、競爭優(yōu)勢等)可以通過打分來度量。 尺度的類別 ? 按度量目的劃分,管理研究中常用的尺度有評價尺度和態(tài)度尺度。 ? 例如對性別進行分類,可用“ 1”和“ 2”分別代表男和女。 ? 這類尺度的數(shù)字可用來比較大小,但還不能反映不同等級間的差異程度,不能進行加、減、乘、除等數(shù)學運算。 ? 這類尺度的數(shù)字之間可以進行加、減運算但不能進行乘、除運算。 ? 尺度的數(shù)字之間不僅可以進行加、減運算而且可以進行乘、除運算。 使用不同度量尺度的變量 ? 依不同的度量尺度,變量可分為定名變量、定序變量、定距變量和定比變量。 ? 定比變量: 指用比率尺度度量的變量,定比變量除具有上述三種變量的全部性質之外,還有一個具有實際意義的“ 0”點。如果尺度設置不合理,測試結果就會失去意義。上面所舉的測試家庭經濟水平的例子就是直接判定式尺度設置。 ? 受試者根據(jù)自己的判斷選擇一個最能代表自己意見的尺度值。 條目化尺度 ? 條目化尺度是選擇一定數(shù)量的反映屬性類別和屬性強度的條目作為尺度的值。比如要測試員工對領導風格的看法,可以設置如下的尺度:( 1)非常民主;( 2)民主;( 3)中庸;( 4)獨斷;( 5)非常獨斷。可以設置這樣一個尺度:( 1)與 A(領導才能)最相近;( 2)與 B最相近;( 3)與 C最相近。 比較尺度 ? 在層次分析法中,測度人們對兩項評價指標相對重要性判斷的尺度為:( 1)極端重要;( 2)非常重要;( 3)相當重要;( 4)稍微重要;( 5)同樣重要。 對上述理由從 1到 4排序, 1代表最有解釋力。 ? 與概念域對應的項目集合稱為項目域。 多項目( multiitem)度量 ? 使用某種方式進行多次度量(比如要求回答多個相關的問題),再把這些度量或回答組合成變量的單一值的方法稱為多項目度量。單一的標準只能提供某變量的大概情況,幾種數(shù)據(jù)的組合則可以提供更全面更準確的情況。 多項目度量的必要性 ? 不同的度量方法可以相互驗證,由于通常不同方法的偏差來源不相同,多項目度量有利于減少測量偏差 ,提高量度的可靠性和有效性。例如要度量企業(yè)競爭力,選擇的每項內容都應與企業(yè)競爭力有關。如果某項內容與其他內容完全不相關則應把它刪去。 多項目尺度設置舉例 ? 例如,要研究商學院教授中“理論型”的教授與“實踐型”的教授面向不同教學對象時的教學效果。 度量“理論型”和“實踐型”的項目 ? ① “作為商學院的教授你認為哪種能力對教學更重要:管理實踐能力還是管理研究能力?” 這一問題反映受試者對“最佳教學身份”的認識。只有 51%選擇“管理者” 作為最佳教學身份的受試者選擇了“管理理論” 作為業(yè)務興趣。通過對每對問題之間關系的檢驗,證明它們確實可以成為同一變量的度量尺度。 業(yè)務興趣為管理理論的比例 最佳教學身份 管理者 研究者 管理案例 27 %( 66 ) 58 %( 12 ) 閱讀興趣 管理理論 58 %( 219 ) 89 %( 130 ) 三項度量項目之間的關系(假設) 上表中,加上閱讀興趣這項內容之后,業(yè)務興趣和最佳教學身份之間的關系不變。 ? 第三,要避免雙關的或含糊的項目。例如,領導風格的取值范圍可以從“非常民主”到“非常獨斷”。 未詳數(shù)據(jù)的處理 處理未詳數(shù)據(jù)(如填“不知道”)的方法有: ? 第一,如果未詳數(shù)據(jù)不多,可以把它們刪去。有人只填寫參加過的活動,沒參加過的就空在那里。要具體情況具體分析。證實組合指標可用下列方法: ( 1)內部證實 證實指標首先是內部證實?!袄碚撔汀敝笜烁叩氖茉囌咴谄渌麊栴}上也應顯示較強的理論傾向;“理論型”指標低的研究對象在其他問題上也應顯示較低的理論傾向。 根據(jù)組合指標對研究對象分類 ? 當對研究對象進行二維或多維量度時,可以根據(jù)組合指標的量度結果對研究對象分類。 ? 分類往往能夠幫助我們理解數(shù)據(jù),但應當注意最好以分類變量為自變量而不是因變量。(也可不用“贊成”而用“同意”)。 里克特( Likert)尺度 ? 里克特度量要求概念是一維的,如果是多維概念的話,要求將其細分成多個一維子集。 里克特尺度的優(yōu)點和不足 ? 里克特尺度制作簡單,用途廣泛,結論可靠,調查內容有一定深度,可以用來測試具有多維尺度的內容,是一種應用范圍比較廣的方法。 ? 使用里克特尺度有時會設置一些掩飾項目。 語義差異度量 ? 語義差異度量是里克特度量的一種變通形式,語義差異度量是通過對一個主題進行多角度回答來進行度量。 三維 語義差異度量 ? 語義差異判斷也可以將一個概念分成三個維度。 迦特曼( Guttman)尺度 ? 迦特曼尺度又稱累積度量。迦特曼尺度是“累積”模式,每題具有一個尺度值(得分),題目之間具有高分題內容包含低分題內容的的關系,滿足數(shù)值大的項目時,同時也滿足小數(shù)值項目。 ? 迦特曼尺度要求題目的設置是一維尺度,也就是說題目的內容都是反映單一內涵,而不具有多層含義。 迦特曼尺度適用的答案模式 答案模式分為兩種。所有得分加起來為總得分,這里稱“指標得分”; ? 另一種方式是按指標的趨強結構計分,在最強指標最佳教學身份上選擇“理論型”答案的給3分,在次強指標業(yè)務興趣上選擇“理論型”答案的給 2分,在最弱指標閱讀興趣上選擇“理論型”答案的給 1分,對各個問題的得分不相加,只計最高分,這里稱“尺度得分”。 ? 我們把尺度型的答案個數(shù)占答案總個數(shù)的比例稱為再現(xiàn)系數(shù),再現(xiàn)系數(shù)越高,度量的偏差越小。 瑟斯滕( Thur stone)尺度 ? 與里克特尺度和迦特曼尺度不同的是:瑟斯滕尺度的測試項目不要求具有單調性,判斷者只有當項目陳述近似于其觀點時才同意,而在里克特尺度和迦特曼尺度的測試項目中,判斷者的選項是連續(xù)變化的。 瑟斯滕尺度的基本形式 ? 瑟斯滕尺度的基本形式是“間距相等”。評分很不一致的內容應刪去。 幾種典型度量尺度的基本差別 ? 里克特尺度、迦特曼尺度和瑟斯滕尺度的基本差別在于關于人的觀點和對個別項目給出的答案之間關系的假設不同。隨機誤差小,可靠性就強,反之就差。 ( 3)可靠的度量,既可能有效,也可能無效。 ? 不應混淆精確和準確這兩個概念。精確度與準確性之間存在著某種程度的相克關系。 ? 在度量過程中,常見的導致系統(tǒng)誤差的因素有 : – 分布誤差( distributional error) – 光暈偏差( halo bias ) – 參照系偏差( reference frame bias ) – 自我中心效應( egoecentric error) – 循序效應( sequential error) – 評估者偏差( evaluator bias ) ? 這些因素導致的系統(tǒng)誤差會降低度量的有效性。在某些情況下,被調查者會將他人的判斷作為參照系,傾向于迎合社會價值判斷而規(guī)避極端的回答。 循序效應偏差和評價者偏差 ? 循序效應 – 評價可能涉及若干層面,先做的評價影響后做的評價。 導致隨機誤差的因素 ? 隨機誤差降低度量的可靠性。這樣,在不同情況下的度量結果的相關性(重復測試相關性)就為評價可靠性提供了基礎。測試內影響因素就是指在一次測試中,在測試的不同問題或項目之間發(fā)生的隨機干擾。 ? 如果隨機誤差對度量影響很大,在個別項目上的得分就會有高有低,從而降低了項目之間的相關性。 ? 由于受試對象是人,兩次測試的時間間隔應足夠長,否則受試人對上次測試的記憶會影響第二次測試的回答,使兩次測試獲得不真實的高相關性。 ? 通常兩次測試有相似的項目和同樣的回答方式,而只是在措詞和項目順序等方面有差別,如果兩次度量結果間顯示出高相關性,就可以排除由于措詞、問題順序以及其他因素導致的隨機干擾。 ? 二分法存在的問題是,評價的準確與否依賴于項目如何劃分。 ? 一般認為, α參數(shù)法優(yōu)于二分法。 ? i2 ?t2α參數(shù)法 ( Cronbach α) 對于項目值域只有兩個值的情況,公式為: 其中: k = 量表中項目的個數(shù); p = 第一種類型回答的比例; q = 第二種類型回答的比例; 量表的總方差。每個項目的得分從1分(不可能)到 7分(可能)。 ? ii216??21616? ijji ????? ?? ? ??????? ?66 1 120 0820 08 45 32 0 83.. . .六、提高可靠性的方法 ? 度量誤差的一個基本來源就是有關項目域的抽樣不充分,即缺乏內容有效性。反之,項目間相關性較低說明某些項目不是來自正確的概念域,因而產生了誤差。如果 α參數(shù)足夠大并且因子分析發(fā)現(xiàn)的維度與概念域中描述的一致,就可以得到一個令人滿意的度量設計。 ? 研究者可用同樣或略有差異的提法將一個問題反復多問幾次。 ? 在調查中提出問題時要注意只問那些被調查者可能知道答案的問題。在度量缺乏可靠性的情況下,度量兩個本應相關的變量由于存在較大的隨機誤差,會使變量間的相關關系看起來缺乏顯著性。適度的可靠性可以節(jié)省時間和精力??煽啃赃_到了那樣的等級后,相關性因度量誤差減小而增加的幅度很小。如果修正后的相關性令人滿意,就值得花時間和精力來增加度量項目并用其他方法減少度量誤差。那么度量應該達到什么樣的可靠性標準呢? 可靠性的標準 ? 滿意的可靠性等級根據(jù)度量在研究中如何應用而有所不同。而現(xiàn)實中出于“面子”的考慮或其它原因,這種不懂裝懂的現(xiàn)象是常見的。 提高可靠性的方法 ? ( 2)被測因素在受試對象中的差異越大,測試越可靠。 提高可靠性的方法 提高可靠性的方法主要有: ? ( 1)增加測試長度,即增加度量項目的個數(shù)。 ? 如果概念有多維, α參數(shù)要在每一維內分別計算,并在每一維內去除不符合概念域的項目。 ? 所有項目與概念有關的部分稱為公共核。下表是測試結果的協(xié)方差矩陣。 ? 我們設想用一個量表對實行 CIMS工程可能帶來目標效益的概率進行評估。 ? α的取值從 0到 1,取值為 0表示完全不可靠,取值為 1表示完全可靠。 ? 若有 2n個度量項目,可能的劃分方式有 )!)(!(2)!2(nnn 種,對于有 10個項目的量表就有 126種項目分半劃分的可能,選擇項目劃分方式會引入主觀性。 ? 假設沒有隨機誤差發(fā)生,所有的度量項目( items)所度量的都是同一個基本屬性,因此,具體項目之間的差異可以作為評價隨機誤差影響的基礎。實際研究中這一時間間隔通常取兩個星期。 五、度量可靠性評價 度量可靠性的評價分為 1.與度量穩(wěn)定性有關的可靠性評定 ( 1)反復測試可靠性 ( TestRetest Reliability) ( 2)平行測試可靠性 ( ParallelForm Reliability) 2.基于度量的內部一致性的可靠性評定 反復測試可靠性 ? 在兩次不同的時間,對完全相同的測試對象進行完全相同的度量。運用內部一致性的原理,我們可以通過檢查不同題目的測試結果是否一致,從而據(jù)此判斷隨機誤差的影響程度,并評估測試結果的可靠性
點擊復制文檔內容
醫(yī)療健康相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1