freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

談單變量描述性統(tǒng)計(jì)分析-資料下載頁(yè)

2025-06-27 12:29本頁(yè)面
  

【正文】 取值范圍定義在[1,1]之間。但對(duì)什么情況算作關(guān)系最強(qiáng),兩個(gè)系數(shù)的定法有所不同。1. φ系數(shù)(佛愛)根據(jù)這個(gè)公式,我們可以推算出,當(dāng)ad=bc時(shí),φ=0。前面我們就曾經(jīng)說過,相關(guān)系數(shù)=0,表示兩個(gè)變量相互獨(dú)立。當(dāng)a=d=0(或b=c=0),即全部個(gè)案集中在同一對(duì)角線上時(shí)。表示兩個(gè)變量是全相關(guān)。如果a*d與 b*c的差異越大,Φ的絕對(duì)值越大,則兩個(gè)變量間的相關(guān)程度越強(qiáng)。Q系數(shù)與φ系數(shù)不同。我問一下大家,的條件是什么?。恐灰猘\b\c\d中有一個(gè)為0,則。我們看一下課本288頁(yè)的例子。這個(gè)例子是有關(guān)配對(duì)實(shí)驗(yàn)法的研究。首先要說明的一點(diǎn)是,實(shí)驗(yàn)法中同樣可以使用統(tǒng)計(jì)分析方法。大家學(xué)過實(shí)驗(yàn)法沒有?應(yīng)該有基本的了解。它的基本邏輯,是有意地改變X變量,然后看Y變量是否隨著變化;如果Y變量顯然是隨著X變量的變化而變化,就說明X變量對(duì)Y變量有影響。這種方法的邏輯很嚴(yán)密,操作程序也十分嚴(yán)格:首先要將研究對(duì)象分為兩組,一組為實(shí)驗(yàn)組,另一組為控制組,為證明X變量對(duì)Y變量有影響,我們要改變實(shí)驗(yàn)組的X變量,但不改變控制組的X變量,然后比較兩組的Y變量在實(shí)驗(yàn)前后的變化,如果變化的程度不同,則表示有影響,否則則表示無(wú)影響。將研究對(duì)象分為實(shí)驗(yàn)組和控制組時(shí),要確保兩組的成員在實(shí)驗(yàn)前的情況(例如性別與年齡的分布等)要基本相同,尤其是那些會(huì)影響實(shí)驗(yàn)效果的情況,這樣做是為了控制其它變量對(duì)Y變量的影響。否則,即使我們發(fā)現(xiàn)兩組的Y變量變化不同,也不一定是X變量的效果,而可能是由于兩組原來的情況不同。為了確保兩組情況的相同,我們可以采用兩種方法,一是隨機(jī)法,一是配對(duì)法。前者是按照隨機(jī)的原則,將研究對(duì)象分派兩組中。換言之,何者屬于何組,完全聽命于機(jī)遇,不受人為影響。理論上,用隨機(jī)法分派可以使兩組研究對(duì)象的各方面情況相同,但實(shí)際上不一定完全相同。為保證兩組在某些方面是相同的,尤其是使那些很可能影響實(shí)驗(yàn)結(jié)果的情況相同,我們可以采用配對(duì)法。即在分派時(shí)有意識(shí)地使兩組在某些方面相同,例如年齡組合、男女比例等。好了,現(xiàn)在我們看一個(gè)例子。這是一個(gè)采用配對(duì)法進(jìn)行的實(shí)驗(yàn)研究。這個(gè)實(shí)驗(yàn)是要研究新藥能否抵制感冒。其中組1為實(shí)驗(yàn)組,研究對(duì)象吃了新藥,組2為控制組,研究對(duì)象吃的是安慰藥。這時(shí)我們關(guān)心的是,凡吃了新藥的人,能否全部抵制住感冒。而對(duì)不吃新藥只吃安慰藥的人是否感冒并不關(guān)心。實(shí)驗(yàn)的結(jié)果是這樣的,實(shí)驗(yàn)組中即吃了新藥的人中,50人未感冒,0人患了感冒,而在控制組中,即只吃了安慰藥的人中,28人未感冒,22人感冒了?,F(xiàn)在,我們根據(jù)這個(gè)列聯(lián)表分別計(jì)算φ系數(shù)與Q系數(shù)。得出的φ系數(shù)是多少???。Q系數(shù)呢?1。對(duì)于此,有的同學(xué)可能會(huì)覺得奇怪。為什么計(jì)算得出的Q系數(shù)與φ系數(shù)不同呢?其實(shí)這在測(cè)量?jī)勺兞康南嚓P(guān)程度時(shí)是很正常的現(xiàn)象。因?yàn)槲覀冞x用了不同的相關(guān)系數(shù)。根據(jù)Q系數(shù),我們可以得出兩變量完全相關(guān)的結(jié)論。而根據(jù)φ系數(shù),顯然是不行的。那么,這里,我們選用哪個(gè)系數(shù)更好呢?其實(shí)Q系數(shù)與φ系數(shù)適用的測(cè)量層次是一直的,而且它們對(duì)于兩變量關(guān)系是否對(duì)稱都沒有要求。再者,它們也都具有PRE意義。這個(gè)我們?cè)谏院髸?huì)做解釋。既然如此,我們應(yīng)該如何選擇Q系數(shù)與φ系數(shù)呢?這取決于研究的對(duì)象。當(dāng)自變量的不同取值都會(huì)影響因變量時(shí),則應(yīng)用φ系數(shù)。例如研究性別與報(bào)考大學(xué)類別之間的關(guān)系。這時(shí)我們既關(guān)心男生有多少報(bào)考理科,多少報(bào)考文科,同時(shí)也關(guān)心女生有多少報(bào)考理科或文科。因此,如果要說明這兩者有完全的相關(guān),除非男生全報(bào)考一類(例如理科),而女生全報(bào)考另一類。其實(shí)在研究性別與喜愛足球的關(guān)系時(shí),也是如此。只有當(dāng)男生全部喜歡足球,女生全部不喜歡,或者相反,才說明二者全相關(guān)。而在上述新藥的研究中,控制組服用安慰藥的情況,我們并不關(guān)心,我們只關(guān)心自變量某一個(gè)取值對(duì)因變量的影響,即我們只關(guān)心服用新藥的人的情況。面對(duì)這種情況,選擇Q系數(shù)反映新藥與感冒的關(guān)系更為合理。新藥安慰藥未感冒5028患感冒022第四章 相關(guān)測(cè)量法與測(cè)量層次在上一章的最后一節(jié),我們介紹了相關(guān)測(cè)量法的選擇標(biāo)準(zhǔn)?,F(xiàn)在我想請(qǐng)大家回顧一下,在選擇相關(guān)測(cè)量法時(shí),應(yīng)該考慮哪些因素?或者說有哪些選擇標(biāo)準(zhǔn)?三個(gè)標(biāo)準(zhǔn):測(cè)量層次、對(duì)稱關(guān)系以及消減誤差比例的意義。大家還記不記得?消減誤差比例PRE的公式是什么?PRE=(E1E2)/ E1。E1——不知道X值時(shí),預(yù)測(cè)Y值所產(chǎn)生的全部誤差;E2——依據(jù)X值預(yù)測(cè)Y值時(shí)所產(chǎn)生的全部誤差;E1—E2——依據(jù)X值預(yù)測(cè)Y值時(shí)所減少的誤差。PRE的數(shù)值越大,就表示以X值預(yù)測(cè)Y值時(shí)能夠減少的誤差所占的比例越大,也就是說,X與Y的關(guān)系越強(qiáng)。這節(jié)課,我們將主要根據(jù)測(cè)量層次的不同為大家介紹幾種具體的相關(guān)測(cè)量方法。也就是第四章的內(nèi)容——相關(guān)測(cè)量法與測(cè)量層次。其實(shí),關(guān)于這一點(diǎn),我們?cè)谏弦徽碌淖詈笠呀?jīng)有所接觸。上一章我們介紹的φ系數(shù)和Q系數(shù)就是兩種相關(guān)測(cè)量法,只是,它們的計(jì)算相對(duì)簡(jiǎn)單,主要適用于2*2的列聯(lián)表,因此,實(shí)際使用相對(duì)較少。這一章,我們學(xué)習(xí)的相關(guān)測(cè)量法,相比φ系數(shù)和Q系數(shù)更加復(fù)雜,而且都是以消減誤差比例為基礎(chǔ)的。前面,我們提到過,由于相關(guān)關(guān)系涉及兩個(gè)變量,因此,在選擇相關(guān)測(cè)量法時(shí),應(yīng)該分別考慮這兩個(gè)變量的測(cè)量層次。這一章,我們就根據(jù)變量測(cè)量層次的不同學(xué)習(xí)相應(yīng)的測(cè)量方法。第一節(jié)是有關(guān)兩個(gè)定類變量的相關(guān)測(cè)量法。第一節(jié) 兩個(gè)定類變量:λ,τ關(guān)于如何分析兩個(gè)定類變量之間的相關(guān)關(guān)系,我們?cè)谏瞎?jié)課已經(jīng)介紹過了,最直接的方法就是根據(jù)兩個(gè)變量的取值繪制列聯(lián)表。什么是列聯(lián)表啊?什么是交互分類,大家還記不記得?交互分類是指同時(shí)依據(jù)兩個(gè)變量的值,將所研究的個(gè)案進(jìn)行分類。交互分類的結(jié)果通常以交互分類表即列聯(lián)表的形式反映出來。除此之外,我們也可以選擇相關(guān)系數(shù),以一個(gè)數(shù)值來表示二者之間的關(guān)系。我們剛才提到的φ系數(shù)和Q系數(shù)就是。它們是用于分析2*2列聯(lián)表的相關(guān)系數(shù)。那么,對(duì)于r*c列聯(lián)表,或者說更加復(fù)雜的列聯(lián)表,我們應(yīng)該選擇哪種相關(guān)測(cè)量法呢?這一節(jié),我們就來解決這個(gè)問題。其中最常用的就是λ相關(guān)測(cè)量法。這是第一節(jié)的第一個(gè)內(nèi)容。從上一章開始,我們就接觸了一系列希臘字母,希望大家多留意,不要弄錯(cuò)或弄混。一、λ相關(guān)測(cè)量法不知大家還記不記得,在介紹集中趨勢(shì)測(cè)量法時(shí),我們?cè)?jīng)說過,如果要預(yù)測(cè)或估計(jì)一個(gè)定類變量的值,最好選用哪個(gè)集中值?眾值(即出現(xiàn)次數(shù)最多的變量值)。之所以選擇眾值,是因?yàn)閷?duì)于定類變量來說,它最有代表性,以它進(jìn)行估計(jì)或預(yù)測(cè),所犯的錯(cuò)誤總數(shù)會(huì)最小。λ相關(guān)測(cè)量法即是以此為基礎(chǔ)形成的。首先,我們來了解一下它的基本邏輯或者說推導(dǎo)過程。假設(shè)有x、y兩個(gè)定類變量,其中x是自變量,y是因變量。其列聯(lián)表如下(在課本294頁(yè)有這個(gè)表):y x x1x2…xcn*jy1n11n21nc1n*1y2n12n22nc2n*2…yrn1rn2rncrn*rni*n1*n2*nc*n對(duì)于這個(gè)列聯(lián)表,大家并不陌生。我們?cè)谏弦徽轮性?jīng)見到過。根據(jù)這個(gè)表,我們可以知道,x的取值有xx…、xc,y的取值則有yy…、yr,n*j表示y變量的邊緣分布,ni*表示x變量的邊緣分布,其余n1n21等則為條件次數(shù)。在不知道x的情況下,預(yù)測(cè)y值,也就是中間這些次數(shù)分布情況(包括X變量的邊緣分布情況),我們都不知道。此時(shí),我們唯一可以參考的就是y變量本身的次數(shù)分布情況,反映在列聯(lián)表當(dāng)中,就是關(guān)于y的邊緣分布。之前,我們說過,x、y都是定類變量,因此,在預(yù)測(cè)每一個(gè)個(gè)案的y值時(shí),我們需要選擇什么?或者說,需要選擇哪個(gè)集中值?大家想一想,知道了y變量的次數(shù)分布情況,我們是不是就可以知道它的眾值是多少?我們?cè)?jīng)說過,對(duì)于定類變量來說,眾值最有代表性,因此,我們可以利用它進(jìn)行預(yù)測(cè),而此時(shí)猜中的次數(shù)相比其它變量值要多?;蛘哒f,估計(jì)或預(yù)測(cè)時(shí)所犯的錯(cuò)誤總數(shù)最少。那么,這個(gè)錯(cuò)誤總數(shù)應(yīng)該是多少呢?就y變量來說,其眾值對(duì)應(yīng)的次數(shù),我們可以寫作(n*j表示的是y變量的次數(shù)分布情況。大家知道,max表示最大值,所以表示的是n*j中的最大值,即y變量的眾值次數(shù)),現(xiàn)在,我們已知樣本容量為n,是y變量的眾值次數(shù),那么,請(qǐng)大家思考一下,在不知道x值時(shí),預(yù)測(cè)y值所產(chǎn)生的誤差也就是學(xué)習(xí)PRE消減誤差比例時(shí)的E1等于什么?是不是就是非眾值次數(shù)???(n為全部個(gè)案數(shù)目,是y變量的眾值次數(shù),即最后一列中的最大值)。這就是不知道x值時(shí),預(yù)測(cè)y值所產(chǎn)生的誤差。這部分內(nèi)容在學(xué)習(xí)時(shí),需要大家緊密聯(lián)系上一章的內(nèi)容,不可以把它孤立理解。當(dāng)知道變量x與變量y有相關(guān)關(guān)系后,我們可以根據(jù)x來預(yù)測(cè)y。根據(jù)消減誤差比例PRE的計(jì)算公式,現(xiàn)在,我們需要明確依據(jù)x值預(yù)測(cè)y值所產(chǎn)生的誤差即E2是多少?顯然,預(yù)測(cè)時(shí),首先要考慮的是個(gè)案屬于x的哪一類,然后根據(jù)這一類中y的眾值去預(yù)測(cè)它,也就是利用條件分布中的眾值進(jìn)行預(yù)測(cè),這樣猜中的頻次最高,誤差最小。大家還記不記得,上一章給大家舉過一個(gè)職業(yè)與性別的例子。將職業(yè)視為變量x,性別為變量y,二者均為定類變量,且具有相關(guān)關(guān)系。[在不知道職業(yè)變量時(shí),我們對(duì)性別變量進(jìn)行預(yù)測(cè),使用的是性別變量的眾值。例如是男性。此時(shí),預(yù)測(cè)y值所產(chǎn)生的誤差就是E1。它對(duì)應(yīng)的公式就是這個(gè)]當(dāng)知道職業(yè)變量的情況時(shí),我們可以根據(jù)職業(yè)預(yù)測(cè)性別。在預(yù)測(cè)時(shí),首先要考慮個(gè)案屬于職業(yè)即x變量中的哪一類,然后根據(jù)這一類中性別y變量的眾值去預(yù)測(cè)它。例如,已知個(gè)案1為軍人,而軍人中大多數(shù)人是男性,即眾值為男性,所以我們預(yù)測(cè)他為男性。此時(shí)猜中的次數(shù)最高,誤差最小。若個(gè)案2為護(hù)士,而護(hù)士的眾值為女性,所以我們預(yù)測(cè)她為女性。我們回到剛才的列聯(lián)表中。設(shè)x=x1時(shí),y的眾值次數(shù)為(即n1n1…、n1r這一列中的最大值),設(shè)x=x2時(shí),y的眾值次數(shù)為(即n2n2…、n2r這一列中的最大值), x=x3時(shí),y的眾值次數(shù)為(即n3n3…、n3r中的最大值), x=xc時(shí),y的眾值次數(shù)為(即ncnc…、ncr這一列中的最大值), 當(dāng)然中間還有很多,依此類推,猜中的總次數(shù)為+++…+…+,它實(shí)際是x變量的每個(gè)值之下y變量的眾值次數(shù)之和,我們用來表示。大家知道Σ表示“和”的意思。其下方的i=1和上方的c表示從i=1開始一直加到i=c為止,也就是這個(gè)式子。它表示的是猜中的次數(shù)。采用這種方法預(yù)測(cè)所產(chǎn)生的誤差即為,根據(jù)PRE的性質(zhì),我們可以得出PRE==,這是將剛才EE2的式子代入PRE公式得出的,而它就是λ系數(shù)。其中n為樣本容量,是X變量的每個(gè)值之下Y變量的眾值次數(shù)之和,體現(xiàn)在列聯(lián)表當(dāng)中就是每列最高次數(shù)之和,注意,它指的是條件次數(shù)。則表示Y變量的眾值次數(shù),體現(xiàn)在列聯(lián)表中就是最后一列的最高次數(shù),它指的是邊緣次數(shù)。我們剛才提到過,是以X變量估計(jì)、預(yù)測(cè)Y變量,所以這是適用于分析不對(duì)稱關(guān)系的λ系數(shù),我們一般用λy來表示,公式是這樣的。采用同樣的方法,我們可以推導(dǎo)出適用于對(duì)稱關(guān)系的λ系數(shù)。由于在對(duì)稱關(guān)系中,沒有自變量、因變量之分,變量x、變量y是相互影響的,因此,面對(duì)對(duì)稱關(guān)系,我們既可以用x變量預(yù)測(cè)y變量,又可以用y變量預(yù)測(cè)x變量。將之引入λ系數(shù)的推導(dǎo)中,我們既要根據(jù)x值來預(yù)測(cè)y的眾值,又要根據(jù)y值來預(yù)測(cè)x的眾值,此時(shí)可分別計(jì)算λ系數(shù)。前者的λ系數(shù),也就是說以x變量預(yù)測(cè)y變量時(shí)的λ系數(shù),我們之前已經(jīng)說過了,它為:λy,后者的λ系數(shù),即用y變量預(yù)測(cè)x變量時(shí)的λ系數(shù),記作λx,其公式為(λx= ),然后取λy和λx的平均值。(x變量的眾值次數(shù), =y變量的每個(gè)值之下x變量的眾值次數(shù)之和,反映在列聯(lián)表中就是每行最高次數(shù)之和,注意它指的也是條件次數(shù)。)這就是適用于分析對(duì)稱關(guān)系的λ系數(shù)。根據(jù)推導(dǎo)過程,大家可以知道,λ系數(shù)具有消減誤差比例的意義,其實(shí)它本身就是消減誤差比例PRE。簡(jiǎn)單來說,λ相關(guān)測(cè)量法的基本邏輯是計(jì)算以一個(gè)定類變量的值來預(yù)測(cè)另一個(gè)定類變量的值時(shí),如果以眾值作為預(yù)測(cè)的準(zhǔn)則,可以減除多少誤差。接下來,我們了解一下λ系數(shù)的取值范圍。:λ系數(shù)介于0至1之間。我們以λy為例說明一下。這里同樣需要借助294頁(yè)的列聯(lián)表。在上一章中,我們?cè)?jīng)說過,當(dāng)x與y無(wú)關(guān)時(shí),邊緣頻率分布等于條件頻率分布。大家還記不記得上一章中關(guān)于代際與喜愛節(jié)目關(guān)系的列聯(lián)表。大家可以再看一下課本275頁(yè)的表1015。在上一章中,我們說過,如果對(duì)于不同的節(jié)目,三代人的百分比都是一樣的,例如,戲曲,。那么,在總體中,喜愛戲曲的比例是多少?。也就是邊緣頻率分布等于條件頻率分布。反映在294頁(yè)的列聯(lián)表,就是,根據(jù)這一點(diǎn),我們可以知道,所有的眾值應(yīng)該是同行的,因此,大家可以想一想,是不是這樣子?所有眾值處于同一行當(dāng)中,所以,各列眾值次數(shù)之和就等于y變量的眾值次數(shù)。那么,把它代入之前的λ公式,λy=0。這是x與y無(wú)關(guān)時(shí)的λ系數(shù)。當(dāng)x與y全相關(guān)時(shí),各列及各行都只有一個(gè)不為0的頻次值,這一點(diǎn),在上一章中也曾經(jīng)介紹過。只不過使用的是個(gè)2*2的列聯(lián)表。這里,我們看一個(gè)r*c的列聯(lián)表,大家可以對(duì)照著看一下。這時(shí),樣本容量n與各列眾值次數(shù)有什么樣的關(guān)系?n是不是就等于各列眾值次數(shù)之和啊?即n= ,同樣,將它代入λ系數(shù)的公式,可以求出λy=1。在0到1之間,λy越大表示兩個(gè)變量越相關(guān)。了解了λ系數(shù)的基本邏輯以及取值范圍之后,還要學(xué)會(huì)具體應(yīng)用。首先看一個(gè)有關(guān)100名青年人的性別與志愿的列聯(lián)表。表 1 100名青年人的性別與志愿志愿性別總數(shù)男女快樂家庭103040理想工作401050增廣見聞10010總數(shù)6040100我們想了解100名青年人的最大志愿是否男女有別?;蛘哒f性別與志愿之間是否有關(guān)。由于性別是自變量x,最大志愿是依變量y,二者都是定類變量,所以可以選用λy系數(shù)來簡(jiǎn)化相關(guān)的情況。λy==這個(gè)統(tǒng)計(jì)值,它表示以x預(yù)測(cè)y時(shí),可以消減40%的誤差。這是例1,接下來,我們看一下例2。這是一個(gè)關(guān)于青年人的志愿與其知心朋友志愿的列聯(lián)表。自己志愿(y)知心朋友志愿(x)總數(shù)快樂家庭理想工作增廣見聞快樂家庭289340理想工作241750增廣見聞24410總數(shù)325414100通過這個(gè)列聯(lián)表,我們想了解青年人的志愿是否與他們知
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1