freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

談單變量描述性統(tǒng)計(jì)分析(編輯修改稿)

2025-07-24 12:29 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 何計(jì)算中位值呢?首先,第一步同計(jì)算原始資料中位值一樣,計(jì)算中位值所在的位置212/2=106。這里之所以使用n/2,是因?yàn)榉纸M資料往往涉及的樣本容量較大,所以n/2近似于(n+1)/2。第二步,根據(jù)統(tǒng)計(jì)表中的累計(jì)次數(shù),找出中位值所在的組。在例題中。第三步,就要想辦法求出中位值了。根據(jù)統(tǒng)計(jì)表,我們知道。=10。該組對(duì)應(yīng)的次數(shù)f是30,位于該組以下的個(gè)案數(shù)目是多少?實(shí)際就是低于中位值組真實(shí)下限的累加次數(shù)cf↑94。我們?nèi)绾尾拍芨鶕?jù)這一系列數(shù)值計(jì)算出中位值呢?【我們知道這一組的真實(shí)下限,那么,如果我們能算出中位值與真實(shí)下限之間的差距,我們就可以算出中位值是多少了?所以,我們要想辦法算出這二者之間的差距。假設(shè)這個(gè)差距為X。根據(jù)各組的組限以及它們對(duì)應(yīng)的累計(jì)次數(shù),我們可以在坐標(biāo)圖中做出一條直線。根據(jù)這個(gè)坐標(biāo)圖,我們可以得出X/w=(n/2cf↑)/f,所以,X=[(n/2cf↑)/f]*w。Md=L+X。】中位值的公式為:Md=L+ 其中, L=中位值組之真實(shí)下限 f=中位值組之次數(shù) w=中位值組之組距 cf↑=低于中位值組真實(shí)下限之累加次數(shù) n=全部個(gè)案數(shù)目根據(jù)這個(gè)公式,我們得出例題的中位值=。換言之,在212個(gè)鄉(xiāng)中,%,%。我希望大家不僅會(huì)計(jì)算中位值,而且會(huì)解釋中位值的含義。至于公式的推算過(guò)程,大家了解一下就可以了。它主要是幫助大家記憶公式的。利用累計(jì)百分比同樣可以計(jì)算中位值,課本為我們?cè)敿?xì)介紹了其計(jì)算方式。基本思路與利用累計(jì)頻次是一樣的。只是將次數(shù)換成了頻率而已。大家感興趣的話可以自己了解一下。由于中位值具有估計(jì)或預(yù)測(cè)的意義。所以,假定從212個(gè)鄉(xiāng)中任意抽取一個(gè)鄉(xiāng),%。長(zhǎng)遠(yuǎn)來(lái)說(shuō),以中位值來(lái)估計(jì)定序變量的數(shù)值,所犯的錯(cuò)誤總數(shù)是最小的。中位值適用于定序以上層次的變量。因此,對(duì)定序變量來(lái)說(shuō),我們有兩種集中值可以使用。但是由于眾值不考慮變量次序,所以對(duì)定序以上層次的變量,是一個(gè)損失。以上介紹了定類變量和定序變量,下面我們一起學(xué)習(xí)一下適用于定距變量的集中值——均值。其實(shí),均值,大家都知道,將變量的各個(gè)數(shù)值相加起來(lái),求取一個(gè)平均的數(shù)值,即均值。與中位值的計(jì)算一樣,均值的計(jì)算方法也可以分為兩種情況,即使用未分組數(shù)據(jù)和使用分組資料。首先,我們了解一下未分組數(shù)據(jù)中,如何根據(jù)原始資料計(jì)算均值。其實(shí)方法很簡(jiǎn)單,大家以前都學(xué)過(guò)。計(jì)算公式: n是全部個(gè)案數(shù)目表示各個(gè)個(gè)案數(shù)值之和例如調(diào)查某地的五戶干部家庭和六戶農(nóng)民家庭,每戶的人數(shù)如下:干部家庭:4,2,3,3,5農(nóng)民家庭:6,4,4,8,6,3根據(jù)公式計(jì)算均值:。比較一下,農(nóng)民家庭的平均人數(shù)多于干部家庭。當(dāng)涉及的樣本數(shù)量較大時(shí),我們就要先統(tǒng)計(jì)每個(gè)變量值出現(xiàn)的次數(shù),之后利用頻次分布來(lái)計(jì)算均值了。所使用的公式為其中x是變量的各個(gè)取值,f是每個(gè)變量值對(duì)應(yīng)的次數(shù)。n則是全部個(gè)案數(shù)目。這里,我們一起看一下課本45頁(yè)的例1。要求計(jì)算550人的平均分?jǐn)?shù)。那么,如果面對(duì)分組數(shù)據(jù),我們應(yīng)該如何計(jì)算均值呢?其實(shí)方法很簡(jiǎn)單,只需要用組中心值代替變量值即可。計(jì)算公式與使用頻次分布相似。其中xm是組中心值。注意,組中心值不同于我們之前講的中位值。組中心值等于真實(shí)上限和真實(shí)下限的算術(shù)平均數(shù)。這里,我們一起看一個(gè)例子。f表示每組的次數(shù)表示組中點(diǎn)n是全部個(gè)案數(shù)目青年人閱讀小說(shuō)書(shū)的數(shù)目書(shū)數(shù)fxmf xm242365746248105945111331236141621530171911818總數(shù)17159按照公式,大家計(jì)算一下,均值是多少?可知平均來(lái)說(shuō)。這里有一點(diǎn)提醒大家注意。用組中心值計(jì)算的均值與使用原始數(shù)據(jù)計(jì)算的均值是存在出入的。但對(duì)社會(huì)學(xué)來(lái)說(shuō),大多數(shù)情況下,其精確度已經(jīng)足夠了。均值主要是為了描述平均水平,它對(duì)每個(gè)個(gè)案的取值都十分敏感,在分布中如有少數(shù)非常極端的變量值,則均值會(huì)受到較大影響。這時(shí)它的代表性會(huì)減弱。而中位值的意義更大,因?yàn)樗皇軜O端值的影響。介紹了三個(gè)集中值之后,我們有必要對(duì)它們進(jìn)行一下簡(jiǎn)單的比較。 ①三值設(shè)計(jì)的共同目的,都是希望通過(guò)一個(gè)數(shù)值來(lái)描述整體特征,以便簡(jiǎn)化資料。他們都反映了變量的集中趨勢(shì),一般說(shuō): 眾值:適用于定類、定序和定距變量; 中位值:適用于定序和定距變量; 均值:適用于定距變量。它們?nèi)叩拇硇詻Q定了它們具有估計(jì)和預(yù)測(cè)的作用。 ②眾值僅使用了資料中最大頻次這一信息,因而資料使用不完全。中位值,考慮了變量的順序和居中位置,因此和總體頻次分布有關(guān),但因?yàn)橹豢紤]居中位置,因而其他變量值的變化很難影響中位值,它也是三個(gè)集中值中最不敏感的。均值,既考慮頻次又考慮變量值的大小,因而更靈敏。它的解釋力最強(qiáng),具有較高的統(tǒng)計(jì)價(jià)值。③均值雖然靈敏,但對(duì)嚴(yán)重偏態(tài)的分布容易失去代表性。即存在非常極端的分布值時(shí),代表性不足。例如,一個(gè)國(guó)家會(huì)因某些少數(shù)富翁的存在,使平均收入變得很高。且在分組資料中的極端組沒(méi)有組限時(shí),不能求出均值,只能用中位值。④偏態(tài)圖形和三值的關(guān)系。對(duì)于正態(tài)分布的圖形來(lái)說(shuō),三值是合一的。當(dāng)圖形正偏或負(fù)偏時(shí),均值變化最快,中位值次之,眾值不變。為什么均值變化最快,這是因?yàn)樗鼧O易受到極端值的影響。關(guān)于這一點(diǎn),大家可以看一下課本48頁(yè)上方的三個(gè)圖形。到這里,有關(guān)單變量的描述統(tǒng)計(jì)技術(shù)已經(jīng)全部介紹完了。簡(jiǎn)單來(lái)說(shuō),我們共介紹了三種方法,一是化約、簡(jiǎn)化,即第三章第一節(jié)的內(nèi)容,次數(shù)分布、頻率分布、統(tǒng)計(jì)圖、統(tǒng)計(jì)表等。二是集中趨勢(shì)測(cè)量法,即求出一個(gè)數(shù)值用以代表變量的資料分布,反映資料的集結(jié)情況。三是離散趨勢(shì)測(cè)量法,即求取一個(gè)數(shù)值來(lái)表示個(gè)案與個(gè)案之間的差異情況。集中趨勢(shì)測(cè)量法和離散趨勢(shì)測(cè)量法是相互補(bǔ)充的。我們?cè)僖黄鸹仡櫼幌逻m用于不同測(cè)量層次的集中值和離散值。它們是這一章需要重點(diǎn)掌握的內(nèi)容,我們先以表格的形式比較一下三個(gè)集中值。集中值均值中位值眾值測(cè)量層次定距變量定序變量定類變量敏感程度最敏感(受極端值影響)不敏感較敏感(尤其適用于單峰對(duì)稱的情況)計(jì)算難度最難一般最易計(jì)算解釋力最好(解釋力強(qiáng)、具有統(tǒng)計(jì)價(jià)值)其次最低、差那么離散值的情況如何呢?與這三個(gè)集中值一一對(duì)應(yīng)的離散值是什么?。慨惐姳嚷?、四分位差和標(biāo)準(zhǔn)差。它們?cè)跍y(cè)量層次、敏感程度、計(jì)算難度和解釋力上也是與這三個(gè)集中值一一對(duì)應(yīng)的。我們不再一一介紹了。那么極差僅僅考慮了兩個(gè)極端值,因而帶有很大的偶然性,對(duì)于大量的處于極端值之間的數(shù)值分布情況,以及在中心點(diǎn)周圍的集中情況,都無(wú)法提供任何信息,主要適用于定序以上層次的變量。離散系數(shù)是一種相對(duì)的離散量數(shù)統(tǒng)計(jì)量,可以用于對(duì)同一總體中兩種不同的離散值進(jìn)行比較,或者對(duì)兩個(gè)不同總體中的同一離散值進(jìn)行比較,適用于定距以上層次的變量。第三章 簡(jiǎn)化兩個(gè)變量的分布第一節(jié) 統(tǒng)計(jì)相關(guān)的性質(zhì) 大家知道,在社會(huì)學(xué)研究中,不僅要求我們對(duì)社會(huì)現(xiàn)象進(jìn)行描述,而且要求我們對(duì)現(xiàn)象的原因進(jìn)行分析。因此,我們不但要了解一個(gè)變量的情況,更要進(jìn)一步了解一個(gè)變量與另一個(gè)變量之間的關(guān)系。例如,在某地區(qū)調(diào)查100名青年人的最大志愿,假定其中有40%選擇快樂(lè)家庭,50%選擇理想工作,10%選擇增廣見(jiàn)聞。我們要問(wèn):為什么這些青年人的最大志愿會(huì)有不同?又假定我們發(fā)現(xiàn)這些青年人的教育水平可以分為高(高中或以上程度)、中(初中程度)、低(小學(xué)或以下程度)三個(gè)等級(jí),每級(jí)人數(shù)分別占10%、60%、30%。據(jù)此,我們就可以追問(wèn):青年人的志愿與其教育水平是否有關(guān)系呢?換言之,是否因?yàn)榻逃讲煌?,所以人生志愿也不同。一?什么是相關(guān)?由此,我們可以引入相關(guān)這個(gè)概念。所謂相關(guān),是指一個(gè)變量的值與另一個(gè)變量的值有連帶性。具體來(lái)說(shuō),如果一個(gè)變量的值發(fā)生變化,另一個(gè)變量的值也有變化,則兩個(gè)變量就是相關(guān)了。例如,教育水平是一個(gè)變量,最大志愿是另一個(gè)變量,如果青年人的教育水平不同,其志愿也不同,我們就可以說(shuō)這兩個(gè)變量是相關(guān)的了。二、相關(guān)的強(qiáng)度和方向在明確了何為相關(guān)以后,進(jìn)一步要考慮的問(wèn)題是相關(guān)的強(qiáng)度和方向。例如:我們通過(guò)調(diào)查發(fā)現(xiàn),父親的教育水平與孩子的教育水平相關(guān),母親的教育水平也與孩子的教育水平相關(guān),那么究竟是前者的相關(guān)程度大,還是后者的相關(guān)程度大呢?或者說(shuō),究竟是父親教育水平對(duì)孩子的影響大,還是母親的教育水平影響大呢?對(duì)于這一點(diǎn),我們可以用統(tǒng)計(jì)法進(jìn)行測(cè)量,也就是計(jì)算相關(guān)系數(shù)。相關(guān)系數(shù)是用來(lái)表示變量間的相關(guān)程度的量的指標(biāo)。它具有這樣幾個(gè)特征。第一,相關(guān)系數(shù)不具有實(shí)際數(shù)學(xué)運(yùn)算意義。為什么這么說(shuō)呢?假如,我有100元,他有50元,我們可以說(shuō),我的錢是他的兩倍。但如果通過(guò)計(jì)算得知,,我們卻不能說(shuō)前者是后者的兩倍,因?yàn)橄嚓P(guān)系數(shù)只能表示相關(guān)程度更強(qiáng)。第二,相關(guān)系數(shù)是統(tǒng)計(jì)得來(lái)的,它只能說(shuō)明兩種現(xiàn)象間可能存在一定的關(guān)聯(lián)度,不一定具有實(shí)際意義,即實(shí)際上可能并不存在相關(guān)關(guān)系,這也就是我們講的統(tǒng)計(jì)相關(guān)。例如,在山東大學(xué)有個(gè)很奇怪的現(xiàn)象。山大每年暑期開(kāi)學(xué)那天往往會(huì)下雨。給我印象最深的就有三次。如果我們將開(kāi)學(xué)看作變量X,下雨看作變量Y,通過(guò)統(tǒng)計(jì),我們很可能得出二者的相關(guān)系數(shù)很高,但是這二者之間并不存在真正的聯(lián)系。也就是說(shuō)統(tǒng)計(jì)上相關(guān),但實(shí)際上不相關(guān)。第三,相關(guān)系數(shù)大多介于[1,1]之間。為什么還有正負(fù)之分呢?有沒(méi)有同學(xué)知道?這實(shí)際就涉及到第二個(gè)問(wèn)題——相關(guān)的方向了。大家有沒(méi)有聽(tīng)過(guò)“造原子彈的不如賣茶葉蛋的”。它描述了我國(guó)改革開(kāi)放初期的職業(yè)收入情況。說(shuō)明當(dāng)時(shí)人們的收入與其教育水平是怎么樣的?成正比還是反比?那現(xiàn)在呢?這二者的關(guān)系發(fā)生了什么變化?是不是基本呈現(xiàn)正比的趨勢(shì)?由此我們可以看出,變量與變量之間的關(guān)系,可以分為正與負(fù)兩個(gè)方向。即根據(jù)相關(guān)方向的不同,可以將相關(guān)分為正相關(guān)和負(fù)相關(guān)。所謂正相關(guān),是指一個(gè)變量的值增加時(shí),另一個(gè)變量的值也隨著增加。例如,收入水平越高,消費(fèi)水平越高。所謂負(fù)相關(guān),是指一個(gè)變量的值增大時(shí),另一個(gè)變量的值卻減小。例如,教育水平越高,理想子女?dāng)?shù)目越少。需要大家注意的是,相關(guān)方向的分析只限于定序以上層次的變量。為什么?有沒(méi)有人能夠解釋一下?我們一再地提不同層次變量的屬性。這是因?yàn)槎ㄐ蛞陨蠈哟巫兞康闹涤懈叩突蚨嗌僦?。至于定類變量,由于變量的值只有類別之分而無(wú)高低之分,因此它與其他變量相關(guān)時(shí)不會(huì)有正或負(fù)的方向。相關(guān)系數(shù)的正負(fù)號(hào)表明了相關(guān)的方向。其絕對(duì)值則表明了相關(guān)的程度。一般0表示無(wú)相關(guān),1代表全相關(guān)(1是完全負(fù)相關(guān),1則是完全正相關(guān))。絕對(duì)值越大,說(shuō)明兩變量之間的相關(guān)程度越強(qiáng)。在社會(huì)現(xiàn)象或人類行為研究中,各種相關(guān)系數(shù)的取值很難達(dá)到全相關(guān)。各種相關(guān)情況,可以用簡(jiǎn)單的圖表說(shuō)明。x y x1x2總數(shù)y1aba+by2cdc+d總數(shù)a+cb+dn=a+b+c+d其中x、y分別代表兩個(gè)變量,它們各有兩個(gè)取值x1,x2,y1,y2.。其中的a、b、c、d代表交叉分類后的個(gè)案數(shù)目。a表示變量x與變量y分別取值為x1, y1的個(gè)案數(shù)目。其余類似?,F(xiàn)在,我們就這個(gè)圖表分別討論一下全相關(guān)、無(wú)相關(guān)的情況。就這個(gè)圖表來(lái)說(shuō),如果a=d=0(或b=c=0),即全部個(gè)案集中在同一對(duì)角線上,則表示變量x與變量y是全相關(guān)。例如,我們?cè)噲D通過(guò)調(diào)查來(lái)了解性別是否會(huì)影響人們對(duì)足球的喜愛(ài)程度。一共調(diào)查了20名學(xué)生,其中10名是男生,10名是女生。發(fā)現(xiàn),a=10,c=0,b=0,d=10,有沒(méi)有同學(xué)能夠解釋一下這個(gè)圖表。當(dāng)調(diào)查對(duì)象為男生時(shí),他一定喜歡足球,而當(dāng)調(diào)查對(duì)象為女生時(shí),她一定不喜歡足球。二者之間的關(guān)系是完全確定的,因此可以說(shuō)達(dá)到了全相關(guān)。當(dāng)然,這種情況在社會(huì)生活中幾乎不會(huì)出現(xiàn)。如果a*d=b*c,即兩對(duì)角線的乘積相等,則表示無(wú)相關(guān)。同樣以剛才的調(diào)查為例,當(dāng)a=5,b=5,c=5,d=5時(shí), 表示什么???當(dāng)性別發(fā)生變化時(shí),他們對(duì)足球的喜愛(ài)程度并沒(méi)有發(fā)生任何變化,同樣是一半男生喜歡足球,一半男生不喜歡足球,女生也是一半對(duì)一半。如果a=10,b=0,c=10,d=0,表示什么?大家好好想一想?是不是也表示性別與人們對(duì)足球的喜愛(ài)程度無(wú)關(guān)啊。因?yàn)?,無(wú)論是男生還是女生都一定喜歡足球。當(dāng)兩個(gè)變量無(wú)關(guān)時(shí),我們可以說(shuō)這兩個(gè)變量之間是相互獨(dú)立的。如果a*d與 b*c的差異越大,就表示相關(guān)程度越強(qiáng)。關(guān)于這個(gè)問(wèn)題,稍候還會(huì)為大家做進(jìn)一步的解釋。三、相關(guān)關(guān)系的類型剛才在介紹相關(guān)的方向時(shí),我們已經(jīng)將相關(guān)關(guān)系區(qū)分為了正相關(guān)和負(fù)相關(guān)。而按變量變化的表現(xiàn)形式進(jìn)行劃分,我們還可以將相關(guān)關(guān)系劃分為直線相關(guān)和曲線相關(guān)兩種。在介紹直線相關(guān)和曲線相關(guān)之前,我們有必要給大家介紹一下用于描述兩變量間關(guān)系狀況的散點(diǎn)圖。散點(diǎn)圖僅適用于定距以上層次的變量,它是以直角坐標(biāo)的橫軸表示變量X的取值變化范圍,縱軸表示變量Y的取值變化范圍。根據(jù)每一個(gè)個(gè)案在變量X和變量Y上的值來(lái)確定坐標(biāo)圖中的每一個(gè)點(diǎn)。借助散點(diǎn)圖,我們能對(duì)兩變量間的關(guān)系有一個(gè)形象、直觀的印象,是我們?cè)趯?duì)定距以上層次的變量進(jìn)行相關(guān)分析時(shí)的一個(gè)重要步驟。那么,所謂直線相關(guān),指的是當(dāng)變量x發(fā)生變動(dòng)時(shí),變量y的值也發(fā)生大致均等的變動(dòng)。表現(xiàn)在直角坐標(biāo)系中,X、Y值所對(duì)應(yīng)的點(diǎn)分布狹長(zhǎng),成直線趨勢(shì)。對(duì)于曲線相關(guān),由于比較復(fù)雜,我們本科階段不會(huì)接觸。曲線相關(guān)表現(xiàn)在直角坐標(biāo)系中,X、Y值所對(duì)應(yīng)的點(diǎn)分布分散,呈曲線趨勢(shì)。再有一點(diǎn)要說(shuō)明的是,我們以后介紹的相關(guān)系數(shù)都是線性相關(guān)系數(shù)。四、因果關(guān)系分析兩個(gè)變量的關(guān)系,除了要注意其相關(guān)的強(qiáng)度與方向以外,還要進(jìn)一步注意這兩個(gè)變量之間是否存在著某種因果關(guān)系。相比相關(guān)關(guān)系,因果關(guān)系的意義更進(jìn)了一步,因?yàn)樗欣谖覀兘忉屔鐣?huì)現(xiàn)象產(chǎn)生和變化的內(nèi)在機(jī)制和動(dòng)因。而且探尋社會(huì)現(xiàn)象相互之間的因果關(guān)系,才是我們進(jìn)行社會(huì)調(diào)查、開(kāi)展社會(huì)研究的最重要目的。我們先來(lái)了解一下因果關(guān)系的定義。定義:兩變量之間的因果關(guān)系,指的是當(dāng)其中一個(gè)變量變化時(shí)(取不同的值時(shí))會(huì)引起或?qū)е铝硪粋€(gè)變量也隨之發(fā)生變化(取值也不同),但反之不成立,當(dāng)后一變量變化時(shí),不會(huì)引起前一變量的變化。許多社會(huì)學(xué)研究在成立假設(shè)時(shí),都會(huì)假定某變量是因,另一變量是果,前者稱為自變量X(指的是變化發(fā)生在前面,并且能引起另一變量發(fā)生變化的那個(gè)變量),后者稱為因變量Y
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1