freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

談單變量描述性統(tǒng)計分析(編輯修改稿)

2024-07-24 12:29 本頁面
 

【文章內(nèi)容簡介】 何計算中位值呢?首先,第一步同計算原始資料中位值一樣,計算中位值所在的位置212/2=106。這里之所以使用n/2,是因為分組資料往往涉及的樣本容量較大,所以n/2近似于(n+1)/2。第二步,根據(jù)統(tǒng)計表中的累計次數(shù),找出中位值所在的組。在例題中。第三步,就要想辦法求出中位值了。根據(jù)統(tǒng)計表,我們知道。=10。該組對應(yīng)的次數(shù)f是30,位于該組以下的個案數(shù)目是多少?實際就是低于中位值組真實下限的累加次數(shù)cf↑94。我們?nèi)绾尾拍芨鶕?jù)這一系列數(shù)值計算出中位值呢?【我們知道這一組的真實下限,那么,如果我們能算出中位值與真實下限之間的差距,我們就可以算出中位值是多少了?所以,我們要想辦法算出這二者之間的差距。假設(shè)這個差距為X。根據(jù)各組的組限以及它們對應(yīng)的累計次數(shù),我們可以在坐標圖中做出一條直線。根據(jù)這個坐標圖,我們可以得出X/w=(n/2cf↑)/f,所以,X=[(n/2cf↑)/f]*w。Md=L+X?!恐形恢档墓綖椋篗d=L+ 其中, L=中位值組之真實下限 f=中位值組之次數(shù) w=中位值組之組距 cf↑=低于中位值組真實下限之累加次數(shù) n=全部個案數(shù)目根據(jù)這個公式,我們得出例題的中位值=。換言之,在212個鄉(xiāng)中,%,%。我希望大家不僅會計算中位值,而且會解釋中位值的含義。至于公式的推算過程,大家了解一下就可以了。它主要是幫助大家記憶公式的。利用累計百分比同樣可以計算中位值,課本為我們詳細介紹了其計算方式?;舅悸放c利用累計頻次是一樣的。只是將次數(shù)換成了頻率而已。大家感興趣的話可以自己了解一下。由于中位值具有估計或預(yù)測的意義。所以,假定從212個鄉(xiāng)中任意抽取一個鄉(xiāng),%。長遠來說,以中位值來估計定序變量的數(shù)值,所犯的錯誤總數(shù)是最小的。中位值適用于定序以上層次的變量。因此,對定序變量來說,我們有兩種集中值可以使用。但是由于眾值不考慮變量次序,所以對定序以上層次的變量,是一個損失。以上介紹了定類變量和定序變量,下面我們一起學習一下適用于定距變量的集中值——均值。其實,均值,大家都知道,將變量的各個數(shù)值相加起來,求取一個平均的數(shù)值,即均值。與中位值的計算一樣,均值的計算方法也可以分為兩種情況,即使用未分組數(shù)據(jù)和使用分組資料。首先,我們了解一下未分組數(shù)據(jù)中,如何根據(jù)原始資料計算均值。其實方法很簡單,大家以前都學過。計算公式: n是全部個案數(shù)目表示各個個案數(shù)值之和例如調(diào)查某地的五戶干部家庭和六戶農(nóng)民家庭,每戶的人數(shù)如下:干部家庭:4,2,3,3,5農(nóng)民家庭:6,4,4,8,6,3根據(jù)公式計算均值:。比較一下,農(nóng)民家庭的平均人數(shù)多于干部家庭。當涉及的樣本數(shù)量較大時,我們就要先統(tǒng)計每個變量值出現(xiàn)的次數(shù),之后利用頻次分布來計算均值了。所使用的公式為其中x是變量的各個取值,f是每個變量值對應(yīng)的次數(shù)。n則是全部個案數(shù)目。這里,我們一起看一下課本45頁的例1。要求計算550人的平均分數(shù)。那么,如果面對分組數(shù)據(jù),我們應(yīng)該如何計算均值呢?其實方法很簡單,只需要用組中心值代替變量值即可。計算公式與使用頻次分布相似。其中xm是組中心值。注意,組中心值不同于我們之前講的中位值。組中心值等于真實上限和真實下限的算術(shù)平均數(shù)。這里,我們一起看一個例子。f表示每組的次數(shù)表示組中點n是全部個案數(shù)目青年人閱讀小說書的數(shù)目書數(shù)fxmf xm242365746248105945111331236141621530171911818總數(shù)17159按照公式,大家計算一下,均值是多少?可知平均來說。這里有一點提醒大家注意。用組中心值計算的均值與使用原始數(shù)據(jù)計算的均值是存在出入的。但對社會學來說,大多數(shù)情況下,其精確度已經(jīng)足夠了。均值主要是為了描述平均水平,它對每個個案的取值都十分敏感,在分布中如有少數(shù)非常極端的變量值,則均值會受到較大影響。這時它的代表性會減弱。而中位值的意義更大,因為它不受極端值的影響。介紹了三個集中值之后,我們有必要對它們進行一下簡單的比較。 ①三值設(shè)計的共同目的,都是希望通過一個數(shù)值來描述整體特征,以便簡化資料。他們都反映了變量的集中趨勢,一般說: 眾值:適用于定類、定序和定距變量; 中位值:適用于定序和定距變量; 均值:適用于定距變量。它們?nèi)叩拇硇詻Q定了它們具有估計和預(yù)測的作用。 ②眾值僅使用了資料中最大頻次這一信息,因而資料使用不完全。中位值,考慮了變量的順序和居中位置,因此和總體頻次分布有關(guān),但因為只考慮居中位置,因而其他變量值的變化很難影響中位值,它也是三個集中值中最不敏感的。均值,既考慮頻次又考慮變量值的大小,因而更靈敏。它的解釋力最強,具有較高的統(tǒng)計價值。③均值雖然靈敏,但對嚴重偏態(tài)的分布容易失去代表性。即存在非常極端的分布值時,代表性不足。例如,一個國家會因某些少數(shù)富翁的存在,使平均收入變得很高。且在分組資料中的極端組沒有組限時,不能求出均值,只能用中位值。④偏態(tài)圖形和三值的關(guān)系。對于正態(tài)分布的圖形來說,三值是合一的。當圖形正偏或負偏時,均值變化最快,中位值次之,眾值不變。為什么均值變化最快,這是因為它極易受到極端值的影響。關(guān)于這一點,大家可以看一下課本48頁上方的三個圖形。到這里,有關(guān)單變量的描述統(tǒng)計技術(shù)已經(jīng)全部介紹完了。簡單來說,我們共介紹了三種方法,一是化約、簡化,即第三章第一節(jié)的內(nèi)容,次數(shù)分布、頻率分布、統(tǒng)計圖、統(tǒng)計表等。二是集中趨勢測量法,即求出一個數(shù)值用以代表變量的資料分布,反映資料的集結(jié)情況。三是離散趨勢測量法,即求取一個數(shù)值來表示個案與個案之間的差異情況。集中趨勢測量法和離散趨勢測量法是相互補充的。我們再一起回顧一下適用于不同測量層次的集中值和離散值。它們是這一章需要重點掌握的內(nèi)容,我們先以表格的形式比較一下三個集中值。集中值均值中位值眾值測量層次定距變量定序變量定類變量敏感程度最敏感(受極端值影響)不敏感較敏感(尤其適用于單峰對稱的情況)計算難度最難一般最易計算解釋力最好(解釋力強、具有統(tǒng)計價值)其次最低、差那么離散值的情況如何呢?與這三個集中值一一對應(yīng)的離散值是什么???異眾比率、四分位差和標準差。它們在測量層次、敏感程度、計算難度和解釋力上也是與這三個集中值一一對應(yīng)的。我們不再一一介紹了。那么極差僅僅考慮了兩個極端值,因而帶有很大的偶然性,對于大量的處于極端值之間的數(shù)值分布情況,以及在中心點周圍的集中情況,都無法提供任何信息,主要適用于定序以上層次的變量。離散系數(shù)是一種相對的離散量數(shù)統(tǒng)計量,可以用于對同一總體中兩種不同的離散值進行比較,或者對兩個不同總體中的同一離散值進行比較,適用于定距以上層次的變量。第三章 簡化兩個變量的分布第一節(jié) 統(tǒng)計相關(guān)的性質(zhì) 大家知道,在社會學研究中,不僅要求我們對社會現(xiàn)象進行描述,而且要求我們對現(xiàn)象的原因進行分析。因此,我們不但要了解一個變量的情況,更要進一步了解一個變量與另一個變量之間的關(guān)系。例如,在某地區(qū)調(diào)查100名青年人的最大志愿,假定其中有40%選擇快樂家庭,50%選擇理想工作,10%選擇增廣見聞。我們要問:為什么這些青年人的最大志愿會有不同?又假定我們發(fā)現(xiàn)這些青年人的教育水平可以分為高(高中或以上程度)、中(初中程度)、低(小學或以下程度)三個等級,每級人數(shù)分別占10%、60%、30%。據(jù)此,我們就可以追問:青年人的志愿與其教育水平是否有關(guān)系呢?換言之,是否因為教育水平不同,所以人生志愿也不同。一、 什么是相關(guān)?由此,我們可以引入相關(guān)這個概念。所謂相關(guān),是指一個變量的值與另一個變量的值有連帶性。具體來說,如果一個變量的值發(fā)生變化,另一個變量的值也有變化,則兩個變量就是相關(guān)了。例如,教育水平是一個變量,最大志愿是另一個變量,如果青年人的教育水平不同,其志愿也不同,我們就可以說這兩個變量是相關(guān)的了。二、相關(guān)的強度和方向在明確了何為相關(guān)以后,進一步要考慮的問題是相關(guān)的強度和方向。例如:我們通過調(diào)查發(fā)現(xiàn),父親的教育水平與孩子的教育水平相關(guān),母親的教育水平也與孩子的教育水平相關(guān),那么究竟是前者的相關(guān)程度大,還是后者的相關(guān)程度大呢?或者說,究竟是父親教育水平對孩子的影響大,還是母親的教育水平影響大呢?對于這一點,我們可以用統(tǒng)計法進行測量,也就是計算相關(guān)系數(shù)。相關(guān)系數(shù)是用來表示變量間的相關(guān)程度的量的指標。它具有這樣幾個特征。第一,相關(guān)系數(shù)不具有實際數(shù)學運算意義。為什么這么說呢?假如,我有100元,他有50元,我們可以說,我的錢是他的兩倍。但如果通過計算得知,,我們卻不能說前者是后者的兩倍,因為相關(guān)系數(shù)只能表示相關(guān)程度更強。第二,相關(guān)系數(shù)是統(tǒng)計得來的,它只能說明兩種現(xiàn)象間可能存在一定的關(guān)聯(lián)度,不一定具有實際意義,即實際上可能并不存在相關(guān)關(guān)系,這也就是我們講的統(tǒng)計相關(guān)。例如,在山東大學有個很奇怪的現(xiàn)象。山大每年暑期開學那天往往會下雨。給我印象最深的就有三次。如果我們將開學看作變量X,下雨看作變量Y,通過統(tǒng)計,我們很可能得出二者的相關(guān)系數(shù)很高,但是這二者之間并不存在真正的聯(lián)系。也就是說統(tǒng)計上相關(guān),但實際上不相關(guān)。第三,相關(guān)系數(shù)大多介于[1,1]之間。為什么還有正負之分呢?有沒有同學知道?這實際就涉及到第二個問題——相關(guān)的方向了。大家有沒有聽過“造原子彈的不如賣茶葉蛋的”。它描述了我國改革開放初期的職業(yè)收入情況。說明當時人們的收入與其教育水平是怎么樣的?成正比還是反比?那現(xiàn)在呢?這二者的關(guān)系發(fā)生了什么變化?是不是基本呈現(xiàn)正比的趨勢?由此我們可以看出,變量與變量之間的關(guān)系,可以分為正與負兩個方向。即根據(jù)相關(guān)方向的不同,可以將相關(guān)分為正相關(guān)和負相關(guān)。所謂正相關(guān),是指一個變量的值增加時,另一個變量的值也隨著增加。例如,收入水平越高,消費水平越高。所謂負相關(guān),是指一個變量的值增大時,另一個變量的值卻減小。例如,教育水平越高,理想子女數(shù)目越少。需要大家注意的是,相關(guān)方向的分析只限于定序以上層次的變量。為什么?有沒有人能夠解釋一下?我們一再地提不同層次變量的屬性。這是因為定序以上層次變量的值有高低或多少之分。至于定類變量,由于變量的值只有類別之分而無高低之分,因此它與其他變量相關(guān)時不會有正或負的方向。相關(guān)系數(shù)的正負號表明了相關(guān)的方向。其絕對值則表明了相關(guān)的程度。一般0表示無相關(guān),1代表全相關(guān)(1是完全負相關(guān),1則是完全正相關(guān))。絕對值越大,說明兩變量之間的相關(guān)程度越強。在社會現(xiàn)象或人類行為研究中,各種相關(guān)系數(shù)的取值很難達到全相關(guān)。各種相關(guān)情況,可以用簡單的圖表說明。x y x1x2總數(shù)y1aba+by2cdc+d總數(shù)a+cb+dn=a+b+c+d其中x、y分別代表兩個變量,它們各有兩個取值x1,x2,y1,y2.。其中的a、b、c、d代表交叉分類后的個案數(shù)目。a表示變量x與變量y分別取值為x1, y1的個案數(shù)目。其余類似。現(xiàn)在,我們就這個圖表分別討論一下全相關(guān)、無相關(guān)的情況。就這個圖表來說,如果a=d=0(或b=c=0),即全部個案集中在同一對角線上,則表示變量x與變量y是全相關(guān)。例如,我們試圖通過調(diào)查來了解性別是否會影響人們對足球的喜愛程度。一共調(diào)查了20名學生,其中10名是男生,10名是女生。發(fā)現(xiàn),a=10,c=0,b=0,d=10,有沒有同學能夠解釋一下這個圖表。當調(diào)查對象為男生時,他一定喜歡足球,而當調(diào)查對象為女生時,她一定不喜歡足球。二者之間的關(guān)系是完全確定的,因此可以說達到了全相關(guān)。當然,這種情況在社會生活中幾乎不會出現(xiàn)。如果a*d=b*c,即兩對角線的乘積相等,則表示無相關(guān)。同樣以剛才的調(diào)查為例,當a=5,b=5,c=5,d=5時, 表示什么???當性別發(fā)生變化時,他們對足球的喜愛程度并沒有發(fā)生任何變化,同樣是一半男生喜歡足球,一半男生不喜歡足球,女生也是一半對一半。如果a=10,b=0,c=10,d=0,表示什么?大家好好想一想?是不是也表示性別與人們對足球的喜愛程度無關(guān)啊。因為,無論是男生還是女生都一定喜歡足球。當兩個變量無關(guān)時,我們可以說這兩個變量之間是相互獨立的。如果a*d與 b*c的差異越大,就表示相關(guān)程度越強。關(guān)于這個問題,稍候還會為大家做進一步的解釋。三、相關(guān)關(guān)系的類型剛才在介紹相關(guān)的方向時,我們已經(jīng)將相關(guān)關(guān)系區(qū)分為了正相關(guān)和負相關(guān)。而按變量變化的表現(xiàn)形式進行劃分,我們還可以將相關(guān)關(guān)系劃分為直線相關(guān)和曲線相關(guān)兩種。在介紹直線相關(guān)和曲線相關(guān)之前,我們有必要給大家介紹一下用于描述兩變量間關(guān)系狀況的散點圖。散點圖僅適用于定距以上層次的變量,它是以直角坐標的橫軸表示變量X的取值變化范圍,縱軸表示變量Y的取值變化范圍。根據(jù)每一個個案在變量X和變量Y上的值來確定坐標圖中的每一個點。借助散點圖,我們能對兩變量間的關(guān)系有一個形象、直觀的印象,是我們在對定距以上層次的變量進行相關(guān)分析時的一個重要步驟。那么,所謂直線相關(guān),指的是當變量x發(fā)生變動時,變量y的值也發(fā)生大致均等的變動。表現(xiàn)在直角坐標系中,X、Y值所對應(yīng)的點分布狹長,成直線趨勢。對于曲線相關(guān),由于比較復(fù)雜,我們本科階段不會接觸。曲線相關(guān)表現(xiàn)在直角坐標系中,X、Y值所對應(yīng)的點分布分散,呈曲線趨勢。再有一點要說明的是,我們以后介紹的相關(guān)系數(shù)都是線性相關(guān)系數(shù)。四、因果關(guān)系分析兩個變量的關(guān)系,除了要注意其相關(guān)的強度與方向以外,還要進一步注意這兩個變量之間是否存在著某種因果關(guān)系。相比相關(guān)關(guān)系,因果關(guān)系的意義更進了一步,因為它更有利于我們解釋社會現(xiàn)象產(chǎn)生和變化的內(nèi)在機制和動因。而且探尋社會現(xiàn)象相互之間的因果關(guān)系,才是我們進行社會調(diào)查、開展社會研究的最重要目的。我們先來了解一下因果關(guān)系的定義。定義:兩變量之間的因果關(guān)系,指的是當其中一個變量變化時(取不同的值時)會引起或?qū)е铝硪粋€變量也隨之發(fā)生變化(取值也不同),但反之不成立,當后一變量變化時,不會引起前一變量的變化。許多社會學研究在成立假設(shè)時,都會假定某變量是因,另一變量是果,前者稱為自變量X(指的是變化發(fā)生在前面,并且能引起另一變量發(fā)生變化的那個變量),后者稱為因變量Y
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1