freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)分析二ppt課件-資料下載頁(yè)

2025-01-14 19:29本頁(yè)面
  

【正文】 學(xué)生按入學(xué)考試成績(jī)和第一學(xué)年結(jié)業(yè)成績(jī)的順序排隊(duì)。如果將入學(xué)考試成績(jī)的評(píng)秩記為X1,X2,Xn,而學(xué)年結(jié)業(yè)成績(jī)的評(píng)秩記為 Y1, Y2, Yn,我們就可以用秩相關(guān)度量來(lái)決定 X和 Y之間的相關(guān)性。 ? ? ???? ?????nininiiiSSRRSRiiSR1 1221)()())((?Ri為第 i個(gè) X值的秩,Si為第 i個(gè) Y值的秩。 90 ? Kendall‘s taub也是一種對(duì)兩個(gè)有序變量或兩個(gè)秩變量間的關(guān)系程度的測(cè)度,因此也屬于一種非參測(cè)度 。 ? 以一個(gè)例子來(lái)進(jìn)行 Kendall秩相關(guān)系數(shù)的計(jì)算。如果兩位鑒定家各自以吸引力的大小將 7幅抽象派畫(huà)評(píng)定了秩,那么可能知道這些秩評(píng)定之間的相符的程度。 91 ? 依次取觀測(cè) 2(鑒別家 2)給出的秩,數(shù)出每一個(gè)右面在秩次上比自己小的個(gè)數(shù),并將這些個(gè)數(shù)加起來(lái)。例如抽象畫(huà) 2的秩為 2,其個(gè)數(shù)是 1,因?yàn)槠溆疫叺闹挥谐橄螽?huà) 5的秩比它小。 6個(gè)數(shù)依次為 1, 1, 0, 0, 1和0,所以總和為 Q= 3, Kendall秩相關(guān)系數(shù)則為: R=14Q/n(n1)=112/42= 畫(huà) 號(hào) 2 6 5 1 4 3 7 鑒別家 1 1 2 3 4 5 6 7 鑒別家 2 2 3 1 4 6 5 7 92 偏相關(guān)系數(shù)( 3) ? 偏相關(guān)系數(shù)描述的是 當(dāng)控制了一個(gè)或幾個(gè)另外的變量的影響條件下兩個(gè)變量間的相關(guān)性 。 ? 例如:可以控制年齡和工作經(jīng)驗(yàn)兩個(gè)變量的影響,估計(jì)工資收入與受教育程度之間的相關(guān)關(guān)系。 ? 控制了變量 Z,變量 X與 Y之間的偏相關(guān),和控制了兩個(gè)變量 Z Z2,變量 X與 Y之間的偏相關(guān)系數(shù)計(jì)算公式不同。 93 ? 兩個(gè)或若干變量之間或兩組觀測(cè)量之間的關(guān)系有時(shí)也可以用相似性或不相似性來(lái)描述。 相似性測(cè)度 用大數(shù)值表示很相似,較小的數(shù)值表明相似性小。 不相似性 使用距離或不相似性來(lái)描述。大值表示相差甚遠(yuǎn)。 94 相關(guān)系數(shù)統(tǒng)計(jì)意義的檢驗(yàn) ? 由于我們通常是通過(guò)抽樣方法;利用樣本研究總體的特性。由于抽樣誤差的存在,樣本中兩個(gè)變量間相關(guān)系數(shù)不為 0,不能說(shuō)明總體中這兩個(gè)變量間的相關(guān)系數(shù)不是0,因此必須經(jīng)過(guò)檢驗(yàn)。檢驗(yàn)的零假設(shè)是:總體中兩個(gè)變量間的相關(guān)系數(shù)為 0。 SPSS的相關(guān)分析過(guò)程給出這假設(shè)成立的概率。 95 相關(guān)分析的 SPSS過(guò)程 ? Bivarate(相關(guān)分析) 命令項(xiàng)調(diào)用 Correlations過(guò)程和 Nonpar Corr 過(guò)程,按指定項(xiàng)顯示變量的描述統(tǒng)計(jì)量。計(jì)算指定的兩個(gè)變量間的相關(guān)系數(shù),可以選擇 Pearson相關(guān)、 Spearman和Kendall39。s taub 相關(guān);同時(shí)對(duì)相關(guān)系數(shù)進(jìn)行檢驗(yàn)。檢驗(yàn)的零假設(shè)是:相關(guān)系數(shù)為 0。可以對(duì)檢驗(yàn)進(jìn)行單尾或雙尾的選擇。給出相關(guān)系數(shù)為 0的概率。 96 97 ? Partial(偏相關(guān)分析) 命令項(xiàng)調(diào)用 Partial Corr過(guò)程,計(jì)算兩個(gè)變量間在控制了其他變量的影響下的相關(guān)系數(shù)??梢赃x擇單尾或雙尾顯著性檢驗(yàn)。檢驗(yàn)的零假設(shè)是:偏相關(guān)系數(shù)為零。還可以要求計(jì)算其他描述統(tǒng)計(jì)量。 98 99 ? Distance(距離分析) 命令項(xiàng)調(diào)用 Proximities 過(guò)程,對(duì)變量或觀測(cè)量進(jìn)行相似性或不相似性測(cè)度。因此分析的變量可以是連續(xù)變量、表示頻數(shù)分布的變量,某些測(cè)度還可以適用于二值變量??梢詫?duì)原始數(shù)據(jù)和計(jì)算出的距離數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。 100 101 ? 如果需要確定兩個(gè)變量或若干自變量與因變量具體的函數(shù)關(guān)系,使用相關(guān)分析不能達(dá)到目的,必須使用 回歸分析 。如果要將觀測(cè)量或變量歸到確定的類(lèi)中,必須使用 聚類(lèi)分析 中的觀測(cè)量聚類(lèi)或變量聚類(lèi)的相應(yīng)過(guò)程。 102 兩個(gè)變量間的相關(guān)分析 ? 本節(jié)介紹兩變量間的相關(guān)。包括兩個(gè)連續(xù)變量間的相關(guān)和兩個(gè)等級(jí)變量間的秩相關(guān)。這兩種相關(guān)使用同一個(gè)命令項(xiàng) Bivarate調(diào)用,通過(guò)選擇不同的分析方法調(diào)用不同的分析過(guò)程。選擇哪一種分析方法要看具體的數(shù)據(jù)類(lèi)型。對(duì)于連續(xù)變量和等級(jí)變量選擇不同的分析方法。 103 ? Pearson調(diào)用 correlation過(guò)程計(jì)算連續(xù)變量或等間隔測(cè)量的變量間的相關(guān)系數(shù)。 ? Kendall39。s taub調(diào)用 Nonpar corr過(guò)程計(jì)算分類(lèi)變量間的秩相關(guān)。 ? Spearman調(diào)用 Nonpar corr過(guò)程計(jì)算斯皮爾曼秩相關(guān)。 ? 如果參與分析的變量是連續(xù)變量,選擇 Kendall39。s taub或Spearman相關(guān),則系統(tǒng)自動(dòng)對(duì)連續(xù)變量的值先求秩,再計(jì)算其秩分?jǐn)?shù)間的相關(guān)系數(shù)。 104 偏相關(guān)分析 ? 相關(guān)分析計(jì)算兩個(gè)變量間的相關(guān)系數(shù),分析兩個(gè)變量間線形關(guān)系的程度。往往因?yàn)榈谌齻€(gè)變量的作用,使相關(guān)系數(shù)不能真正反映兩個(gè)變量間線形程度。例如身高、體重與肺活量之間的關(guān)系。 使用 Pearson相關(guān)計(jì)算其相關(guān)系數(shù),可以得出肺活量與身高和體重均存在較強(qiáng)的線形關(guān)系。 105 ? 但 實(shí)際上 ,如果對(duì)體重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢? 結(jié)論是否定的。正是因?yàn)樯砀吲c體重有著線形關(guān)系,體重與肺活量才存在線形關(guān)系,因此,得出身高與肺活量之間存在較強(qiáng)的線形關(guān)系的錯(cuò)誤結(jié)論。偏相關(guān)分析的任務(wù)就是在研究?jī)蓚€(gè)變量之間的線形相關(guān)關(guān)系時(shí)控制可能對(duì)其產(chǎn)生影響的變量。 106 例 ? 分析身高、體重、肺活量間的關(guān)系 ? 數(shù)據(jù)編號(hào) data10- 04 ? 分別調(diào)用 bivariate和 partial過(guò)程,比較其結(jié) 107 C o r r e la t io n s1 . 7 4 1 ** . 6 0 0 **. . 0 0 0 . 0 0 129 29 29. 7 4 1 ** 1 . 7 5 1 **. 0 0 0 . . 0 0 029 29 29. 6 0 0 ** . 7 5 1 ** 1. 0 0 1 . 0 0 0 .29 29 29P e a r s o n C o r r e la t ionS ig . (2 t a il e d )NP e a r s o n C o r r e la t ionS ig . (2 t a il e d )NP e a r s o n C o r r e la t ionS ig . (2 t a il e d )N身高體重肺活量身高 體重 肺活量C o r r e la t ion is s ig n if ica n t a t t h e 0 . 0 1 le v e l (2 t a il e d ).* * . 108 距離分析 ? 距離分析是對(duì)觀測(cè)量之間或變量之間相似性或不相似程度的一種測(cè)度。是計(jì)算一對(duì)變量之間或一對(duì)觀測(cè)量之間的廣義距離。這些相似性或距離測(cè)度可用于因子分析和聚類(lèi)分析等。 109 有關(guān)統(tǒng)計(jì)量 ? 不相似性測(cè)度 ? 等間隔數(shù)據(jù)的不相似性(距離)測(cè)度可以使用的統(tǒng)計(jì)量:歐幾米德(歐氏)距離、歐氏距離平方等。 ? 計(jì)數(shù)數(shù)據(jù),使用卡方。 ? 二值(只有兩種取值)數(shù)據(jù),使用歐氏距離、歐氏距離平方等。 ? 相似性測(cè)度 ? 等間隔數(shù)據(jù)使用統(tǒng)計(jì)量皮爾遜相關(guān)或余弦。 ? 測(cè)度二元數(shù)據(jù)的相似性使用的統(tǒng)計(jì)量有二十余種。 110 回歸分析法 ? 回歸分析的目的 設(shè)法找出變量間的依存 (數(shù)量 )關(guān)系,用函數(shù)關(guān)系式表達(dá)出來(lái)。 111 基本概念 應(yīng)變量( dependent variable) 自變量( independent variable) 一元線性回歸 直線回歸方程的模型是: yi=a+bxi+ei 其中 (1) a是截距 (2) b是回歸系數(shù)(回歸直線的斜率) (regression coefficient) 回歸系數(shù)的統(tǒng)計(jì)學(xué)意義是:自變量每變化一個(gè)單位, 應(yīng)變量 平均 變化的單位數(shù). (3) ei是殘差 112 多元線性回歸 多元線性回歸方程模型為: yi=b0+b1x1i+b2x2i+…+b nxni+ei 其中 ( 1) b0是常數(shù)項(xiàng),是各自變量都等于 0時(shí),應(yīng)變量的估計(jì)值。有時(shí),人們稱(chēng)它為本底值。 ( 2) b1, b2, … , bn是偏回歸系數(shù) (pertial regression coefficient),其統(tǒng)計(jì)學(xué)意義是在其它所有自變量不變的情況下,某一自變量每變化一個(gè)單位,應(yīng)變量平均變化的單位數(shù)。 如果所有參加分析的變量都是標(biāo)準(zhǔn)化的變量,這時(shí) b0就等于 0, b1, b2, … , bn 就變成了標(biāo)準(zhǔn)化偏回歸 系數(shù),用符號(hào) b1‘ , b2’ , … , bn‘ 表示。 bi’ = bi*sxi/sy 由于 bi’ 沒(méi)有量綱,因此可以相互比較大小,反映自 變量的相對(duì)作用大小。 (3) ei是殘差 113 散點(diǎn)圖 XY* *******************114 XY*** ******* ***********115 ??YX..... ......... ...116 ??YX.................117 ??YX...................118 自變量的選擇 ? 強(qiáng)迫引入法( Enter) ? 強(qiáng)迫剔除法( Remove) ? 前進(jìn)法( Forward) ? 后退法( Backward) ? 逐步向前法( Forward stepwise) ? 逐步向后法( Backward stepwise)
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1