freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

人民大學統(tǒng)計學在職題庫統(tǒng)計綜述答案-資料下載頁

2025-06-25 08:58本頁面
  

【正文】 征根要大于1,因為特征根小于1說明該公因子的解釋力度太弱,還不如使用原始變量的解釋力度大。實際應(yīng)用中,因子的提取要結(jié)合具體問題而定,在某種程度上,取決于研究者自身的知識和經(jīng)驗。五、 (20分)在多元線性回歸中,選擇自變量的方法有哪些?向前選擇法、向后剔除法、逐步回歸法。向前選擇法是從模型中沒有自變量開始,分別擬合因變量y對k個自變量()的一元線性回歸模型,共有k個,然后找出F統(tǒng)計量的值最大的(或P值最小的)模型及其自變量,并將該自變量首先引入模型(如果所有模型均無統(tǒng)計上的顯著性,則運算過程終止,沒有模型被擬合)。其次,在模型已經(jīng)引入的基礎(chǔ)上,在分別擬合引入模型外的k1個自變量()的回歸模型,即自變量組合為的k1個回歸模型,分別考察這k1個模型,大的(或者P值最小的)自變量引入模型,如果除之外的k1個自變量中沒有一個是統(tǒng)計上顯著的,則運算終止。如此反復,直至模型外的自變量均無統(tǒng)計顯著性為止。向后剔除法,擬合因變量對所有k歌自變量的線性回歸模型??疾靝(pk)個去掉一個自變量的模型(這些模型中的每一個都有k1個自變量),使模型的SSE值減少最少的自變量(F統(tǒng)計量的值最小或其p值最大)被挑選出來并從模型中剔除。其次考察p1個去掉一個自變量的模型(這些模型中的每一個都有k2個自變量),使模型的SSE值減少最少的自變量被挑選出來并從模型中剔除)。如此反復,直至剔除一個自變量不會使SSE顯著減小為止。這時,這個變量就不會再進入模型中。逐步回歸法將上述兩種方法結(jié)合起來篩選自變量,前兩步與向前選擇法相同。不過在新增加一個自變量后,它會對模型中所有變量重新進行考察,看有沒有可能剔除某個自變量。如果新增加的自變量后,前面增加的某個自變量對模型的貢獻變得不顯著,這個變量就會被剔除按此方法不停的增加變量并考慮剔除以前增加的變量的可能性,直至增加變量已經(jīng)不能導致SSE顯著減少(這個過程可通過F檢驗來完成) 13中國人民大學接受同等學歷人員申請碩士學位考試試題招生專業(yè):統(tǒng)計學考試科目:統(tǒng)計思想綜述課程代碼:123201 考題卷號:13一、 (20分) 下面是測量的30袋食品重量的絕對誤差數(shù)據(jù)(單位:克): (1) 適合描述該組數(shù)據(jù)分布的圖形有哪些?說明這些圖形的主要特點。直方圖,用矩形的寬度和高度來表示頻數(shù)分布箱線圖,可以方便的看出數(shù)據(jù)的分布特征莖葉圖,不僅可以看到分布,還能保留原始數(shù)據(jù)(2) 適合描述該組數(shù)據(jù)分布特征的統(tǒng)計量主要有哪些?說明這些統(tǒng)計量的特點。均值:反映了測量的30袋食品的平均重量水平情況;中位數(shù):反映了測量的30袋食品的重量的中間水平情況;四分位數(shù):反映了測量的30袋食品的重量按照大小順序排列后處于25%、50%及75%的水平情況;眾數(shù):反映了測量的30袋食品的重量出現(xiàn)最多次水平情況;極差:反映了測量的30袋食品的重量中最重與最輕間差異水平情況;四分位差:反映了測量的30袋食品的重量按照大小順序排列后中間50%的數(shù)據(jù)的離散水平情況;方差:反映了測量的30袋食品的重量與均值間的離散程度;二、 (20分)從3個總體中各抽取容量不同的樣本數(shù)據(jù),檢驗3個總體的均值之間是否有顯著差異,得到的方差分析表如下():差異源SSdfMSFPvalue組間A2388C組內(nèi)4509B總計122611(1) 計算出表中A、B、C三個單元格的數(shù)值。A=776 B=50 C=(2) A、B兩個單元格中的數(shù)值被稱為什么?它們所反映的信息是什么?A代表組間平方和,反映了組間各水平間均值的差異B代表組內(nèi)均方誤差,反映了組內(nèi)估值與真值間差異程度(3) ,檢驗的結(jié)論是什么?組間差異顯著,拒絕H0(2,9)=,F(xiàn),故拒絕原假設(shè),認為3個總體的均值之間有顯著性差異。三、 (20分)談?wù)勀莻€置信水平和置信區(qū)間的理解。置信水平:在重復構(gòu)造的總體參數(shù)的多個置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比例(真值落入置信區(qū)間的概率,即顯著性水平)置信區(qū)間:由樣本統(tǒng)計量構(gòu)造出的總體參數(shù)在一定置信水平下的估計區(qū)間四、 (20分)要建立一個多元線性回歸模型,談?wù)勀愕慕K悸贰?. (處理數(shù)據(jù))、確定變量間的關(guān)系2. 建立多元線性回歸模型3. 對模型進行檢驗(模型及自變量顯著性的檢驗)、用估計方程預測4. 殘差分析:檢驗?zāi)P图俣ǎA測效果的檢驗)。模型的解釋。五、 (20分)聚類分析時對變量或數(shù)據(jù)有哪些基本要求?1. 要選擇與分類目標有關(guān)的變量2. 各變量的取值不應(yīng)該有數(shù)量級上的過大差異3. 各變量之間不應(yīng)該有強的相關(guān)關(guān)系 14中國人民大學接受同等學歷人員申請碩士學位考試試題招生專業(yè):統(tǒng)計學考試科目:統(tǒng)計思想綜述課程代碼:123201 考題卷號:14一、 (20分)為分析不同地區(qū)的消費者與所購買的汽車價格是否有關(guān),一家汽車企業(yè)的銷售部門對東部地區(qū)、中部地區(qū)和西部地區(qū)的400個消費者作了抽樣調(diào)查,得到如下結(jié)果:汽車價格東部地區(qū)中部地區(qū)西部地區(qū)10萬元以下20404010—20萬元50605020—30萬元30202030萬元以上402010 列出描述上述數(shù)據(jù)所適用的統(tǒng)計圖形,并說明這些圖形的用途。環(huán)形圖 顯示多個樣本各類別所占的相應(yīng)的比例復式餅圖 是簡單餅圖的嵌套,展示多個分類變量的構(gòu)成比較復式條形圖 顯示不同類別的頻數(shù)或者分布情況二、 (20分)從一批零件中隨機抽取16只。(1) 如果要使用分布構(gòu)建零件平均長度的置信區(qū)間,基本的假定條件是什么?總體服從正態(tài)分布。(2) 構(gòu)建該批零件平均長度的95%的置信區(qū)間。 177。*√16=177。=[,](3) 能否確定該批零件的實際平均長度就在你所構(gòu)建的區(qū)間內(nèi)?為什么?不能確定。因為這個95%的置信區(qū)間是根據(jù)目前的樣本計算的,是一個常數(shù)區(qū)間,實際零件長度要么在這一區(qū)間內(nèi),要么不在這一區(qū)間內(nèi),但是否在其中并不知道。(置信水平)(注:)三、 (20分)某汽車制造公司想了解廣告費用()對銷售量()的影響,收集了過去10年有關(guān)廣告費用(單位:萬元)和銷售量(單位:輛)的數(shù)據(jù),希望建立二者之間的線性回歸方程,并通過廣告費用來預測汽車的銷售量。通過計算得到下面的部分結(jié)果:回歸平方和(SSR)755456殘差平方和(SSE)37504回歸方程的截距回歸方程的斜率(1) 寫出銷售量與廣告費用的直線回歸方程,并解釋回歸系數(shù)的實際意義。Y=+, 廣告費用每增加1萬元,(2) 計算判定系數(shù),說明汽車銷售量的變差中有多少是由于廣告費用的變動引起的?=% , 在汽車銷售量的總變差中,%是由銷售量與廣告費用之間的線性關(guān)系引起的。(3) 計算估計標準誤差,并解釋其實際意義。 =它表示,用廣告費用預測汽車銷售量時,四、 (20分)簡述分解法預測的基本步驟。(1)確定并分離季節(jié)成分。計算季節(jié)指數(shù),以確定時間序列中的季節(jié)成分。然后將季節(jié)成分從時間序列中分離出去,即用每一個時間序列觀測值除以相應(yīng)的季節(jié)指數(shù),以消除季節(jié)成分(2)建立預測模型并進行預測。對消除季節(jié)成分的時間序列建立適當?shù)念A測模型,并根據(jù)這一模型進行預測。(3)計算出最后的預測值。將回歸預測值乘以相應(yīng)的季節(jié)系數(shù)得到最終的預測值。五、 (20分)對于聚類分析回答下面的問題:(1) 解釋Q型聚類和R型聚類的含義Q型聚類:根據(jù)變量對所觀察樣本進行分類的聚類方法R型聚類:根據(jù)樣本對多個變量進行分類的聚類方法(2) 聚類分析與判別分析有何不同? 聚類分析是無監(jiān)督分類,不知道數(shù)據(jù)點的類別標簽,需要自己自動分出來;判別分析是有監(jiān)督的,本身已經(jīng)知道每個數(shù)據(jù)點屬于哪個類,它的任務(wù)是找到最佳的分類方法。 聚類分析又稱群分析、點群分析。根據(jù)研究對象特征對研究對象進行分類的一種多元分析技術(shù), 把性質(zhì)相近的個體歸為一類, 使得同一類中的個體都具有高度的同質(zhì)性, 不同類之間的個體具有高度的異質(zhì)性。根據(jù)分類對象的不同分為樣品聚類和變量聚類。 判別分析是一種進行統(tǒng)計判別和分組的技術(shù)手段。根據(jù)一定量案例的一個分組變量和相應(yīng)的其他多元變量的已知信息, 確定分組與其他多元變量之間的數(shù)量關(guān)系, 建立判別函數(shù), 然后便可以利用這一數(shù)量關(guān)系對其他未知分組類型所屬的案例進行判別分組。判別分析中的因變量或判別準則是定類變量, 而自變量或預測變量基本上是定距變量。依據(jù)判別類型的多少與方法不同, 分為多類判別和逐級判別。判別分析的過程是通過建立自變量的線性組合(或其他非線性函數(shù)), 使之能最佳地區(qū)分因變量的各個類別。 15中國人民大學接受同等學歷人員申請碩士學位考試試題招生專業(yè):統(tǒng)計學考試科目:統(tǒng)計思想綜述課程代碼:123201 考題卷號:15一、 (20分)為研究上市公司對其股價波動的關(guān)注程度,一家研究機構(gòu)對在主板、中小板和創(chuàng)業(yè)板上市的200家公司進行了調(diào)查,得到如下信息:上市公司的類型關(guān)注不關(guān)注主板企業(yè)5070中小板企業(yè)3515創(chuàng)業(yè)板企業(yè)255列出分析上述數(shù)據(jù)所適用的統(tǒng)計方法。答:上述數(shù)據(jù)可采用列聯(lián)表與獨立性檢驗進行分析。如題中表格所示,行變量為“上市公司類型”,列變量為“是否關(guān)注”,這是一個22(23)列聯(lián)表。通過獨立性檢驗來證明兩個變量是否相關(guān)。假設(shè)::上市公司類型與其對股價波動是否關(guān)注無關(guān) :上市公司類型與其對股價波動是否關(guān)注有關(guān)設(shè)RT是給定單元格(如第i行第j列的單元格)所在行的合計頻數(shù),CT是所在列的合計頻數(shù),n是上市公司數(shù)量200,根據(jù)以下公式:為任意打印格的期望頻數(shù),為第一個單元格的期望頻數(shù)以此類推,可得出如下期望頻數(shù)計算表(括號給出的為期望頻數(shù)):上市公司的類型關(guān)注不關(guān)注合計主板企業(yè)50(66)70(54)120中小板企業(yè)35()15()50創(chuàng)業(yè)板企業(yè)25()5()30合計11090200根據(jù)獨立性檢驗的統(tǒng)計量(為觀察頻數(shù),為期望頻數(shù),該統(tǒng)計量服從自由度為(r1)(c1)的分布,r為行數(shù),c為列數(shù)),得出:自由度為2。Excel中使用【CHIDIST】函數(shù)CHIDIST(,2),拒絕原假設(shè),表明上市公司類型與其對股價波動是否關(guān)注有關(guān)。二、 (20分)由30輛汽車構(gòu)成的一個隨機樣本,測得每百公里的耗油量數(shù)據(jù)(單位:公升):判斷該種汽車的耗油量是否近似服從正態(tài)分布的方法有哪些?簡要說明這些方法。答:判斷數(shù)據(jù)是否服從正態(tài)分布,可以通過繪制數(shù)據(jù)頻數(shù)分布的直方圖或莖葉圖、或?qū)?shù)據(jù)作正態(tài)概率圖PP圖和圖的方法來判斷,也可以使用KS檢驗。直方圖或莖葉圖,若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與正態(tài)曲線應(yīng)該相似。PP圖是根據(jù)觀測數(shù)據(jù)的累積概率與理論分布(如正態(tài)分布)的累積概率的符合程度繪制的。圖是根據(jù)觀測值的實際分位數(shù)與理論分布(如正態(tài)分布)的分位數(shù)繪制的。KS檢驗是非參數(shù)檢驗的一種,可以將某一變量的累積分布函數(shù)與特定的分布函數(shù)(如正態(tài)分布函數(shù))進行比較。三、 (20分)簡述時間序列的構(gòu)成要素。答:時間序列構(gòu)成要素有四種,它們是趨勢(T)、季節(jié)變動(S)、周期性或循環(huán)波動(C)和不規(guī)則波動(I)。趨勢也稱為長期趨勢,是指時間序列在長時期內(nèi)呈現(xiàn)出來的某種持續(xù)向上或持續(xù)下降的變動。它是由某種固定性的因素作用于序列而形成的。它可以是線性的,也可以是非線性的。季節(jié)變動是指時間序列呈現(xiàn)出的以年為周期長度的固定變化模式,這種模式年復一年出現(xiàn)。循環(huán)波動是指時間序列呈現(xiàn)出的非固定長度的周期性變動。它不同于趨勢變動,不是朝著單一的方向持續(xù)運動,也不同于季節(jié)變動,季節(jié)變動有比較固定的規(guī)律,且變動周期為一年,而循環(huán)波動則無固定的規(guī)律,變動周期多為一年以上,且周期長短不一。周期性通常是由于經(jīng)濟環(huán)境的變化而引起的。不規(guī)則波動是時間序列中除去趨勢、季節(jié)變動和循環(huán)波動之后的隨機波動。不規(guī)則波動通常是夾雜在時間序列中,致使時間序列產(chǎn)生一種波浪形或振蕩式波動四、 (20分)用一個電子秤對一個標準重量為10克的物體稱重100次,以核對電子秤的準確性。設(shè)為這個電子秤讀數(shù)的均值,即。檢驗假設(shè),考慮以下三個結(jié)論:(a)電子秤是準確的;(b)電子秤是不準確的;(c)電子秤可能是準確的。(1) 如果拒絕,那么三個結(jié)論中那個最好?答:(b)結(jié)論最好。(2) 如果沒有拒絕,那么三個結(jié)論中那個最好?答:(c)結(jié)論最好。(3) 能否通過假設(shè)檢驗來證明這個電子秤是準確的?請說明理由。答:不能?!半娮映邮菧蚀_的”是原假設(shè)。假設(shè)檢驗的目的主要是收集證據(jù)拒絕原假設(shè),假設(shè)檢驗只提供不利于原假設(shè)的證據(jù)。當不能拒絕原假設(shè)時,也不能說“接受原假設(shè)”,因為沒有足夠的證據(jù)證明原假設(shè)是真的,而僅僅意味著目前還沒有足夠的證據(jù)拒絕原假設(shè)。另外,假設(shè)檢驗通常是先確定顯著性水平α(即犯第Ⅰ類錯誤的概率),這就等于控制了犯第Ⅰ類錯誤的概率,但犯第Ⅱ類錯誤(即原假設(shè)是錯誤的卻沒有拒絕原假設(shè))的概率β是不確定的。通常情況下β的值無法知道,在不拒絕原假設(shè)時,也有發(fā)生第Ⅱ類錯誤的風險。因此假設(shè)檢驗不能證明原假設(shè)正確,即不能通過假設(shè)檢驗來證明這個電子秤是準確的。五、 (20分)為研究人均國內(nèi)生產(chǎn)總值(GDP)與人均消費水平之間的關(guān)系,在全國范圍內(nèi)隨機抽取7個地區(qū),得到2008年的人均國內(nèi)生產(chǎn)總值(單位:元)和人均消費水平(單位:元)的統(tǒng)計數(shù)
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1