freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

日化行業(yè)統(tǒng)計基礎知識研究(編輯修改稿)

2025-01-22 00:41 本頁面
 

【文章內容簡介】 ? 在實踐中,得到隨機樣本不容易。很多搞調查的人就采取 簡單 的辦法。? 還以北京的交通問題的調查為例。假定按照隨機選出的電話號碼進行調查。這樣肯定節(jié)省時間和資源,但這樣得到的就不是一個隨機樣本了。? 如果按照隨機選擇的數字(無論號碼本上有沒有)打電話,那很多電話是空號或單位電話;顯然這種樣本也不是隨機樣本,它稱為方便樣本(convenience sample)。? 在調查中,即使選擇對象的確是隨機的,最理想的情況所得到的樣本也只代表那些愿意回答問題人的觀點所組成的總體; 沒有回答問題的人的觀點永遠不會被這種調查的樣本所代表。方便樣本? 這種不回答的問題是抽樣調查特有的問題。? 在其他問題中,也有使用方便樣本的情況。比如在肺癌研究中,人們往往看到吸煙和肺癌的關系的數據;這些數據并不是整個人群中采集的隨機樣本;它們可能只是醫(yī)院中的病人記錄中得到的。? 在雜志和報紙上也有問卷,但得到的只是擁有這份報刊,而且愿意回答的人的觀點。 誤差 ? 假定在某一職業(yè)人群中女性占的比例為 60%。如果在這個人群中抽取一些隨機樣本,這些隨機樣本中女性的比例并不一定是剛好 60%,可能稍微多些或稍微少些。這是很正常的,因為樣本的特征不一定和總體完全一樣。這種差異不是錯誤,而是必然會出現的 抽樣誤差 (sampling error)。? 剛才提到在抽樣調查中,一些人因為種種原因沒有對調查作出反映(或回答),這種誤差稱為 未響應誤差 (nonresponse error)。? 而另有一些人因為各種原因回答時并沒有真實反映他們的觀點,這稱為 響應誤差 ( response error)。? 和抽樣誤差不一樣,未響應誤差和響應誤差都會影響對真實世界的了解;應該在設計調查方案時盡量避免。 抽樣調查的一些常用方法 ? 在抽樣調查時,最理想的樣本是前面提到的隨機樣本。? 但是 由于實踐起來不方便 ,在大規(guī)模調查時一般不用這種全部隨機抽樣的方式,而只是在局部采用隨機抽樣的方法。? 下面介紹幾種抽樣方法。這里沒有深奧的理論;讀者完全可以根據常識判斷在什么情況下簡單的隨機樣本不方便以及下面的每個方法有什么好處和缺陷。對于它們具體的設計、實施與數據分析,有許多專門的書籍,就不在這里贅述了。 一些抽樣方法 ? 1. 分層抽樣 ( stratified sampling)。這是先把要研究的總體按照某些性質分類(stratum),再在各類中分別抽取樣本。在每類中調查的人數通常是按照這該類人的比例,但出于各種考慮,也可能不按照比例,也可能需要加權(加權就是在求若干項的和時,對各項乘以不同的系數,這些系數的和通常為 1)。 比如可以按照教育程度把要訪問的人群分成幾類;再在每一類中調查和該類成比例數目的人。 這樣就確保了每一類都有成比例的代表。一些抽樣方法 ? ( cluster sampling)。這是先把總體劃分成若干群( cluster),再(通常是隨機地)從這些群中抽取幾群;然后再在這些抽取的群中對個體進行抽樣。 比如,在某縣進行調查,首先在所有村中選取若干村子,然后只對這些村子的人進行調查。 顯然,如果各村情況差異不大,這種抽樣還是方便的。否則就會增大誤差了。 一些抽樣方法 ? ( multistage sampling)。在群體很大時,往往在抽取若干群之后,再在其中抽取若干子群,甚至再在子群中抽取子群,等等。最后只對最后選定的最下面一級進行調查。 比如在全國調查時,先抽取省,再抽取市地,再抽取縣區(qū),再抽取鄉(xiāng)、村直到戶。 在多級抽樣中的每一級都可能采取各種抽樣方法。因此,整個抽樣計劃可能比較復雜,也稱為多級混和型抽樣。 一些抽樣方法 ? ( systematic sampling)。這是先把總體中的每個單元編號,然后隨機選取其中之一作為抽樣的開始點進行抽樣。如果編號是隨機選取的,則這和簡單隨機抽樣是等價的。在選取開始點之后,通常從開始點開始按照編號進行所謂等距抽樣;也就是說,如果開始點為 5號, “距離 ”為 10,則下面的調查對象為 15號、 25號等等。 抽樣方法的選擇不能一概而論?實際上每個抽樣通常都可能是各種抽樣方法的組合。既要考慮精確度,還要根據客觀情況考慮方便性、可行性和經濟性。不能一概而論。 計算機中常用的數據形式 ? 數據是由一些變量和它們的觀測值所組成。下面就是調查人們對某個問題觀點的一個數據的方陣形式。其中有 6個變量:觀點(觀測值為支持、反對和不知道三種)、教育程度(有高中低三種取值,用 H、 M、 L表示)、月收入(取值為實際數字)、性別(取值有男女兩個,用 M和 F表示)以及地區(qū)號(用數字 1, 2, 3, 4表示)等。該表一共有 1364個觀測值(問卷回答)??梢钥闯鲞@些變量有定性(屬性)變量,也有定量(數值)變量。按照這個數據的格式,每一列為一個變量的不同觀測值;而每一行則稱為一個觀測值,它是個由數量值和屬性值組成的向量,每一個值相應于一個變量。 思考? 1. 舉出一些觀測數據和試驗數據的例子。? 2. 舉出簡單隨機樣本的例子。? 3. 根據你的經驗,舉出總體和樣本的一些具體例子。? 4. 舉出調查抽樣時可能發(fā)生的各種影響調查結果的問題,并且提出你認為可以減少或避免這些問題的建議。? 5. 根據你的直覺,本章提到的幾種抽樣方法的優(yōu)缺點是什么?原因何在?? 6. 舉出一些書報上發(fā)表的數據例子,并指出那些是變量,哪些是觀測值。數據的描述如同給人畫像一樣直方圖 ? 比如某個地區(qū)(地區(qū) 1)學校高三男生的身高;有 163個度量如何用圖形來表示這個數據,使人們能夠看出這個數據的大體分布或 “ 形狀 ” 呢?一個辦法就是畫一個直方圖 (histogram)。盒型圖? 比直方圖簡單一些的是盒形圖(boxplot,又稱箱圖、箱線圖、盒子圖 )。后面圖的左邊一個是根據地區(qū) 1高三男生的身高數據所繪的盒形圖;其右邊的圖代表另一個地區(qū)(地區(qū) 2)的高三學生的身高 莖葉圖
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1