freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

南方醫(yī)科大學統(tǒng)計學總結(已修改)

2024-11-26 17:19 本頁面
 

【正文】 1 第一講緒論 一.統(tǒng)計學的定義 1 .統(tǒng)計:是一種對 客觀現(xiàn)象 數(shù)量 方面進行的調查研究活動 。 是 收集、整理、分析、推斷 、判斷等認識活動的總稱。 數(shù)據(jù)匯總僅僅是統(tǒng)計工作的一小部分內容。 2.統(tǒng)計學:“統(tǒng)計學是收集和分析數(shù)據(jù)的科學與藝術?!?—— 《不列顛百科全書》 3. 醫(yī)學統(tǒng)計學:是一門應用統(tǒng)計學方法和原理研究衛(wèi)生服務據(jù)的收集、分析、解釋和表達的學科。 衛(wèi)生統(tǒng)計方法在醫(yī)學研究中的運用主要有三個方面: ①以正確的方式收集數(shù)據(jù),如實驗設計、調查設計等。 ②描述數(shù)據(jù)的統(tǒng)計特征,如數(shù)據(jù)化簡、統(tǒng)計指標的選擇與計算、統(tǒng)計結果的表達等。 ③統(tǒng)計分析及得出正確結論,如根據(jù)概率分布,對實驗和觀察結果存在的差異和關聯(lián)作出統(tǒng)計推斷。 二.統(tǒng)計學的發(fā)展簡史 三.統(tǒng)計學的特點 四、統(tǒng)計工作的基本步驟 (一) 設計 :選題、建立假說、確定研究對象和技術方法等→個性 :圍繞專業(yè)設計確定統(tǒng)計設類型、樣本大小、分組方法、統(tǒng)計分析指標及統(tǒng)計分析方法。 (二) 收集資料 資料來源 第一手資料 ① 經常性:統(tǒng)計報表(死亡登記、疫情 報告等),工作記錄(病歷、化驗); ② 一時性:專題調查、實驗或臨床試驗。 第二手資料:已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計資料。 ? 資料要求 1.完整:觀察單位及觀察項目完整。 觀察單位:最基本的獲取數(shù)據(jù)的單元??梢允且粋€體,亦可以是一個單位、家庭、地區(qū),一批樣品,一個采樣點。 2.準確:即真實、可靠。真實是統(tǒng)計學的靈魂。 3.及時:即時限性。如人口普查規(guī) 定調查開始日期和截止日期。 (三) 整理資料 整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過程。所采取的手段→合理化分組,目的→實現(xiàn)專業(yè)目標。 質分組:按事物的屬性或性質分組→分類變量; 2 量分組:按數(shù)據(jù)的大小→數(shù)值變量。 (四) 分析資料 :用統(tǒng)計指標、統(tǒng)計圖表對資料的數(shù)量特征及分布規(guī)律進行測定和描述。 :用樣本信息推斷總體特征:①參數(shù)估計,②假設檢驗。 ? 統(tǒng)計資料的類型 : 計量資料 , 計數(shù)資料 ,等級資料 基本概念:變量及變量值 *變量: 研究者對每個觀察單位的某項特征進行觀察和測量,這種特征稱為變量 *變量值: 變量的測得值叫變量 值(也叫觀察值),稱為資料。 按變量值的性質可將資料分為 定量資料 和 定性資料 。 1. 計量資料 定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數(shù)據(jù)資料。 特點: 有度量衡單位 ; 多為連續(xù)性資料(通過測量得到) 如患者的身高( cm )、體重( kg)、血壓( mmHg )、脈搏(次 /分)、紅細胞計數(shù)( 10^12 /L ) 計數(shù)資料 定義:將全體觀測單位按照某種性質或特征分組,然后再分別清點各組觀察單位的個數(shù)。 特點: 沒有度量衡單位 ; 多為間斷性資料(通過枚舉或記數(shù)得來 ) 如膚色(黑、白)、血型( ABO)、職業(yè)(工農兵)、性別(男女) 等級資料 定義: 介于計量資料和計數(shù)資料之間 的一種資料,通過 半定量方法 測量得到。 特點:每一個觀察單位沒有確切值 ; 各組之間有性質上的差別或程度上的不同。 ①癌癥分期:早、中、晚。 ②藥物療效:治愈、好轉、無效、死亡。 ③尿蛋白: — 、177。、 ++、 +++級以上 3 三類資料間關系 資料的轉化(變量類型的轉化):數(shù)值變量→分類變量 4 提示: ①多途徑; ②盡量用定量指標,否則損失信息量; ③定性指標可轉化為定量指標,但較粗糙 六、統(tǒng)計學中的幾個基本 概念 1. 隨機變量 (random variable): 簡稱變量 (variable),統(tǒng)計上習慣用 大寫拉丁字母 表示如 X 、 Y 。 變量值習慣用小寫拉丁字母表示,如性別 x 1 = 1 (男)、 x 2 = 1(男)、 x 3 = 0(女)、…。 ? 隨機變量的分類 離散型變量( discrete variable),主要是自然數(shù),例如某地區(qū)某年人口的出生數(shù)、死亡數(shù),某藥治療某病病人的有效數(shù)、無效數(shù)等 。 連續(xù)型變量( continuous variable),在一定區(qū)間內變量取值無限個,或數(shù)值無法一一列舉出來。主要是定量測量結果,例如某地區(qū)男性健康成人的身高值、體重值,一批傳染性肝炎患者的血清轉氨酶測定值。 2. 同質與變異 homogeneity and variation *同質:指事物的性質、影響條件或背景相同或非常相近。 *變異:指同質的個體之間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。是統(tǒng)計學存在的基礎 ,從本質上說 , 統(tǒng)計學就是研究變異的科學。 ? 對變異的認識: (1)自然變異的范圍是 有限的,可以度量 ;參差不齊的測量值,通 過大量重復觀測可以顯現(xiàn)出 統(tǒng)計分布規(guī)律 (2)用統(tǒng)計的方法可以 確定出所有研究對象的變異范圍 ,如正常成年男性的細胞數(shù)的范圍。身高范圍等等。 (3)沒有變異就沒有統(tǒng)計 ,變異使統(tǒng)計有了用武之地。 3. 總體與樣本 population and sample *總體:特定研究對象中 所有 觀察單位的測量值 。 分 為 :有限總體與無限總體。 *樣本:從總體中隨機抽取的部分觀察單位。 隨機抽樣 random sampling: 為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到 , PS:臨床的隨機抽樣是無放回抽樣 )。 5 *對樣本數(shù)據(jù)進行觀察或計算統(tǒng)計指標,目的是推論總體。 4. 參數(shù)與統(tǒng)計量 parameter and statistic *參數(shù): 總體的 統(tǒng)計指標, 采用 小寫希臘字母 , 如總體均數(shù) , 記為μ。 固定的 常數(shù) 。 PS:概率是參數(shù) *統(tǒng)計量: 樣本的 統(tǒng)計指標, 采用 小寫拉丁字母 , 如樣本均數(shù),記為 。統(tǒng)計量是參數(shù)附近波動的 隨機變量 。 PS:頻率是統(tǒng)計量 5. 誤差 error: 實際觀察值與客觀真實值之差 ( 1)系統(tǒng)誤差 systematic error: 在實際觀測過程中,由受試對象、研究者、儀器設備、研究方法、非實驗因素影響等原因造成的有一定傾向性或規(guī)律性的誤差。流行病學稱之為 偏倚( bias) 。 特點:觀察值有系統(tǒng)性、 方向性 (傾向性) 、周期性的偏離真值??梢酝ㄟ^嚴格的實驗設計和技術措施消除。 ( 2)隨機誤差 random error: 排除上述誤差后尚存的誤差,受多種無法控制的因素的影響。 特點: 大小方向不一 的隨機變化。 ? 分類 : *隨機測量誤差 (random measurement error) :在消除了系統(tǒng)誤差的前提下,由于非人為的偶然因素,對于同一樣本多次測定結果不完全一樣,結果有時偏大有時偏小,沒有傾向性,這種誤差叫隨機測量誤差。 特點:沒有傾向性,多次測量計算平均值。 這類誤差可以通過實驗設計和技術措施來消除或使之減少。 *隨機抽樣誤差 ( random sampling error):由抽樣造成的樣本統(tǒng)計量和總體參數(shù)間的差異。 —— 不可避免 , 但有一定的分布規(guī)律 (符合正態(tài)分布) , 可估計 。 特點: 無傾向性; 有抽樣 , 抽樣誤差就不可避免。統(tǒng)計上可以計算并在一定范圍內控制抽樣誤差。 ? 減少抽樣誤差的方法 : ( 1)改進抽樣方法,增加樣本的代表性。 樣本量 n 相等的情況下:整群抽樣 (的抽樣誤差) 單純隨機抽樣 系統(tǒng)抽樣 分層抽樣 ( 2)增加樣本量 n 6 ( 3)選擇變異程度較小的研究指標 6. 概率 probability *確定性現(xiàn)象:在一定條件下, 一定會發(fā)生或一定不會發(fā)生的現(xiàn)象。其表現(xiàn)結果為兩種事件:肯定發(fā)生某種結果的叫必然事件;肯定不發(fā)生某種結果的叫不可能事件。 *隨機現(xiàn)象:在同樣條件下 可能會出現(xiàn)兩種或多種結果,究竟會發(fā)生哪種結果,事先不能確定。其表現(xiàn)結果稱為會出現(xiàn)兩種或多種結果,究 竟會發(fā)生哪種結果,事先不能確定。其表現(xiàn)結果稱為隨機事件。 ? 隨機事件的特征:① 隨機性 ;② 規(guī)律性:每次發(fā)生的可能性的大小是確定的。 *概率:隨機事件發(fā)生的可能性大小,用大寫的 P表示;取值 [0, 1] 。 屬于參數(shù)。 *小概率事件: P ≤ ( 5%)或 P ≤ ( 1%)稱為小概率事件 (習慣 ),統(tǒng)計學上認為不大可能發(fā)生。 小概率事件在一次隨機抽樣中是不可能發(fā)生→統(tǒng)計學做假設檢驗的基礎。 but 在客觀現(xiàn)象中可能發(fā)生→ so,做出的推測有可能是錯的,但錯的可能性很小 PS:在科研中, P一般代表假陽性概率, P取 ( 5%) ( 1%) 取決于實驗對假陰性概率的要求,若要求假陰性概率較低,則選擇 ( 5%) 。 *頻率: 樣本的實際發(fā)生率稱為頻率。設在相同條件下,獨立重復進行樣本的實際發(fā)生率稱為頻率。設在相同條件下,獨立重復進行 n 次試驗,事件 A 出現(xiàn) f 次,則事件 A 出現(xiàn)的頻率為 f / n。 屬于統(tǒng)計量。 ? 頻率與概率間的關系: ( 1) 樣本頻率總是圍繞概率上下波動 ( 2) 樣本含量 n越大,波動幅度越小,頻率越接近概率。 第二講統(tǒng)計描述 (一):計量資料的統(tǒng)計描述 一、頻數(shù)分布表與頻數(shù)分布圖 (frequency table and frequency distribution) (一 )、頻數(shù)分布表 (frequency table) 用途:描述資料的分布特征 頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù) 組段:觀察結果的所有分類 ? 頻數(shù)表的編制步驟 ( 1) 求極差( range):即最大值與最小值之差,又稱為全距。 ( 2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量 n確定。 組距 =極差 /組數(shù),通常分 1015 個組, 為方便計,組距參考極差的十分之一 , 再 略加調整 。 ( 3) 列出組段 :第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。 7 ( 4) 列表整理:用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。 (二 )、頻數(shù)分布圖 (frequency distribution) 計數(shù)資料:以 類別或屬性 為橫軸,以各直條的長短表示頻數(shù)的多少 計量資料:以 組段 為橫軸,以直方頂點的縱坐標 (等距分組 )或直方的面積大小 (不等距分組 )表示頻數(shù)的多少 (三 )、頻數(shù)表和頻數(shù)分布圖 的 用途 1.描述頻數(shù)分布的類型 ( 1)對稱分布 :若各組段頻數(shù)的分布以頻數(shù)最多的組段為 中心左右兩側大體對稱(總體則完全對稱),就認為該資料是對稱分布 ( 2)偏態(tài)分布: 右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段的右側 組段數(shù) 多于左側的 組段數(shù) ,高峰向左偏移,頻數(shù)向右側拖尾。 左偏態(tài)分布(負偏態(tài)分布):頻數(shù)最多組段的左側 組段數(shù) 多于右側的 組段數(shù) ,高峰向右偏移,頻數(shù)向左側拖尾。 右偏態(tài) 左偏態(tài) 2. 描述計量資料分布的集中趨勢和離散趨勢 ①集中趨勢 (central tendency):變量值集中位置。 —— 平均水平指標 ②離散趨勢 (tendency of dispersion):變量值圍繞集中位置的分 布情況。離“中心”位置越遠,頻數(shù)越小;且圍繞“中心”左右對稱。 —— 變異水平指標 3.便于發(fā)現(xiàn)一些特大或特小的可疑值 二、描述集中趨勢的特征數(shù)(平均指標) 總稱為平均數(shù) (average),反映了資料的集中趨勢 (central tendency)。常用的有: 1. 算術均數(shù) (arithmetic mean),簡稱均數(shù) (mean) 2. 幾何均數(shù) (geometric mean) 8 3. 中位數(shù) (median) 算數(shù)均數(shù)( arithmetic mean) /均數(shù)( mean) 符號:總體 μ ,樣本 適用條件:資料呈對稱分布,尤其是正態(tài)分布或近似正態(tài)分布 計算: ( 1)直接法 ( 2)頻數(shù)表法 2. 幾何均數(shù) (geometric mean):變量對數(shù)值的算術均數(shù)的反對數(shù)。 符號: 適用條件:呈倍數(shù)關系的等比資料或對數(shù)正態(tài)分布(正偏態(tài)) 計算: ( 1)直接法 : ( 2)頻數(shù)表法 : ? 同一資料,幾何均數(shù) 均數(shù) 3. 中位數(shù)( median):將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。 符號: Md 適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料; ②資料有不確定數(shù)值 ,如:疾病潛伏期 ;③資料分布不明等。 計算公式:先將觀察值按從小到大順序排列,再按以下公式計算:(特點:僅僅利用了中間的 1~ 2個數(shù)據(jù)) 9 頻數(shù)表中中位數(shù)的計算: ? 均數(shù)、中位數(shù)二者關系 正態(tài)分布時:均數(shù)=中位數(shù) 正偏態(tài)分布時:均數(shù) 中位數(shù) 負偏態(tài)分布時:均數(shù) 中位數(shù) 三 、描述離散趨勢的特征數(shù) (變異指標 ):反映數(shù)據(jù)的離散度( Dispersion),即個體觀察值的變異程度。常用的指標有: (Range) (全距 ) Percentile and Quartile range Variance
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1