freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多元統(tǒng)計分析ppt課件(已修改)

2025-01-26 17:36 本頁面
 

【正文】 數(shù) 學(xué) 建 模 培 訓(xùn) 第 十 章 多元統(tǒng)計分析 第 十 章 多元統(tǒng)計分析 主 講 : 孫 中 奎 1. 問題引入 2.思路點 撥 3.判 別 分析方法 4. DNA序列分 類問題 的求解 5. 參 考文 獻 目 錄 首先,我 們來 考 慮 一下 2022年“ 網(wǎng) 易杯”全 國 大 學(xué) 生 數(shù)學(xué) 建模 競賽 的 A題 是 關(guān) 于“ DNA序列分 類 ”的 問題 1. 問題 引入 人類基因組中的 DNA全序列是由 4個堿基 A, T, C, G按一定順序排成的長約 30億的序列,毫無疑問,這是一本記錄著人類自身生老病死及遺傳進化的全部信息的“天書”。但是,除了這四種堿基外,人們對它所包含的內(nèi)容知之甚少,如何破譯這部“天書”是二十一世紀最重要的任務(wù)之一。在這個目標中,研究 DNA全序列具有什么結(jié)構(gòu),由這 4個字符排成的看似隨機的序列中隱藏著什么規(guī)律,又是解讀這部天書的基礎(chǔ),是生物信息學(xué)( Bioinformatics)最重要的課題之一。 雖然人類對這部“天書”知之甚少,但也發(fā)現(xiàn)了 DNA序列中的一些規(guī)律性和結(jié)構(gòu)。例如,在全序列中有一些是用于編碼蛋白質(zhì)的序列片段,即由這 4個字符組成的 64種不同的 3字符串,其中大多數(shù)用于編碼構(gòu)成蛋白質(zhì)的 20種氨基酸。又例如,在不用于編碼蛋白質(zhì)的序列片段中, A和 T的含量特別多些,于是以某些堿基特別豐富作為特征去研究 DNA序列的結(jié)構(gòu)也取得了一些結(jié)果。此外,利用統(tǒng)計的方法還發(fā)現(xiàn)序列的某些片段之間具有相關(guān)性,等等。這些發(fā)現(xiàn)讓人們相信, DNA序列中存在著局部的和全局性的結(jié)構(gòu),充分發(fā)掘序列的結(jié)構(gòu)對理解 DNA全序列是十分有意義的。 作為研究 DNA序列的結(jié)構(gòu)的嘗試,試對以下序列進行分類: 問題一:下面有 20個已知類別的人工制造的序列(見附件 1),其中序列標號 1—10 為 A類, 1120為 B類。請從中提取特征,構(gòu)造分類方法,并用這些已知類別的序列,衡量你的方法是否足夠好。然后用你認為滿意的方法,對另外 20個未標明類別的人工序列(標號 21—40)進行分類,把結(jié)果用序號(按從小到大的順序)標明它們的類別(無法分類的不寫入): A類 ; B類 。 問題二:請對 182個自然 DNA序列( 00/)進行分類。它們都較長。用你的分類方法對它們進行分類,并給出分類結(jié)果。 看了這道題,我們應(yīng)當從何處入手呢,我們應(yīng)該怎樣進行分析呢 …… 2. 思路點撥 細讀全題 對未知事物進行分類 問題的本 質(zhì) 對另外 20個未標明類別的 DNA序列進行分類 根據(jù)所給的 20個已知類別的DNA序列所提供的信息 對 182個自然 DNA序列進行分類 如果將每一個 DNA序列都看作樣本,那么該問題就進一步提煉成一個純粹的數(shù)學(xué)問題:設(shè)有兩個總體(類) 和 ,其分布特征(來自各個總體的樣本)已知,對給定的新品 ,我們需要判斷其屬于哪個總體(類)。 對于上面的數(shù)學(xué)問題,可以用很多成熟的方法來解決,例如: ( 1) BP神經(jīng)網(wǎng)絡(luò); ( 2)聚類分析; ( 3)判別分析;等等。 1G2GX 如何選取方法是建模過程中需要解決的另外一個問題: BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的一種,它通過對訓(xùn)練樣本的學(xué)習,提取樣本的隱含信息,進而對新樣本的類別進行預(yù)測。 BP神經(jīng)網(wǎng)絡(luò)可以用以解決上面的DNA序列分類問題,但是,如何提取特征、如何提高網(wǎng)絡(luò)的訓(xùn)練效率、如何提高網(wǎng)絡(luò)的容錯能力、如何建立網(wǎng)絡(luò)結(jié)構(gòu)是能否成功解決 DNA序列分類問題的關(guān)鍵所在;聚類分析和判別分析都是多元統(tǒng)計分析中的經(jīng)典方法,都可以用來將對象(或觀測值)分成不同的集合或類別,但是,聚類分析更側(cè)重于 “ 探索 ” 對象(或觀測值)的自然分組方式,而判別分析則側(cè)重于將未知類別的對象(或觀測值) “ 歸結(jié) ” (或者說,分配)到已知類別中。顯然,判別分析更適合用來解決上面的 DNA序列分類問題。 3.判 別 分析方法 判別分析是用于判別樣品所屬類別的一種多元統(tǒng)計分析方法。判別分析問題都可以這樣描述:設(shè)有 個 維的總體 ,其分布特征已知(如已知分布函數(shù)分別為 或者已知來自各個總體的樣本),對給定的一個新樣品 ,我們需要判斷其屬于哪個總體。一般來說,根據(jù)判別規(guī)則的不同,可以得到不同的判別方法 ,例如,距離判別、貝葉斯( Bayes)判別、費希爾( Fisher)判別、逐步判別、序貫判別等。這里,我們簡單介紹三個常用的判別方法:距離判別、貝葉斯( Bayes)判別和費希爾( Fisher)判別。 k m12, , , kG G G12( ) , ( ) , , ( )kF x F x F xX判 別 分 析 方 法 別 葉斯( Bayes)判 別 希爾( Fisher)判 別 別 分析模型的 顯 著性 檢驗 距離判 別 距離判別的基本思想:樣品 X離哪個總體的距離最近,就判斷 X 屬于哪個總體。 這里的 “ 距離 ” 是通常意義下的距離(歐幾里
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1