freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第五節(jié)基因識別-文庫吧

2025-07-17 13:23 本頁面


【正文】 單的統(tǒng)計(jì)模型 假設(shè)相繼的密碼子是獨(dú)立的,不存在前后依賴關(guān)系。 令 fabc代表密碼子 abc在編碼區(qū)域出現(xiàn)的頻率 給定序列 a1,b1,c1, a2,b2,c2,…, a n+1,bn+1 從密碼子 a1b1c1開始的閱讀框,其 n個(gè)密碼子的出現(xiàn)概率為 nnn cbacbacba fffp ???? . . .2211111 ? 第二種和第三種閱讀框 n個(gè)密碼子出現(xiàn)的概率分別為 1322211 . . .2 ????? nnn acbacbacb fffp11332221 ...3 ?????? nnn bacbacbac fffp? 第 i個(gè)閱讀框成為編碼閱讀框的概率 計(jì)算: ? 算法: 在序列上移動長度為 n的窗口,計(jì)算 Pi 根據(jù) Pi的值識別編碼的閱讀框 321 ppppP ii ???基于編碼區(qū)域堿基組成特征的識別方法 ?編碼序列與非編碼序列在堿基組成上有區(qū)別 ? 單個(gè)堿基的組成比例 ? 多個(gè)堿基的組成 ?通過統(tǒng)計(jì)分析識別編碼序列 分析實(shí)例 真核基因識別問題 真核基因遠(yuǎn)比原核基因復(fù)雜: ?一方面,真核基因的編碼區(qū)域是非連續(xù)的,編碼區(qū)域被分割為若干個(gè)小片段。 ?另一方面,真核基因具有更加豐富的基因調(diào)控信息,這些信息主要分布在基因上游區(qū)域。 基因識別基本思路 ?找出基因兩端的功能區(qū)域 : 轉(zhuǎn)錄啟動區(qū) 終止區(qū) ? 在啟動區(qū)下游位置尋找翻譯起始密碼子 ? 識別轉(zhuǎn)錄剪切位點(diǎn) 剪切給體位點(diǎn) 剪切接受體位點(diǎn) ?各種不同的方法有不同的適應(yīng)面,而不同的方法有時(shí)可以結(jié)合起來以提高基因識別的準(zhǔn)確率。 ?關(guān)鍵問題是如何提高一個(gè)識別算法的敏感性( sensitivity, Sn)和特異性( specificity, Sp)。 基因識別的主要方法 兩大類識別方法: ?從頭算方法(或基于統(tǒng)計(jì)的方法) ? 根據(jù)蛋白質(zhì)編碼基因的一般性質(zhì)和特征進(jìn)行識別,通過統(tǒng)計(jì)值區(qū)分外顯子、內(nèi)含子及基因間區(qū)域 ?基于同源序列比較的方法 ? 利用數(shù)據(jù)庫中現(xiàn)有與基因有關(guān)的信息(如 EST序列、蛋白質(zhì)序列),通過同源比較,幫助發(fā)現(xiàn)新基因。 ?最理想的方法是綜合兩大類方法的優(yōu)點(diǎn),開發(fā)混合算法。 ?基因識別方法有 : ( 1)基于規(guī)則的系統(tǒng) ( 2) 語義學(xué)方法 ( 3) 線性辨別分析( LDA) ( 4) 決策樹 ? ( 5) 動態(tài)規(guī)劃 ?( 6) 隱馬爾柯夫模型 ? ( 7) 剪切對比排列 ( spliced
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1