freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

真核生物5端外顯子和翻譯起始位點的預測-wenkub.com

2025-04-01 23:46 本頁面
   

【正文】 2001年前,主要從事計算流體力學的網(wǎng)格生成算法、科學計算可視化算法研究以及CFD軟件應(yīng)用和開發(fā);2001~2002年留北大做博士后,轉(zhuǎn)向生物信息學領(lǐng)域,主要從事生物基因組序列的信息結(jié)構(gòu)的復雜性及基因預測新算法的研究。研究方向:基因組序列生物復雜性研究1. 將湍流層次結(jié)構(gòu)模型發(fā)展成系統(tǒng)的復雜系統(tǒng)層次結(jié)構(gòu)理論,并應(yīng)用于生命科學中的多層次復雜系統(tǒng)。冬天酷愛滑冰,一旦湖面結(jié)冰,幾乎每日必去,自諭“略有小成”。我很慶幸能加入到這個小組。這里我首先要感謝我的導師佘振蘇教授,他不僅為我提供了一個做研究的良好環(huán)境并對我的工作進行指導,更重要的是他那種做一名真正科學家的氣質(zhì)已經(jīng)深深的感染了我。 表5 將預測5’端外顯子的結(jié)果與國際相關(guān)知名基因識別軟件預測的結(jié)果進行比較%FGENESGene MarkGenieGenscanHMMgeneMorgan我們的方法Sn64404957683548Sp55484571723548 可以看出,對5’端外顯子的預測,我們的精度以及和Genie不相上下。我們接下來看一下學習集中的以及測試出具有NSC_0狀態(tài)中ATG信號對應(yīng)的[ATG…]GT序列長度分布,如圖5 。表4 在模式2下,評價表3各種方法優(yōu)劣的參數(shù)方法Sn(%)Sp(%)sn+sp(%)ATG信號ATG,GT信號ATG,GT,模糊詞匯最終采用算法在這種模式下, 最終采用算法出人意料地被評為最差。一方面是判為狀態(tài)NSC_0的ATG信號數(shù)目不宜太少,否則我們最終滿足不了預測翻譯起始位點的精度要求。表3 只采用算法中某些步驟與采用完整算法對比結(jié)果對TIS出現(xiàn)、未出現(xiàn)(假陽性ATG)在T表位置K上的次數(shù)作統(tǒng)計T中元素的個數(shù)不超過K(T中包含元素可能多于3個,這里只給出不超過3的情況)T中元素的個數(shù) 1 2 3TIS假陽性的ATGTIS假陽性的ATGTIS假陽性的ATGTIS假陽性的ATGATG信號103012214138151371101372ATG,GT信號855962212815128117889ATG,GT,模糊詞匯565851612315112104519最終采用算法37377611096082247每條序列可能測出多個“翻譯起始位點”,將它們按在DNA序列上出現(xiàn)的位置從小到大排列成一個隊T,如果翻譯起始位點出現(xiàn)在該隊中,則其出現(xiàn)在表中的位置記為K 對翻譯起始位點的預測,就實際應(yīng)用而言,我們有兩種模式(1) 實際的含有一條基因的DNA序列,只有不多于一個翻譯起始位點。4 結(jié)果與討論我們采用如下方法對測試集進行測試:從每一測試序列的5’端 開始用多狀態(tài)信號的熵距離判別分析方法分析出狀態(tài)為NSC_0的ATG信號后,在該ATG信號之后找出與之同閱讀框的STP信號,再利用WMM在ATG與STP之間找出最大可能成為D類的GT信號,如果該ATG及GT組成的[ATG…]GT序列前出現(xiàn)了某個模糊詞匯則采用MED多中心聚類方法進行判別,將判為類IE的[ATG…]GT序列對應(yīng)的ATG、GT信號存入結(jié)果,接下來多狀態(tài)熵距離判別分析方法對該STP信號以后的ATG信號進行分析,重復以上過程,圖4給出了該算法的流程圖。同時可以分析出: IE類的EDP點在相空間上的分布要更“緊湊”,而NIE類的EDP點在相空間上要更“松散”一些。理論上可以證明,當m增大時,會趨于穩(wěn)定,即,n=1,…,N同樣可以得到點集的多中心。首先在中隨機挑選一批有代表性的樣品點,稱之為聚點(clustering point),要求它們滿足:(1)、兩兩之間的距離不小于(r為聚類半徑),即;(2)、構(gòu)造區(qū)域,是以為球心、為半徑的小球,若,有:然后,對以聚點為球心、為半徑的小球進行平均,得到它的初始中心。在判別未知點時,計算其中是歐氏距離。這里同時也指出每一類的聚類中心往往有不只一個,為了較好的刻畫這樣的聚類性,我們采用了多中心聚類方法。我們認為, 具有生物學意義、能編碼蛋白質(zhì)的IE類[ATG…]GT序列的與非編碼的NIE類[ATG…]GT序列的編碼潛能有著一定的差別. 為刻畫編碼潛能, 我們引入多變量的參數(shù)——熵密度分布(entropy density profile, 簡稱EDP)。我們只保留將NIE類中出現(xiàn)某個模糊詞匯的[ATG…]GT序列共1353條以及IE類中長度大于30bp的[ATG…]GT序列共777條。 原核生物中,翻譯起始密碼子上游4~7個核苷酸之前有一段富含5’…AGGAGG…3’的短小序列,成為SD序列【12】。 程序中,GT信號對應(yīng)序列的參數(shù)選為GT信號前20bp后20bp。當有ATG對應(yīng)的狀態(tài)判為NSC_0時,找出與其同相位的第一個STP信號,將它倆之間非D類的GT信號歸到類ND(not donor)中,然后對STP以后的ATG信號重復以上的操作。 表1多狀態(tài)熵距離判別分析方法與WMM的對照結(jié)果(這里把判斷為TIS的不具有NSC_0狀態(tài)的ATG信號成為假陽性的ATG信號)分析到第一個供體位點之前分析到第一個受體位點之前TIS =ATG信號假陽性的ATG信號減少數(shù)目減數(shù)/WMM數(shù)目TIS =ATG信號假陽性的ATG信號減少數(shù)目減數(shù)/WMM數(shù)目多狀態(tài)熵距離數(shù)目WMM數(shù)目多狀態(tài)熵距離數(shù)目WMM數(shù)目 13483284816134148914038613810131040271371768
點擊復制文檔內(nèi)容
化學相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1