freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

生物信息學(xué)考試(編輯修改稿)

2025-05-01 23:37 本頁面
 

【文章內(nèi)容簡介】 有多種其它數(shù)據(jù)類型被整合進GOBASE。例如,對于數(shù)據(jù)庫中所有呈現(xiàn)的序列,相關(guān)的基因功能信息可以獲得(搜索頁面“基因和產(chǎn)物”,表格1),通過指向?qū)iT的酶數(shù)據(jù)庫的網(wǎng)站鏈接可以查看生化途徑,通過指向原生生物數(shù)據(jù)庫的鏈接()關(guān)于關(guān)鍵原生真核生物的物種信息可以獲得,經(jīng)過篩選的RNA二級結(jié)構(gòu)圖表和線粒體DNA遺傳圖譜也可以獲得。這些后來的數(shù)據(jù)中的相當大的一部分是由GOBASE團隊與M. W. Gray 和 M.Schnare (Dalhousie University, Halifax, NS, Canada)合作產(chǎn)生的。最后,GOBASE采用了真核生物分類的四界系統(tǒng)(動物,真菌,植物和原生生物),從而反映了一個廣泛接受的觀點,否則將不能被大多數(shù)其它分子生物學(xué)數(shù)據(jù)庫所支持。GOBASE與其它線粒體數(shù)據(jù)庫在過去的五年中,幾個其它的線粒體數(shù)據(jù)庫已經(jīng)形成,但是,他們的目的、數(shù)據(jù)內(nèi)容和功能性都與GOBASE十分不同。MitoDat(9)、MITOMAP(10) 、 MitOP(11) 和AmmtDB(12)專攻與線粒體突變和喪失功能有關(guān)的人類疾病和紊亂,以及人類和動物中線粒體DNA的與種群相關(guān)的變化。MitBASE(13)在分類上涉及更廣的范圍,正是在這個意義上,與其它線粒體數(shù)據(jù)庫相比,它與GOBASE有著更廣泛的共同基礎(chǔ),但是MitBASE關(guān)注于數(shù)據(jù)的編輯,更強調(diào)植物中線粒體DNA的變化和RNA編輯,而GOBASE關(guān)注于為比較基因組學(xué)研究提供檢索能力??傊?,GOBASE是獨一無二的,因為它整合最多樣的與真核生物線粒體相關(guān)的數(shù)據(jù)類型(不久它也將包括來自葉綠體和模式真細菌的數(shù)據(jù),這將在下面進行說明),而且提供經(jīng)過仔細校正和完善的序列注釋,這與數(shù)據(jù)復(fù)雜檢索能力相關(guān)聯(lián)。在當前的形式下,GOBASE可以被認為是最精確的線粒體序列信息來源之一。數(shù) 據(jù) 校 正作為公共數(shù)據(jù)庫,比如GenBank,其信息只是自然的被保存,數(shù)據(jù)的校正只是在有限的水平進行,這造成記錄注釋的質(zhì)量和完整性相差很大。結(jié)果,公共數(shù)據(jù)庫中序列信息的相當大的一部分很難去辨認(缺少來源、性質(zhì)和遺傳特征類型的注釋),甚至由于不正確的注釋而造成誤導(dǎo)。這些限制的去除正是GOBASE存在的理由。然而,對于GOBASE現(xiàn)有的大約84000(DNA, RNA和蛋白質(zhì))條序列記錄,不可能實現(xiàn)專家逐條數(shù)據(jù)的檢查校正,而是需要軟件工具的大力幫助。所以,我們已經(jīng)研發(fā)了大量的SQL程序來提取潛在的矛盾和錯誤的序列特征(重疊基因,沒有下游外顯子的內(nèi)含子,過大/過小的基因等等)。在UNIX下運行的批處理基因識別程序現(xiàn)在用于檢查其它的更加隱蔽的錯誤和冗長,比如錯誤識別的和忽略的(尤其是tRNA)基因(注意,由于線粒體tRNA非正統(tǒng)的結(jié)構(gòu),利用現(xiàn)有的搜索方法通常很難辨別它們)。在校正網(wǎng)頁(圖1.)上,問題記錄一覽表被提交給專家,它允許對所有可獲得的和新近檢測到的特征進行檢查以及直接修改數(shù)據(jù)庫后臺的數(shù)據(jù)值。應(yīng)該注意到,我們通過結(jié)果頁上的超鏈接“專家注釋”提供給GOBASE用戶這種校正的性質(zhì)和基本原理的說明。圖1. GOBASE以網(wǎng)絡(luò)為基礎(chǔ)的專家校正形式。潛在的錯誤數(shù)據(jù)按以下類別提交給專家:缺少基因名稱,重疊基因,重復(fù)基因,等等。專家形式允許繪圖表示一段特定序列的遺傳元素(頁面的上半部分),訪問相關(guān)的實體,如內(nèi)含子、外顯子(頁面的下半部分)。專家通過“選擇”按鈕選擇一個特定的特征(“特征鍵”),修改它的屬性,比如位置(“從” “到” “鏈”)、反式剪接(“反式剪接”)、完整性(“局部”)、基因名稱(“基因名稱”,是一個處在頁面中間的單獨的選框),為向公眾的發(fā)布添加專家注釋(“專家注釋”),刪除特征(“刪除”)。在輸入新的值后,通過按“更新特征信息”或“更新特征名稱”,它們被提交給數(shù)據(jù)庫后臺來修改相應(yīng)的表格?,F(xiàn)行的管理機制數(shù)據(jù)交流決定一切的價值,尤其是對指數(shù)增長的分子序列數(shù)據(jù)庫。為了趕上公共數(shù)據(jù)庫序列記錄的快速擴張,我們發(fā)展了一套程序來從GenBank數(shù)據(jù)庫獲得數(shù)據(jù),并在最少的人為干擾的情況下移植入GOBASE表格。我們的目標是GOBASE的序列和分類數(shù)據(jù)每月至少更新一次。現(xiàn)行的數(shù)據(jù)實現(xiàn)過程涉及以下三個連續(xù)的步驟:(i)辨別GenBank累積的更新文件夾中與線粒體編碼序列有關(guān)的更新記錄和新的條目;(ii)基因和產(chǎn)物名稱的標準化;(iii)移植入GOBASE表格,轉(zhuǎn)移以前做出的專家校正。為了進行這些步驟,我們在自動化方面加強了獨創(chuàng)的流通管理器(現(xiàn)在被稱為AUTOPOP)。如圖2所示,AUTOPOP協(xié)調(diào)三個專門的幫助工具(GOUP, GETGI 和POP2)的運行,對GenBank版本進行掃描來尋找相關(guān)記錄,分析和提取全新的或更新的感興趣的條目,移植入GOBASE表格。對于Genbank版本118號(2000年9月1日),它花了大約5天來完成植入過程,為了填充GOBASE的主要表格,運行了近20個SQL程序。AUTOPOP不僅被設(shè)計用來代替單調(diào)乏味的手工工作,而且與以前主要由手工進行的過程相比,它的錯誤更少,因為它在每一步都核實過程已被正確完成,并且當
點擊復(fù)制文檔內(nèi)容
化學(xué)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1