freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

生物信息學(xué)考試-文庫(kù)吧資料

2025-04-10 23:37本頁(yè)面
  

【正文】 數(shù)據(jù)庫(kù)轉(zhuǎn)變成一個(gè)廣泛的細(xì)胞器數(shù)據(jù)庫(kù),我們正在向數(shù)據(jù)庫(kù)中添加葉綠體的數(shù)據(jù)。最后。提取的GI號(hào)被POP2用作NCLEVER(14)的輸入。摘要包括提交和修改日期,GI號(hào),“基因組來(lái)源描述”、“修飾描述”和“名稱(chēng)描述”數(shù)據(jù)域中是否出現(xiàn)了關(guān)鍵詞“線粒體”或者“動(dòng)基體”。AUTOPOP開(kāi)始于向GOUP提出請(qǐng)求,它從NCBI的 ftp服務(wù)器下載發(fā)布的分區(qū)序列文件夾()。AUTOPOP不僅被設(shè)計(jì)用來(lái)代替單調(diào)乏味的手工工作,而且與以前主要由手工進(jìn)行的過(guò)程相比,它的錯(cuò)誤更少,因?yàn)樗诿恳徊蕉己藢?shí)過(guò)程已被正確完成,并且當(dāng)問(wèn)題發(fā)生時(shí),它將請(qǐng)求人類(lèi)(數(shù)據(jù)庫(kù)管理人員和/或生物學(xué)專(zhuān)家)的干預(yù)。如圖2所示,AUTOPOP協(xié)調(diào)三個(gè)專(zhuān)門(mén)的幫助工具(GOUP, GETGI 和POP2)的運(yùn)行,對(duì)GenBank版本進(jìn)行掃描來(lái)尋找相關(guān)記錄,分析和提取全新的或更新的感興趣的條目,移植入GOBASE表格。現(xiàn)行的數(shù)據(jù)實(shí)現(xiàn)過(guò)程涉及以下三個(gè)連續(xù)的步驟:(i)辨別GenBank累積的更新文件夾中與線粒體編碼序列有關(guān)的更新記錄和新的條目;(ii)基因和產(chǎn)物名稱(chēng)的標(biāo)準(zhǔn)化;(iii)移植入GOBASE表格,轉(zhuǎn)移以前做出的專(zhuān)家校正。為了趕上公共數(shù)據(jù)庫(kù)序列記錄的快速擴(kuò)張,我們發(fā)展了一套程序來(lái)從GenBank數(shù)據(jù)庫(kù)獲得數(shù)據(jù),并在最少的人為干擾的情況下移植入GOBASE表格。在輸入新的值后,通過(guò)按“更新特征信息”或“更新特征名稱(chēng)”,它們被提交給數(shù)據(jù)庫(kù)后臺(tái)來(lái)修改相應(yīng)的表格。專(zhuān)家形式允許繪圖表示一段特定序列的遺傳元素(頁(yè)面的上半部分),訪問(wèn)相關(guān)的實(shí)體,如內(nèi)含子、外顯子(頁(yè)面的下半部分)。圖1. GOBASE以網(wǎng)絡(luò)為基礎(chǔ)的專(zhuān)家校正形式。在校正網(wǎng)頁(yè)(圖1.)上,問(wèn)題記錄一覽表被提交給專(zhuān)家,它允許對(duì)所有可獲得的和新近檢測(cè)到的特征進(jìn)行檢查以及直接修改數(shù)據(jù)庫(kù)后臺(tái)的數(shù)據(jù)值。所以,我們已經(jīng)研發(fā)了大量的SQL程序來(lái)提取潛在的矛盾和錯(cuò)誤的序列特征(重疊基因,沒(méi)有下游外顯子的內(nèi)含子,過(guò)大/過(guò)小的基因等等)。這些限制的去除正是GOBASE存在的理由。數(shù) 據(jù) 校 正作為公共數(shù)據(jù)庫(kù),比如GenBank,其信息只是自然的被保存,數(shù)據(jù)的校正只是在有限的水平進(jìn)行,這造成記錄注釋的質(zhì)量和完整性相差很大。總之,GOBASE是獨(dú)一無(wú)二的,因?yàn)樗献疃鄻拥呐c真核生物線粒體相關(guān)的數(shù)據(jù)類(lèi)型(不久它也將包括來(lái)自葉綠體和模式真細(xì)菌的數(shù)據(jù),這將在下面進(jìn)行說(shuō)明),而且提供經(jīng)過(guò)仔細(xì)校正和完善的序列注釋?zhuān)@與數(shù)據(jù)復(fù)雜檢索能力相關(guān)聯(lián)。MitoDat(9)、MITOMAP(10) 、 MitOP(11) 和AmmtDB(12)專(zhuān)攻與線粒體突變和喪失功能有關(guān)的人類(lèi)疾病和紊亂,以及人類(lèi)和動(dòng)物中線粒體DNA的與種群相關(guān)的變化。最后,GOBASE采用了真核生物分類(lèi)的四界系統(tǒng)(動(dòng)物,真菌,植物和原生生物),從而反映了一個(gè)廣泛接受的觀點(diǎn),否則將不能被大多數(shù)其它分子生物學(xué)數(shù)據(jù)庫(kù)所支持。這些后來(lái)的數(shù)據(jù)中的相當(dāng)大的一部分是由GOBASE團(tuán)隊(duì)與M. W. Gray 和 M.除了來(lái)自GenBank的可獲得信息(序列和分類(lèi)數(shù)據(jù))外,還有多種其它數(shù)據(jù)類(lèi)型被整合進(jìn)GOBASE。在呈現(xiàn)給公眾之前,從GenBank提取的數(shù)據(jù)在基因和基因產(chǎn)物的術(shù)語(yǔ)、遺傳密碼、細(xì)胞定位和更多的方面被校正。類(lèi)別名稱(chēng)對(duì)應(yīng)于數(shù)據(jù)庫(kù)中檢索頁(yè)面的名稱(chēng)。作為例證,我們列出了以下幾個(gè)在GOBASE中可以闡明但在其它可訪問(wèn)的公共數(shù)據(jù)庫(kù)中無(wú)法實(shí)現(xiàn)的檢索實(shí)例:(i)找到所有的線粒體編碼的5S rRNA;(ii)找到所有參與動(dòng)物線粒體翻譯的蛋白質(zhì);(iii)找到所有來(lái)自原生生物的細(xì)胞色素c氧化酶的完整編碼序列;(iv)找到所有的真菌線粒體質(zhì)粒編碼的完整蛋白質(zhì);(v)找到所有定位于線粒體內(nèi)含子的確定的基因(不是開(kāi)放閱讀框);(vi)找到地錢(qián)中除了內(nèi)含子開(kāi)放閱讀框以外的所有線粒體DNA的開(kāi)放閱讀框;(vii)找到所有使用TGA作為色氨酸線粒體翻譯密碼的生物。需要指出,我們沒(méi)有采用國(guó)際核苷酸序列數(shù)據(jù)庫(kù)(NCBI, EMBL, DDBJ)的分類(lèi)方式,因?yàn)?,它不能有效的區(qū)分高水平和低水平的生物學(xué)范疇(例如,不能區(qū)分一般的范疇,如保守結(jié)構(gòu)域、外顯子、內(nèi)含子,與特殊的范疇,如iDNA,D環(huán),CAAT信號(hào),而是同樣的表示為“特征屬性”)。 GOBASE的特征GOBASE消除了許多上述的限制。定位這些關(guān)鍵特征的唯一辦法是在全部領(lǐng)域中進(jìn)行全文搜索,但是這個(gè)過(guò)程經(jīng)常返回大量的假陽(yáng)性信息。第二,序列特征注釋不完善或不正確的記錄經(jīng)常被發(fā)布出來(lái)(例如,缺少基因名稱(chēng),或者序列來(lái)源基因組的細(xì)胞定位不明確)。這個(gè)矛盾和不支持以基因產(chǎn)物名稱(chēng)為基礎(chǔ)進(jìn)行搜索的事實(shí),使得在公共數(shù)據(jù)庫(kù)中直接鑒別基因同源性幾乎不可能實(shí)現(xiàn)。一些現(xiàn)象將能夠充分表明公共序列數(shù)據(jù)庫(kù)在檢索方面的局限性。序列倉(cāng)庫(kù)與可檢索的數(shù)據(jù)庫(kù)公共的生物序列數(shù)據(jù)庫(kù),比如GenBank(6)(現(xiàn)在由美國(guó)國(guó)家生物技術(shù)信息中心維護(hù)),日本DNA數(shù)據(jù)庫(kù)(DDBJ)(7),和歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL) (8),是分子生物學(xué)研究的重要財(cái)產(chǎn)。GOBASE的第一版以前已經(jīng)在這本雜志(5)中描述過(guò),包括數(shù)據(jù)庫(kù)外觀,數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
化學(xué)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1