【正文】
生 物 信 息 學(xué) 考 試數(shù)據(jù)庫(kù)論文翻譯題目:GOBASE: the organelle genome database (GOBASE:細(xì)胞器基因組數(shù)據(jù)庫(kù))劉 凱學(xué) 號(hào):021401007(山東大學(xué)生命科學(xué)學(xué)院 2002級(jí) 生命科學(xué)與技術(shù)基地班)2005 年 6 月核酸研究,2001,第29卷,第1期:128132169。 2001 牛津大學(xué)出版社GOBASE:細(xì)胞器基因組數(shù)據(jù)庫(kù)Nelli Shimko, Lin Liu, B. Franz Lang and Gertraud Burger* Program in Evolutionary Biology, Canadian Institute for Advanced Research, D233。partement de Biochimie, Universit233。de Montr233。al, 2900 Boulevard EdouardMontpetit, Montr233。al, Qu233。bec, H3T 1J4, Canada 收到:2000年10月2日;接受:2000年10月17日摘 要GOBASE ()是一個(gè)可以通過(guò)網(wǎng)絡(luò)訪問(wèn)的生物學(xué)數(shù)據(jù)庫(kù),它在以下方面是獨(dú)一無(wú)二的:將分類上覆蓋很廣的各種關(guān)于細(xì)胞器的生物學(xué)數(shù)據(jù)整合在一起,以及提供已被專家盡全力校正和完善的數(shù)據(jù)。目前我們主要關(guān)注線粒體數(shù)據(jù)。GOBASE包括所有已經(jīng)發(fā)表的由線粒體基因組編碼的核酸和蛋白質(zhì)序列、經(jīng)過(guò)篩選的由線粒體編碼的RNA二級(jí)結(jié)構(gòu)、全基因組遺傳圖譜、在數(shù)據(jù)庫(kù)中出現(xiàn)其序列的物種的分類信息,以及重要原生真核生物的生物學(xué)描述。所有這些數(shù)據(jù)被整合和組織在一個(gè)正式的數(shù)據(jù)庫(kù)結(jié)構(gòu)中,它允許用生物學(xué)概念中固有的術(shù)語(yǔ)進(jìn)行復(fù)雜的生物學(xué)檢索。最重要的是,數(shù)據(jù)已經(jīng)過(guò)確認(rèn)、完善、校正和標(biāo)準(zhǔn)化,這是進(jìn)行有意義的分析的一個(gè)先決條件。而且,對(duì)于缺少的關(guān)鍵數(shù)據(jù),比如遺傳圖譜和RNA二級(jí)結(jié)構(gòu),則由GOBASE團(tuán)隊(duì)及其合作者補(bǔ)充到數(shù)據(jù)庫(kù)中。這個(gè)數(shù)據(jù)庫(kù)在數(shù)據(jù)庫(kù)管理系統(tǒng)中得以實(shí)現(xiàn),但又以界面實(shí)現(xiàn)的生物數(shù)據(jù)的面向?qū)ο蟮耐庥^為特征。最后,我們發(fā)展了用于數(shù)據(jù)庫(kù)完善的軟件(如數(shù)據(jù)更新,確認(rèn)和校正),這將在這篇論文中做較為詳細(xì)的介紹。介 紹生物背景:細(xì)胞器和它們的基因組線粒體和葉綠體是被嚴(yán)格定義的,含有自身獨(dú)特遺傳物質(zhì)的真核細(xì)胞的亞細(xì)胞組分(細(xì)胞器)。線粒體(mt)和葉綠體(cp)只編碼一小部分參與細(xì)胞器翻譯機(jī)制和呼吸/氧化磷酸化或者光合作用的細(xì)胞器組分。大部分的細(xì)胞器蛋白質(zhì)是由核基因編碼,在細(xì)胞質(zhì)中翻譯,并運(yùn)輸進(jìn)細(xì)胞器的。(1)在某些物種中,一些結(jié)構(gòu)RNA也是由細(xì)胞核編碼而運(yùn)入細(xì)胞器的。線粒體和葉綠體的研究覆蓋了多種主題。細(xì)胞器的細(xì)菌起源提出了一個(gè)進(jìn)化問(wèn)題,它關(guān)于從內(nèi)共生細(xì)菌到亞細(xì)胞組分的轉(zhuǎn)換,細(xì)胞器基因組和核基因組在功能上的和系統(tǒng)發(fā)生上的關(guān)系,以及細(xì)胞器基因組、基因和基因表達(dá)模式的多樣性。尤其是快速進(jìn)化的線粒體產(chǎn)生了大量迷人的分子機(jī)制,比如通過(guò)核苷酸刪除、插入和修飾實(shí)現(xiàn)的RNA轉(zhuǎn)錄后編輯,以及前信使RNA的反式剪接。從生物化學(xué)的角度看,研究主題包括細(xì)胞器在能量產(chǎn)生中的作用(如氧化磷酸化和光合作用),蛋白質(zhì)運(yùn)輸?shù)姆肿訖C(jī)制,多次跨膜的膜結(jié)合酶復(fù)合體的組裝過(guò)程,蛋白質(zhì)和RNA的二級(jí)和三級(jí)結(jié)構(gòu)。另一個(gè)熱點(diǎn)集中于線粒體在人類疾病中的作用,種群內(nèi)線粒體基因組的遺傳多樣性和染色體外遺傳的規(guī)律。這個(gè)顯然不完全的主題列表表明了細(xì)胞器研究的多樣性。多年來(lái),人們?cè)谶M(jìn)行大規(guī)模的細(xì)胞器全基因組測(cè)序方面做出了協(xié)調(diào)的努力,例如細(xì)胞器基因組百萬(wàn)測(cè)序項(xiàng)目[OGMP(2)。],真菌線粒體基因組項(xiàng)目[FMGP (3)。 ],以及線粒體基因組工作組[(4)。 ~jboore/]?,F(xiàn)在,在公共數(shù)據(jù)庫(kù)上可以獲得116個(gè)完整線粒體DNA和17個(gè)葉綠體DNA序列。除了病毒,細(xì)胞器DNA構(gòu)成了最大規(guī)模的完全測(cè)序的基因組系列,這使它們成為比較基因組研究的理想材料?,F(xiàn)在可以獲得的細(xì)胞器數(shù)據(jù)主要包括細(xì)胞器酶復(fù)合體結(jié)構(gòu)的詳細(xì)信息和它們的催化功能,蛋白質(zhì)運(yùn)輸和包裝途徑,DNA復(fù)制和轉(zhuǎn)錄機(jī)制,超結(jié)構(gòu)組件,以及基因組成和遺傳。但是,這些數(shù)據(jù)廣泛地分布于多種數(shù)據(jù)來(lái)源,比如書籍,雜志,論文和電子數(shù)據(jù)庫(kù),所以,即使對(duì)于本領(lǐng)域的專家,搜索相關(guān)信息也是十分困難和費(fèi)時(shí)的。由于這些原因,一個(gè)充分組織和整合的數(shù)據(jù)庫(kù)成為了能夠利用這些難于使用的信息財(cái)富的關(guān)鍵。細(xì)胞器數(shù)據(jù)的統(tǒng)一框架為了充分利用大部分分散的細(xì)胞器信息和將它們同儲(chǔ)存這些細(xì)胞器的物種的信息(分類,形態(tài)等等)相整合,1995年,細(xì)胞器基因組數(shù)據(jù)庫(kù)項(xiàng)目(GOBASE)被發(fā)起。從1996年起,這個(gè)數(shù)據(jù)庫(kù)開始運(yùn)作和通過(guò)因特網(wǎng)進(jìn)行公開訪問(wèn),由于它具有經(jīng)過(guò)充分確認(rèn)的內(nèi)容,直觀的界面和強(qiáng)大的搜索能力,它已經(jīng)被線粒體研究領(lǐng)域的科學(xué)家們所經(jīng)常使用。GOBASE的第一版以前已經(jīng)在這本雜志(5)中描述過(guò),包括數(shù)據(jù)庫(kù)外觀,數(shù)據(jù)庫(kù)結(jié)構(gòu)和它的運(yùn)行的詳細(xì)描述。在這篇論文中,我們將關(guān)注GOBASE同其他數(shù)據(jù)庫(kù)的比較,然后討論有重要幫助作用的用于數(shù)據(jù)庫(kù)完善、數(shù)據(jù)確認(rèn)和更新的軟件工具。