【正文】
質(zhì)序列資料庫此中心包括National BiomediCal Research Foundation (NBRF) Protein Information Resource (PIR),日本Japan International Protein Information Datebase Martinscried Institute for Protein Sequence (MPS) 提供了我們各個資料庫轉(zhuǎn)換成uniport的資料。圖二:Inparanoid同源蛋白資料範(fàn)例例如紅框中編號1的群組,、AT1G8007 。(圖三)圖三:例如紅框中Wormbase裡 WBGene00012015對應(yīng)uniport擷取碼為Q17761。(3)建立擷取碼轉(zhuǎn)換表 有了以上各個資料庫對應(yīng)的擷取碼,再利用程式建立擷取碼轉(zhuǎn)換表,例如我們要把Wormbase中的WBGene00012015轉(zhuǎn)換成Ensembl的擷取碼,搜尋出WBGene00012015對應(yīng)uniport的擷取碼為Q17761(圖三)。 在物種的同源蛋白之中有些蛋白會有一對一(圖七)同源性。(7)測試程式 最後程式執(zhí)行畫面如圖八。 在不斷的搜尋中,最後在PIR網(wǎng)站與Inparanoid中找到相關(guān)的資料,才得以開始設(shè)計程式,然後進行對照表建立。 其中一些對照表因為資料太龐大,會發(fā)生程式不能執(zhí)行的問題,在老師的幫助下,才發(fā)現(xiàn)原來是在設(shè)計結(jié)構(gòu)的陣列大小時,我們是取對照表中最大筆的資料為Refseq,而由於Refseq的資料數(shù)目過於龐大,在程式執(zhí)行時,電腦的記憶體不夠大,導(dǎo)致程式不能執(zhí)行,最後我們只好放棄Refseq這個資料庫,解決方法可能是必須要提升電腦的記憶體空間?;ㄙM時間:在轉(zhuǎn)換擷取碼轉(zhuǎn)換時,每次執(zhí)行時間約在一分鐘內(nèi)完成。未來蒐集每個使用者實際使用蛋白質(zhì)擷取碼轉(zhuǎn)換與同源蛋白質(zhì)程式介面時的意見,我們會參考使用者的需求與差異性,進行程式的修改與加強,讓使用者查詢時更符合自己的需求、更方便。