【正文】
nformation from sequence databases and a simultaneous search of MEDLINE with all synonyms of a given gene. The web interface allows the user to 39 get information for a single or multiple miRNAs, either selected or uploaded through a text file. Argonaute currently has information on 839 miRNAs from human, mouse and rat. INTRODUCTION MicroRNAs (miRNAs) are small (21–23 nt) noncoding RNAs that are important regulators of gene expression. They act by base pairing with partially plementary sites in the mRNA of their targets, and either inhibit translation into protein or decrease the stability of the transcript . The number of currently known miRNAs in mammalian systems has risen dramatically in the last year, and predictions about their total number in humans amount up to 1000. miRNAs are transcribed as long primary transcripts (primiRNAs), some of them being polycistronic, which are processed in the cell nucleus by an enzyme called Drosha, yielding precursor miRNAs (premiRNAs) that exhibit a characteristic stem–loop sequence. These are exported into the cytosol where mature miRNAs are generated by the RNase IIItype enzyme Dicer, producing a small doublestranded RNA from which one strand (called miRNA*) is quickly degraded, releasing the small singlestranded miRNA. Translational inhibition, which seems to be the major mode of action in animals, is performed by a riboprotein plex called RNAinduced silencing plex (RISC) consisting of the miRNA and proteins of the argonaute family miRNAs are involved in several cellular processes, including cellular differentiation, anism development and apo。 在此 ,感謝和我一起生活、學(xué)習(xí)了四年的同學(xué)們,他們也給予了我許多的幫助和指點(diǎn)。 35 致 謝 光陰似箭,美好的時光總是過的飛快,轉(zhuǎn) 眼間最美好的大學(xué)生活即將結(jié)束。經(jīng)過測試,本系統(tǒng)的功能還是比較完備的 ,有些地方雖然比較簡單,但是實(shí)現(xiàn)操作起來還是沒有問題的,基本能夠?qū)崿F(xiàn) 基因信息管理 系統(tǒng)的必備的功能。 此次畢業(yè)設(shè)計(jì) 以 MySQL 作為后臺數(shù)據(jù)庫,以 Apache 為服務(wù)器,用 PHP 語言構(gòu)建的基因信息的數(shù)據(jù)庫系統(tǒng)。下面以查詢 p53 基因信息為例: 33 圖 序列查詢的結(jié)果顯示 二 .系統(tǒng) 功能測試結(jié)果 系統(tǒng)經(jīng)過測試實(shí)現(xiàn)了預(yù)期功能功能,可進(jìn)行正常的基因信息錄入,基因序列轉(zhuǎn)化和基因信息查詢,同時系統(tǒng)在客戶端運(yùn)行良好。 圖 DNA 信息成功錄入數(shù)據(jù)庫 化 功能測試 基因數(shù)據(jù)庫管理 系統(tǒng)提供 序列轉(zhuǎn)化為 FASTA 格式,根據(jù)要求可以將輸入的序列 按如下格式輸出:序列 的第一行是由大于號 打頭 ,然后顯示該序列的長度, 用于序列標(biāo)記。 基因信息錄入測試主要是通過輸入一定的信息看系統(tǒng)是否可以成功的存儲在后臺的數(shù)據(jù)庫中。 } mysql_free_result($result)。 echo(數(shù)據(jù)來源 :$row[3]\n)。 $result=mysql_db_query($mysql_database,$sql3,$conn)。 echo文獻(xiàn) :$row[4]\n。 while($row=mysql_fetch_row($result)) { //print_r($row)。 echo堿基序列 $row[5]\n。 echo(序列名字 :$row[1]\n)。 。$SOURCE39。 //mysql 數(shù)據(jù)庫名 //插入數(shù)據(jù) $sql1=SELECT * FROM dna WHERE NAME=39。 27 圖 基因信息 功能 功能實(shí)現(xiàn)的核心代碼: ? //鏈接數(shù)據(jù)庫變量 $mysql_server_name =localhost。width:400px。height:80px。39。?=$xulie?/textarea /label /p /p p class=clear button type=submit提交信息 /button /p br 26 /form ? $a= strtoupper($xulie)。border:1px solid dedede。 按要求, 該系統(tǒng)每 60 個堿基進(jìn)行自動換行。從第二行開始為序列本身,只允許使用既定的核苷酸或氨基酸編碼符號。 ? ( 4) 序列格式轉(zhuǎn)化功能 在生物信息學(xué)中, FASTA 格式(又稱為 Pearson 格式),是一種基于文本用于表示核苷酸序列或氨基 酸序列的格式 [10]。 $conn=mysql_connect($mysql_server_name,$mysql_username,$mysql_password)。$ ORIGIN 39。$SOURCE39。$NAME 39。DEFINITION39。REFERENCE 39。KEYWORDS 39。P_ID39。 //mysql 數(shù)據(jù)庫密碼 $mysql_database=genebase。這是該系統(tǒng)的最基本的功能。 $result=mysql_query($sql)。$DEFINITION39。$REFERENCE 39。$KEYWORDS 39。NULL39。SEQUNCE39。SOURCE39。NAME 39。rna39。 //mysql 數(shù)據(jù)庫服務(wù)器 $mysql_username =root。 ? ( 2) RNA 信息錄入功能: 基因數(shù)據(jù)庫管理系統(tǒng)提供 RNA 信息錄入功能,用戶可以通過 WEB 界面將基因信息保存在后臺的 MySQL 數(shù)據(jù)庫中。 $conn=mysql_connect($mysql_server_name,$mysql_username,$mysql_password)。$SEQUNCE39。$SOURCE39。$NAME 39。DEFINITION39。REFERENCE 39。KEYWORDS 39。GENE_ID39。 //mysql 數(shù)據(jù)庫密碼 $mysql_database=genebase。這是該系統(tǒng)的最基本的功能。界面的中間是系統(tǒng)的功能界面,提供 DNA 的信息錄入、 RNA 的信息錄入、蛋白質(zhì)的 信息錄入,序列格式轉(zhuǎn)化功能和查詢功能。蛋白質(zhì)序列 39。關(guān)鍵字 39。注釋 39。蛋白序列 編 號 39。, `KEYWORDS` VARCHAR( 50 ) NOT NULL COMMENT 39。, `REFERENCE` VARCHAR( 50 ) NOT NULL COMMENT 39。, `DEFINITION` VARCHAR( 100 ) NOT NULL COMMENT 39。 ( 2) .MySQL 表的建立如圖所示: 16 圖 DNA 信息表 信息表的創(chuàng)建: ( 1) 相關(guān)代碼: CREATE TABLE `rna` ( `GENE_ID` TINYINT( 100 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY COMMENT 39。DNA 序列 39。數(shù)據(jù)來源 39。序列名字 39。 二 .創(chuàng)建數(shù)據(jù)表 結(jié)合實(shí)際情況及對用戶需求的分析, GENEBASE 數(shù)據(jù)庫主要包含如下數(shù)據(jù)表,分別為 dna( DNA 信息表) 、 rna( RNA 信息表)、 protein( 蛋白質(zhì) 表) [7]。 RNA 序列信息 ER 圖 如下所示: 圖 DNA 序列信息 ER 圖 3. 蛋 白 質(zhì) 的 主 要 屬 性 有 P_ID ( 序列編號 ),NAME( 序 列 名字 ),DEFINITION(注釋 ),SOURCE(數(shù)據(jù)來源 ),REFERENCE(文獻(xiàn) ), ORIGIN (蛋白質(zhì) 序列 ),KEYWORDS(關(guān)鍵字 )。系統(tǒng)流程圖如下 所示 : 圖 系統(tǒng) 流程 圖 3. 數(shù)據(jù)庫概念結(jié)構(gòu)設(shè)計(jì) 根據(jù)生物基因信息數(shù)據(jù)的分類和 屬性, 建立數(shù)據(jù)庫時, 主要 涉及到 的是DNA 信息數(shù)據(jù)庫, RNA 信息數(shù)據(jù)庫,蛋白 質(zhì) 信息數(shù)據(jù)庫。 最后用戶 使用完畢可以注銷安全退出。 根據(jù)生物信息學(xué)研究的要求, 系統(tǒng)主要 提供 DNA,RNA 和蛋白質(zhì)信息的錄入,查詢等功能,并可以提供序列轉(zhuǎn)換為 FASTA 格式的功能 ; 以簡單有效地方式 解決 研究中 產(chǎn)生 的大量 有待分析的基因組序列的有效存儲和管理問題 。 (3) 操作 可行性 隨著 Inter 與生物信息學(xué)的緊密結(jié)合 的發(fā)展, 建立相應(yīng)的基因系統(tǒng)管理系統(tǒng)是非常有必要的,對于生物信息學(xué)的研究和學(xué)習(xí)都有很大的幫助。 本文所使用的 PHP+MYSQL+Apache 的搭配,可以方便快捷的建設(shè)網(wǎng)站 。 ? .數(shù)據(jù)訪問層 :專門處理業(yè)務(wù)邏輯層與數(shù)據(jù)存儲層之間的數(shù)據(jù)交互操作,提供上層訪問所需數(shù)據(jù)的方法,包括數(shù)據(jù)添加、修改、刪除等操作。因此,許多單位都備有數(shù)據(jù)庫存儲服務(wù)器,以防萬一。 現(xiàn)在的趨勢是凡使用 B/S 架構(gòu)的應(yīng)用管理軟件,只需安裝在 Linux 服務(wù)器上即可,而且安全性高。所以客戶機(jī)越來越 ―瘦 ‖,而服務(wù)器越來越 ―胖 ‖是將來信息化發(fā)展的主流方向。 B/S 結(jié)構(gòu)的使用越來越多,特別是由需求推動了 AJAX 技術(shù)的發(fā)展,它的程序也能在客戶端電腦上進(jìn)行部分處理,從而大大的減輕了服務(wù)器的負(fù)擔(dān);并增加了交 互性,能進(jìn)行局部實(shí)時刷新。瀏覽器通過 Web Server 同數(shù)據(jù)庫進(jìn)行數(shù)據(jù)交互。開發(fā)的操作系統(tǒng) 使用目前應(yīng)用最廣泛的 windows xp sp3。對于一般的個人使用者和中小型企業(yè)來說, MySQL 提供的功能已經(jīng)綽綽有余,而且由于 MySQL 是開放源碼軟件,因此可以大大降低總體擁有成本。目前 MySQL 被廣泛地應(yīng)用在Inter 上的中小型網(wǎng)站中。它提供了簡易、快速的 PHP 運(yùn)行環(huán)境的搭建機(jī)制 。 Apache 源于 NCSAd 服務(wù)器,經(jīng)過多次修改,成為世界上最流行的 Web服務(wù)器軟件之一。它可以比 CGI 或者 Perl 更快速的執(zhí)行動態(tài)網(wǎng)頁。解決方法就是將經(jīng)常用來編寫 CGI 程序的語言的解釋器編譯進(jìn)你的 web 服務(wù)器 (比如mod_perl,JSP)?;?web 的編程工作非常需要面向?qū)ο缶幊棠芰Α?PHPLIB就是最常用的可以提供一般事務(wù)需要的一系列基庫。 本系統(tǒng)的開發(fā)語言使用了 . 相對于其他腳本語言 PHP 有以下優(yōu)點(diǎn): ( 1)數(shù)據(jù)庫連接 PHP 可以編譯成具有與許多數(shù)據(jù)庫相連接的函數(shù) [2]。 PHP/FI 加入了對 MYSQL 的支持,從此建立了 PHP 在動態(tài)網(wǎng)頁開發(fā)上的地位。 PHP 是一種 HTML 內(nèi)嵌式的語言, PHP 與微軟的 ASP頗有幾分相似,都是一種在服務(wù)器端執(zhí)行的嵌入 HTML 文檔的腳本語言,語言的風(fēng)格有類似于 C 語言,現(xiàn)在被很多的網(wǎng)站編程人員廣泛的運(yùn)用。解決了 繁雜 基因數(shù)據(jù)庫共享使 用難的問題 ,實(shí)現(xiàn)了通過高效、簡單、快速的 PHP 操作平臺檢索基因數(shù)據(jù)庫的功能 ,為發(fā)揮這些基因數(shù)據(jù)庫的潛在價(jià) 2 值創(chuàng)造了很好的檢索環(huán)