【正文】
由三層相同的神經(jīng)元構(gòu)成的層狀網(wǎng)絡(luò),使用反饋式學(xué)習(xí)規(guī)則,在學(xué)習(xí)過(guò)程中根據(jù)輸入的一級(jí)結(jié)構(gòu)和二級(jí)結(jié)構(gòu)的關(guān)系的信息不斷調(diào)整各單元之間的權(quán)重,最終目標(biāo)是找到一種好的輸入與輸出的映象,并對(duì)未知二級(jí)結(jié)構(gòu)的蛋白進(jìn)行預(yù)測(cè) ?神經(jīng)網(wǎng)絡(luò)方法的優(yōu)點(diǎn)是應(yīng)用方便,獲得結(jié)果較快較好,主要缺點(diǎn)是沒(méi)有反映蛋白的物理和化學(xué)特性,而且利用大量的可調(diào)參數(shù),使結(jié)果不易理解。許多預(yù)測(cè)程序如 PHD、 PSIPRED等均結(jié)合利用了神經(jīng)網(wǎng)絡(luò)的計(jì)算方法。 綜合方法 ?綜合方法不僅包括各種預(yù)測(cè)方法的綜合,而且也包括結(jié)構(gòu)實(shí)驗(yàn)結(jié)果、序列對(duì)比結(jié)果、蛋白質(zhì)結(jié)構(gòu)分類(lèi)預(yù)測(cè)結(jié)果等信息的綜合。 ?多個(gè)程序同時(shí)預(yù)測(cè),綜合評(píng)判 ?一致結(jié)果 ?序列比對(duì)與二級(jí)結(jié)構(gòu)預(yù)測(cè) ?雙重預(yù)測(cè) 首先預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)類(lèi)型 然后再預(yù)測(cè)二級(jí)結(jié)構(gòu) 利用進(jìn)化信息預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu) ?蛋白質(zhì)序列家族中氨基酸的替換模式是高度特異的,如何利用這樣的進(jìn)化信息是二級(jí)結(jié)構(gòu)預(yù)測(cè)的關(guān)鍵。 ?蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)軟件系統(tǒng) PHD ?第一步工作是形成同源序列的多重對(duì)比排列 ?第二步工作是將得到的多重比對(duì)的統(tǒng)計(jì)結(jié)果送到一個(gè)神經(jīng)網(wǎng)絡(luò)中計(jì)算。 Levels of protein structure motif 與 domain ?Motif ,模體,基序 Motif in biochemistry ?Motif , 模體,基序 , 超二級(jí)結(jié)構(gòu) , 二級(jí)結(jié)構(gòu)有規(guī)律的組合。 ?Structural motif, 結(jié)構(gòu) 模體 ,氨基酸的空間排列形成的蛋白質(zhì)空間結(jié)構(gòu)類(lèi)型 ,核苷酸的空間排列形成的核酸空間結(jié)構(gòu)類(lèi)型 ?Sequence motif, DNA中一個(gè)核苷酸序列模式或蛋白質(zhì)中一個(gè)序列模式 ?晶體結(jié)構(gòu)的一個(gè)重復(fù)模式元 件 Sequence motif ?遺傳學(xué):序列模體是一個(gè)核苷酸序列或氨基酸序列模式 ,普遍 分布 ,被推測(cè) 有 生物學(xué)意義。 ?元素的一個(gè)重復(fù)模式在水晶結(jié)構(gòu) ?對(duì)蛋白質(zhì) ,序列模體區(qū)別于結(jié)構(gòu)模體 ,一個(gè)結(jié)構(gòu)模體所形成的三維排列 ,氨基酸不接近。 Sequence motif ? When a sequence motif appears in the exon of a gene, it may encode the structural motif of a protein ? Outside of gene exons, there exist regulatory sequence motifs and motifs within the junk, such as satellite DNA. Some of these are believed to affect the shape of nucleic acids , but this is only sometimes the case. ? Short coding motifs, which appear to lack secondary structure, include those that label proteins for delivery to particular parts of a cell, or mark them for phosphorylation. ? Within a sequence or database of sequences, researchers search and find motifs using puterbased techniques of sequence analysis, such as BLAST. Structural motif types in proteins Examples of motif types in proteins ?Beta ribbon ?Omega loop ?Helixloophelix ?Zinc finger ?Helixturnhelix ?Beta hairpin Motif bioinformatics ?Motifs and consensus sequences ?De novo putational discovery of motifs ?Discovery through evolutionary conservation ?Pattern description notations ?PROSITE pattern notation ?Matrices ?Another scheme Motiffinding methods ? MINIMOTIF MINER The public interface to the minimotif miner database ? PROSITE Database of protein families and domains ? Database and Analysis Suite for Quadruplex forming motifs in Nucleotide Sequences ? The MEME/MAST System for Motif Discovery and Search ? MEME Documentation ? TRANSFAC: A public database for transcription factor motifs ? eMotif homepage (from Stanford University) ? Bioprospector homepage (from Stanford University) ? TEIRESIS homepage ? Improbizer homepage ? BLOCKmaker homepage ? NCBI Home Page NIH39。s National Library of Medicine NCBI (National Center for Biotechnology Information) ? Transcriptional Regulation Wiki ? Wikiomic Sequence motifs page ? PLACE Protein binding motif ?Protein binding motif is a short protein sequence motif that interacts with other proteins. ?A typical example of such motif are prolinerich sequences that are responsible for binding of SH3 domains. ?Protein binding sequences may be locally unfolded, as in many endocytic proteins. For example, some EH domains contain at least 15 repeats of AspProPhe tripeptide, which are responsible for interaction with multiple copies of the AP2 alpha appendage protein. Protein domain ?結(jié)構(gòu)域( domain)又稱(chēng)為轄區(qū)。指蛋白質(zhì)亞基中明顯分開(kāi)的緊密球狀區(qū)域 。 ?蛋白質(zhì)三級(jí)結(jié)構(gòu)內(nèi)的獨(dú)立折疊單元 ?是介于二級(jí)和三級(jí)結(jié)構(gòu)之間的一種結(jié)構(gòu)層次 ,對(duì)于較小的蛋白質(zhì)分子或亞基,“結(jié)構(gòu)域”和“三級(jí)結(jié)構(gòu)”往往是一個(gè)概念,單結(jié)構(gòu)域分子 ?既是結(jié)構(gòu)單位,又是功能單位 功能域 ?結(jié)構(gòu)域通常都是幾個(gè)超二級(jí)結(jié)構(gòu)單元的組合。 ?結(jié)構(gòu)域在空間上具有臨近相關(guān)性 。 即在一級(jí)結(jié)構(gòu)上相互臨近的氨基酸殘基,在結(jié)構(gòu)域的三維空間結(jié)構(gòu)上也相互臨近 。 結(jié)構(gòu)域 ?常見(jiàn)結(jié)構(gòu)域的氨基酸殘基數(shù)在 40~ 400個(gè)之間,最小的結(jié)構(gòu)域只有 40~ 50個(gè)氨基酸殘基,大的結(jié)構(gòu)域可超過(guò) 400個(gè)氨基酸殘基。 ?鏈接兩個(gè)結(jié)構(gòu)域的絕大多數(shù)都是單股肽鏈,極個(gè)別的情況下會(huì)有少雙股肽鏈聯(lián)系。在 X射線(xiàn)衍射繪制的電子密度存在一些裂隙,這些裂隙就是結(jié)構(gòu)域之間的鏈接部分 ?有時(shí)一個(gè)結(jié)構(gòu)域就可以獨(dú)立完成一項(xiàng)生理功能,但是一個(gè)結(jié)構(gòu)不完整的結(jié)構(gòu)域是不可能產(chǎn)生生理功能的。因此結(jié)構(gòu)域是蛋白質(zhì)生理功能的結(jié)構(gòu)基礎(chǔ),但必須指出的是,雖然結(jié)構(gòu)域與蛋白質(zhì)的功能關(guān)系密切,但是結(jié)構(gòu)域和功能域的概念并不相同。 模體和結(jié)構(gòu)域的區(qū)別 ?在蛋白質(zhì)中,有時(shí) 基序 , 結(jié)構(gòu)域交替使用,但結(jié)構(gòu) 域不是 基序 , 結(jié)構(gòu)域包含 基序 ?結(jié)構(gòu)模體即超二級(jí)結(jié)構(gòu),是二級(jí)結(jié)構(gòu)有規(guī)律的組合。例如螺旋 環(huán) 螺旋、鋅指結(jié)構(gòu),即模體即是結(jié)構(gòu)的單位,又是功能單位,他們可直接作為結(jié)構(gòu)域和三級(jí)結(jié)構(gòu)的建筑塊。 ?結(jié)構(gòu)域是指在較大的蛋白質(zhì)分子中形成的某些在空間上可以辨別的結(jié)構(gòu),往往是球狀壓縮區(qū)或纖維狀壓縮區(qū)。它們既是結(jié)構(gòu)單位,又是功能單位。例如免疫球蛋白的功能區(qū)就是結(jié)構(gòu)域。 ?顯然模體與結(jié)構(gòu)域是不同的概念。 丙酮酸激酶,三個(gè)結(jié)構(gòu)域蛋白 ?an allβ regulatory domain, ?an α/βsubstrate bindingdomain ?an α/βnucleotide binding domain ? connected by several polypeptide linkers ?Each domain in this protein occurs in diverse sets of protein families. 結(jié)構(gòu)域數(shù)據(jù)庫(kù) Structural domain databases ?3Dee ?CATH ?DALI ?SCOP ?Pawson Lab Protein interaction domains ?Nash Lab Protein interaction domains in Signal Transduction ?Definition and assignment of structural domains in proteins 序列域數(shù)據(jù)庫(kù) Sequence domain databases ?InterPro ?Pfam ?PROSITE ?ProDom ?SMART ?NCBI Conserved Domain Database ?SUPERFAMILY Library of HMMs representing superfamilies and database of (superfamily and family) annotations for all pletely sequenced anisms