【正文】
ase of exon model per Million mapped reads, is defined in thisway [Mortazavi etal., 2008]:每1百萬個map上的reads中map到外顯子的每1K個堿基上的reads個數(shù)。常用工具包括velvet,transABYSS,Trinity等。什么是表達譜基因表達譜(geneexpression profile):指通過構建處于某一特定狀態(tài)下的細胞或組織的非偏性cDNA文庫,大規(guī)模cDNA測序,收集cDNA序列片段、定性、定量分析其mRNA群體組成,從而描繪該特定細胞或組織在特定狀態(tài)下的基因表達種類和豐度信息,這樣編制成的數(shù)據(jù)表就稱為基因表達譜什么是功能基因組學功能基因組學(Functuionalgenomics)又往往被稱為后基因組學(Postgenomics),它利用結構基因組所提供的信息和產(chǎn)物,發(fā)展和應用新的實驗手段,通過在基因組或系統(tǒng)水平上全面分析基因的功能,使得生物學研究從對單一基因或蛋白質得研究轉向多個基因或蛋白質同時進行系統(tǒng)的研究。采用的手段包括經(jīng)典的減法雜交,差示篩選,cDNA代表差異分析以及mRNA差異顯示等,但這些技術不能對基因進行全面系統(tǒng)的分析,新的技術應運而生,包括基因表達的系統(tǒng)分析(serial analysis of gene expression,SAGE),cDNA微陣列(cDNA microarray),DNA 芯片(DNA chip)和序列標志片段顯示(sequence tagged fragmentsdisplay。表觀遺傳的現(xiàn)象很多,已知的有DNA甲基化(DNAmethylation),基因組印記(genomicimpriting),母體效應(maternaleffects),基因沉默(genesilencing),核仁顯性,休眠轉座子激活和RNA編輯(RNA editing)等。什么是基因組印記基因組印記(又稱遺傳印記)是指基因根據(jù)親代的不同而有不同的表達?;蚪M印記病主要表現(xiàn)為過度生長、生長遲緩、智力障礙、行為異常。該學科提供基因組信息以及相關數(shù)據(jù)系統(tǒng)利用,試圖解決生物,醫(yī)學,和工業(yè)領域的重大問題。正常情況下,人類基因組“垃圾”序列的CpG二核苷酸相對稀少,并且總是處于甲基化狀態(tài),與之相反,人類基因組中大小為100—1000 bp左右且富含CpG二核苷酸的CpG島則總是處于未甲基化狀態(tài),并且與56%的人類基因組編碼基因相關?;蚪M注釋的研究內容包括基因識別和基因功能注釋兩個方面。EXPECTE期望值(Evalue)這個數(shù)值表示你僅僅因為隨機性造成獲得這一alignment結果的可能次數(shù)。這一設置則表示聯(lián)配結果中將有10個匹配序列是由隨機產(chǎn)生,如果聯(lián)配的統(tǒng)計顯著性值(E值)小于該值(10),則該alignment將被檢出,換句話說,比較低的閥值將使搜索的匹配要求更嚴格,結果報告中隨機產(chǎn)生的匹配序列減少。其中,串聯(lián)重復序列是由相關的重復單位首尾相連、成串排列而成的。微衛(wèi)星DNA又叫簡單重復序列(Simple Sequence Repeat,SSR),指的是基因組中由16個核苷酸組成的基本單位重復多次構成的一段DNA,廣泛分布于基因組的不同位置,長度一般在200 bp以下。根據(jù)SSR核心序列排列方式的不同,可分為3種類型:完全型(perfect)。如:ATATATATGGATATATATATCGATATATATATATATATGGATATATATAT復合型(pound)。Conserved structural entities with distinctive secondary structure content and an hydrophobic core. In small disulphiderich and Zn2+binding or Ca2+ binding domains the hydrophobic core may be provided by cystines and metal ions, respectively. Homologous domains with mon functions usually show sequence similarities.結構域(structure domain)是在蛋白質三級結構中介于二級和三級結構之間的可以明顯區(qū)分但又相對獨立的折疊單元,每個結構域自身形成緊實的三維結構,可以獨立存在或折疊,但結構域與結構域之間關系較為松散。Alignment scores are reported by HMMer and BLAST as bits scores. The likelihood that the query sequence is a bona fide homologue of the database sequence is pared to the likelihood that the sequence was instead generated by a “random” model. Taking the logarithm (to base 2) of this likelihood ratio gives the bits score.This represents the number of sequences with a score greaterthan, or equal to, X, expected absolutely by chance. The Evalue connects the score (“X”) of an alignment between a usersupplied sequence and a database sequence, generated by any algorithm, with how many alignments with similar or greater scores that would be expected from a search of a random sequence database of equivalent size. Since version Evalues are calculated using Hidden Markov Models, leading to more accurate estimates than before.motif作為結構域中的亞單位,表現(xiàn)結構域的各種生物學功能。序列模式方法直接搜索關鍵的幾個保守殘基,忽略其他位置的氨基酸多態(tài)性。[1][3][5]filebased database searching are discussed in Bork amp。序列特征譜搜索是基于蛋白質序列多重比對結果中的保守序列區(qū)域進行搜索,由于考慮了不同保守度的氨基酸在相應位置的權重,可以更為敏感的檢測到進化距離較遠的蛋白質相關性,得到比序列模式方法更為靈敏的結果,但可靠的序列特征譜數(shù)目往往有限,因此該方法在進行新基因功能預測時受到了較大的障礙。私信RSS關什么是奮斗?奮斗就是每天很難,可一年一年卻越