freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

第四章序列分析ppt課件(參考版)

2025-01-20 07:19本頁面
  

【正文】 研究表明:使用 initn與使用 opt相比,前者損失的敏感性并不太大,但運算速度卻快得多 (Pearson WR,1991)。見圖 C 第 3步: 以 initl片段或 (initn的片段 )為中心,向前后延伸一定的長度。 FASTA在這一步才考慮插入和缺失的情況,最終找出能夠得到的最高分值的初始區(qū)域或連接起來的數(shù)個初始區(qū)域。 第 2步: 在這一步中, FASTA選出分值高于用戶確定的界限且相互之間不重疊的初始區(qū)域,并嘗試將這些初始區(qū)域連接起來。在重新計算分值后,在每一條這樣的片段中找出分值最高的子片段,作為“初始區(qū)域” (initial region)進入下一步。簡單地說,替換矩陣就是對應于 20 20種氨基酸替換 (比如 R替換成 P)的計分規(guī)則所構成的20 20的矩陣。完成了所有一致片段的計分后,選出 10條分值最高的片段進入下一輪計算,如圖 B FASTA將這 10對片段重新計分。 . 本例是兩條非常短的氨基酸序列,在實際比較長的蛋白質序列或 DNA序列時,對角線圖如圖 A所示。 (圖 6)。在上例中有兩對 (x1, x2),即( 5,1)和 (5,4)]。 以兩條氨基酸序列的比較為例介紹算法的基本思路,算法可以分為 4步: 第一步: FASTA首先找出進行比較的兩條序列所有長度為 Ktuple 的連續(xù)的一致序列片段。最后一列是期望值即 E值 , 用來判斷比對結果的置信度 。 括號中標明匹配部分的殘基數(shù) 。 首先列出搜索得到的目標序列簡單說明 , 其數(shù)目可由用戶定義 。 由 FastA搜索產生的典型輸出結果的第一行列出程序名稱和版本號 , 以及該程序發(fā)表的雜志 。這和 BLAST程序中的成對片段類似。也就是說,通過不匹配的殘基將這些匹配殘基片段連接起來,以便得到較長的相似性片段。通過比較兩個序列中的短片段及其相對位置,可以構成一個動態(tài)規(guī)劃矩陣的對角線方向上的一些匹配片段。FastA的基本思路是識別與代查序列相匹配的很短的序列片段,稱為 ktuple。 ? 每個匹配序列與查詢序列的比對情況。 ? 每一條匹配序列的描述。 將查詢序列分為多個短片段及相似片段; 篩選數(shù)據(jù)庫以發(fā)現(xiàn)具備以上片段的序列; 將匹配序列進行延伸,插入和延伸 gap,根據(jù)突變矩陣( BLOSUM62)計分排序; 返回分值最高的匹配序列 NCBI BLAST結果的評價 ? 比對好壞的評價: Bit分值 考慮了比對中相同和相似基團、 gap、替代矩陣,并經過標化; Bit分值越高 ,比對越好 ? 比對統(tǒng)計學意義的評價: E值( Evalue) E值越低 ,則比對就更有可能具有顯著性 ? 其他:比對的長度也是一個關鍵因素 解讀 BLAST的結果 ? header。為解決一個問題而采取的方法和步驟,就稱為算法。因此,為了盡量去除大量的錯誤匹配,仔細分析搜索結果給出的同源關系變得非常重要。例如,如果在比對前不把膠原蛋白、同源多聚體等低復雜度的重復序列屏蔽掉,自動疊代搜索過程會因為這些重復序列的干擾而失?。?Holm, 1998)。 PSIBLAST的基本思路在于根據(jù)最初的搜索結果,依照預先定義的相似性閾值將序列分成不同的組,構建一個位點特異性的序列譜,并通過多次疊代不斷改進這一序列譜以提高搜索的靈敏度。除了需要大量的計算資源這一缺點外,對于搜索結果的分析解釋常常相當困難。此外, BLAST不僅可用于檢測序列對數(shù)據(jù)庫的搜索,還可用于兩個序列之間的比對。 位置特異性疊代 BLAST (PositionSpecific Iterated BLAST,簡稱 PSIBLAST)則是對蛋白質序列數(shù)據(jù)庫進行搜索的改進,其主要思想是通過多次疊代找出最佳結果。 由于免去了查找所有高分值片段對的步驟 , 新的算法比原算法快 3倍 。 基于上述思路 , BLAST算法經過改進允許空位插入( Altshul等 , 1997) 。 圖 5 BLAST程序運行結果實例 最初的 BLAST程序只能用于無空位的比對 。而 E值則表示隨機匹配的可能性,E值越大,隨機匹配的可能性也越大。輸出結果中包括程序名稱、版本號以及文獻引用出處,以及檢索序列的名稱、數(shù)據(jù)庫名稱;列出相似性值較高的序列條目,以及它們在數(shù)據(jù)庫中的編號和簡要說明。 圖 4 歐洲生物信息學研究所的 BLAST服務器的用戶界面 圖 5是 BLAST程序運行結果實例。一般情況下,可以先按照系統(tǒng)給定的缺省參數(shù)進行初步搜索,對結果進行分析后再適當調整參數(shù),如改變相似性矩陣、增加或減少空位罰分值、調節(jié)檢測序列滑動窗口大小等。北京大學生物信息中心也提供了 BLAST數(shù)據(jù)庫搜索服務。對核酸序列數(shù)據(jù)庫而言,不論用哪種方式,都需要很大的磁盤空間;而程序運行時,需要有較大的內存和較快的運算速度,因此必須使用高性能的服務器。 表 7 BLAST程序檢測序列和數(shù)據(jù)庫類型 程序名 檢測序列 數(shù)據(jù)庫類型 方 法 Blastp 蛋白質 蛋白質 用檢測序列蛋白質搜索蛋白質序列數(shù)據(jù)庫 Blastn 核酸 核酸 用檢測序列核酸搜索核酸序列數(shù)據(jù)庫 Blastx 核酸 蛋白質 將核酸序列按 6條鏈翻譯成蛋白質序列后搜索蛋白質序列數(shù)據(jù)庫 Tblastn 蛋白質 核酸 用檢測序列蛋白質搜索由核酸序列數(shù)據(jù)庫按 6條鏈翻譯成的蛋白質序列數(shù)據(jù)庫 Tblastx 核酸 核酸 將核酸序列按 6條鏈翻譯成蛋白質序列后搜索由核酸序列數(shù)據(jù)庫按 6條鏈翻譯成的蛋白質序列數(shù)據(jù)庫 BLAST程序是免費軟件,可以從美國國家生物技術信息中心 NCBI等文件下載服務器上獲得,安裝在本地計算機上,包括 UNIX系統(tǒng)和 WINDOWS系統(tǒng)的各種版本。 這就是無空位的 BLAST比對算法的基礎 , 也是 BLAST輸出結果的特征 。 所謂 序列片段對 是指兩個給定序列中的一對子序列 , 它們的長度相等 , 且可以形成無空位的完全匹配 。BLAST程序之所以使用廣泛 , 主要因為其運行速度比FastA等其它數(shù)據(jù)庫搜索程序快 , 而改進后的 BLAST程序允許空位的插入 。 BLAST是目前常用的數(shù)據(jù)庫搜索程序 , 它是 Basic Local Alignment Search Tool的縮寫 , 意為 “ 基本局部相似性比對搜索工具 ” [Altschul, 1990, 1997]。這一方法避免了隨機序列模型因使用真實序列 (real sequence)造成的隨意性,但同時產生了使用相關序列估計參數(shù)的難題 表 6 數(shù)據(jù)庫相似性搜索程序 BLAST和 FASTA程序清單 注: n:核酸序列或核酸序列庫; p:蛋白質序列或蛋白質序列庫 搜索實例 FastA和 BLAST程序是目前最常用的基于局部相似性的數(shù)據(jù)庫搜索程序 , 它們都基于查找完全匹配的短小序列片段 , 并將它們延伸得到較長的相似性匹配 。這一估計的結果看來非常準確。如果考慮到核酸數(shù)據(jù)庫的序列長度變化更大,則在 DNA序列相似性搜索時,BLAST的策略可能會是合理的選擇 BLAST僅通過部分而不是全部無關序列計算最適聯(lián)配值,這贏得了搜索速度。 E值的計算可簡單地把整個數(shù)據(jù)庫序列視為長度為 N的單條序列。FASTA程序近期版本便是采用這一策略 另一種思路是把長序列視為比短序列更重要,因為長序列往往包括更多的特異功能域 (domain)。比如 E值等于 5和 10,總比 P值等于 。 為了確定檢測序列和一個已知基因家族之間的進化關系,在通過數(shù)據(jù)庫搜索得到某些相似序列后,還需要判斷其序列相似性程度。 數(shù)據(jù)庫搜索的基礎是序列的相似性比對,即雙序列比對 (pairwise alignment)。 對于氨基酸序列來說 , 有可能找到已知三維結構的同源蛋白質而推測其可能的空間結構 。 數(shù)據(jù)庫的搜索簡介 數(shù)據(jù)庫查詢?yōu)樯飳W研究提供了一個重要工具 , 在實際工作中經常使用 。 BLOSUM與 BLOCKS對于同樣的序列比對產生的結果在局部有所不同,可能是一個認為不相似不可以替換而另一個認為相似可以替換。 通過設置不同的百分比,產生了不同矩陣。在構建矩陣過程中,通過設置最小相同殘基數(shù)百分比將序列片段整合在一起,以避免由于同一個殘基對被重復計數(shù)而引入
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1