freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

blast數(shù)據(jù)庫(kù)檢索ppt課件-wenkub

2023-05-27 04:48:10 本頁(yè)面
 

【正文】 90 ? BLAST中一般用一個(gè) E值( Expectation value)來(lái)表示比對(duì)的顯著性。 22 /90 BLAST算法小結(jié) ? word pairs—— segment pair—— highscoring pair,HSP—— maximal segment pair, MSP—— 動(dòng)態(tài)規(guī)劃法。由于在序列片段對(duì)查找過(guò)程中不考慮空位字符,即不考慮插入和刪除操作,所以運(yùn)行速度非???。 ? BLAST算法跟之前講的動(dòng)態(tài)規(guī)劃法算法有所不同,處理速度更快。例如,一個(gè)對(duì)于全基因組 DNA的BLAST搜索可能會(huì)發(fā)現(xiàn)一個(gè) DNA所編碼的蛋白質(zhì)是以前所沒(méi)有報(bào)道過(guò)的。例如,很多病毒都具有極強(qiáng)的突變能力。如當(dāng)一個(gè)新的細(xì)菌基因組被測(cè)序后,幾千種蛋白質(zhì)被確定,其中有多少蛋白質(zhì)是同源的?從這里面預(yù)測(cè)出的基因中有多少是在 GenBank中找不到顯著性同源物的? ? 確定哪些蛋白質(zhì)和基因在特定的物種中出現(xiàn)。 ? 點(diǎn)陣法為什么要進(jìn)行去噪處理,用什么方法? 3 /90 矩陣集合 PAMN 如, PAM60矩陣用于比較相距 60個(gè) PAM單位的序列。 ? 可以進(jìn)行全局(長(zhǎng)度接近)和局部的比對(duì)。 1 /90 回顧 —— 雙序列比對(duì) ? 雙序列比對(duì)有三種情況:匹配(得分為正),不匹配(蛋白質(zhì)有保守性問(wèn)題),空位(罰分)。 ? NCBI包含生物大分子序列的各種最基本數(shù)據(jù)庫(kù)。 ? Entrez是 NCBI的檢索系統(tǒng),提供 關(guān)鍵詞檢索功能 ,可檢索該網(wǎng)站所有的子數(shù)據(jù)庫(kù)??瘴涣P分一般采用仿射罰分。 ? 相似性是查找確認(rèn)同源序列的最基本步驟。計(jì)算方法是 PAM1自乘 60次。植物中是否也存在象 RBP這樣的脂質(zhì)運(yùn)載蛋白?魚(yú)類(lèi)中是否有反轉(zhuǎn)錄酶基因(如 HIV1 pol基因)? ? 確定一個(gè) DNA或者蛋白質(zhì)序列身份。 HIV1 pol有哪些已知的變異體? ? 研究可能存在多種剪接方式的表達(dá)序列標(biāo)簽。 12 /90 數(shù)據(jù)庫(kù)搜索相似序列的算法 ? 數(shù)據(jù)庫(kù)搜索相似序列的基礎(chǔ)是序列的相似性比對(duì),就是將查詢(xún)序列與數(shù)據(jù)庫(kù)里面的序列逐一的兩兩比對(duì)分析。 13 /90 BLAST 14 /90 二、 BLAST算法 “The central idea of the BLAST algorithm is to confine attention to segment pairs that contain a word pair of length w with a score of at least T.” Altschul et al. (1990) 15 /90 這個(gè)算法可以描述為 3個(gè)步驟 ? 第一步 : 編譯一組閾值高于 T的 word pairs (w=3)。 KENFDKARFSGTWYAMAKKDPEG 50 RBP (query) MKGLDIQKVAGTWYSLAMAASD. 44 lactoglobulin (hit) 19 /90 “ 字”對(duì)命中后,向兩端延伸, 一直到得分(按照某個(gè)打分矩陣)下降到某個(gè)閾值,由此就得到一定長(zhǎng)度的保持最好得分的序列串,稱(chēng)高記分片段對(duì) ( highscoring pair,HSP)。 23 /90 隨機(jī)事件與統(tǒng)計(jì)顯著意義的事件 ? HSP是否有生物學(xué)意義呢?序列相似性不一定就是有生物學(xué)意義的,隨機(jī)也會(huì)產(chǎn)生一定的相似性序列。 ? E值 【 P值 】 表示如果數(shù)據(jù)庫(kù)是隨機(jī)序列,那么得到同樣(得分)或者更好比對(duì)結(jié)果的序列的頻率【 概率 】 。 38 /90 2) Bare Sequence 也可以是 GBFF格式中的序列數(shù)據(jù),即可以帶數(shù)字和空格,但序列中間也不允許空行。 ? 尋找和被比對(duì)序列高度相似的序列, 其他的程序discontiguousmegablast和 blastn也能實(shí)現(xiàn)這個(gè)目標(biāo),但是 MEGABLAST是專(zhuān)門(mén)針對(duì)高度相似序列而設(shè)計(jì)的,是最有效的查找和原序列相同序列的工具。 56 /90 輸出結(jié)果 57 /90 58 /90 taxonomy report summarizes species with matches 59 /90 結(jié)果 60 /90 圖示結(jié)果 61 /90 列表結(jié)果 62 /90 比對(duì)結(jié)果 得分有兩個(gè): 274是原始分,也就是根據(jù)打分矩陣計(jì)算得到的分?jǐn)?shù), 248是比特分,是歸一化的分?jǐn)?shù),這樣可以忽略打分矩陣和的影響。 66 /90 67 /90 序列間距離 68 /90 多序列比對(duì) 69 /90 分
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1