freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)庫的搜索ppt課件-在線瀏覽

2025-06-29 04:27本頁面
  

【正文】 blastn (nucleotide BLAST): 將一個核酸的查詢序列與一個核酸序列數(shù)據(jù)庫相比較 。 這類搜索有專門與蛋白質(zhì)搜索相關(guān)的可選參數(shù) , 如對各種 PAM和 BLOSUM打分矩陣的選擇 ??梢杂么顺绦騺砼袛嘁粋€ DNA數(shù)據(jù)庫是否編碼所感興趣的查詢蛋白 。如若有一個 DNA序列 , 想知道它編碼什么蛋白質(zhì) , 用此程序進(jìn)行搜索 。 然后此程序就會將翻譯的 6個蛋白質(zhì)序列逐一與蛋白質(zhì)序列數(shù)據(jù)庫中的各個成員進(jìn)行比較 。 該程序不能使用 BLAST網(wǎng)頁上提供的主要的去冗余 (nr)數(shù)據(jù)庫 , 因這一操作很消耗計算機(jī)資源 。 nr = nonredundant (most general database) dbest = database of expressed sequence tags dbsts = database of sequence tag sites gss = genomic survey sequences htgs = high throughput genomic sequence NCBI Step 3: choose the database nr數(shù)據(jù)庫是合并了若干個主要的蛋白質(zhì)或 DNA數(shù)據(jù)庫得到的 。 nr數(shù)據(jù)庫是在要搜索現(xiàn)有的絕大多數(shù)序列時典型和常用的數(shù)據(jù)庫 。 ① Limit by Entrez Query:任何 NCBI BLAST 搜索的范圍都可以用在 Entrez搜索 中使用的任何一種范圍限定詞來限定 。 Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters NCBI Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters NCBI ③ 期望 expect: 期望值 E是得分大于或等于某個分值 S的不同的比對的數(shù)目在隨機(jī)的數(shù)據(jù)庫搜索中發(fā)生的可能性 。 對于 blastn、 blastp、 blastxt和 blastn期望值的默認(rèn)設(shè)置是 10。 當(dāng)將期望選項值調(diào)小時 , 返回的數(shù)據(jù)庫搜索結(jié)果將變少 , 匹配被搜索到的概率也會變小 。 Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters NCBI Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters NCBI Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters ④ 字段長度 word size: BLAST程序是通過比對未知序列與數(shù)據(jù)庫序列中的短序列來發(fā)現(xiàn)最佳匹配序列的 。 序列的匹配程序由短序列 (定義為 “ word”,即字 )的聯(lián)配得分總和來決定 。 總的合計得分便決定了序列間的相似程度 。 當(dāng)用一個查詢序列來進(jìn)行數(shù)據(jù)庫搜索時 , BLAST算法首先將查詢序列分割成一系列具有特定長度 (字段長度 )的小的序列段 (字段 )。 對于任意的字段長度 , 每個字段的匹配結(jié)果將被延伸以得到BLAST的輸出結(jié)果 。 NCBI ? 對于核酸序列 , 默認(rèn)的字段長度是 11, BLAST的字長缺省值為 11, 即 BLASTN將掃描數(shù)據(jù)庫 , 直到發(fā)現(xiàn)那些與未知序列的 11個連續(xù)堿基完全匹配的 11個連續(xù)堿基長度片段為止 。 ? 11個堿基的字長已能有效地排除中等分叉的同源性和幾乎所有隨機(jī)產(chǎn)生的顯著聯(lián)配 。降低字段長度將會使搜索變得更準(zhǔn)確同時也會變得更慢 。 ?通常情況下明智的選擇是在一次 BLAST搜索中使用幾種不同的打分矩陣 。 矩陣元素 Mij表示在一給定進(jìn)化時期內(nèi)氨基酸 j(列 )替換成氨基酸 i(行 )的概率 。 PAM1矩陣 基于緊密相關(guān)蛋白質(zhì)的比對 , 這些蛋白質(zhì)家族內(nèi)的序列一致程度至少有 85%。 如PAM250矩陣 就是 PAM1矩陣 乘以自身 250次產(chǎn)生 , 是 BLAST搜索數(shù)據(jù)庫的常用矩陣之一 。 PAM∝ 矩陣: PAM相當(dāng)大 (如 PAM> 2022或矩陣和自己相乘無數(shù)次 )。 Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters NCBI Dayhoff’s PAM0 mutation probability matrix: the rules for extremely slowly evolving proteins PA M 0 AA laRA rgNA snDA spCC y sQG lnEG luGG lyA 100% 0% 0% 0% 0% 0% 0% 0%R 0% 100% 0% 0% 0% 0% 0% 0%N 0% 0% 100% 0% 0% 0% 0% 0%D 0% 0% 0% 100% 0% 0% 0% 0%C 0% 0% 0% 0% 100% 0% 0% 0%Q 0% 0% 0% 0% 0% 100% 0% 0%E 0% 0% 0% 0% 0% 0% 100% 0%G 0% 0% 0% 0% 0% 0% 0% 100%Top: original amino acid Side: replacement amino acid NCBI Dayhoff’s PAM2022 mutation probability matrix: the rules for very distantly related proteins PAM? A Ala R Arg N Asn D Asp C Cys Q Gln E Glu G Gly A % % % % % % % % R % % % % % % % % N % % % % % % % % D % % % % % % % % C % % % % % % % % Q % % % % % % % % E % % % % % % % % G % % % % % % % % Top: original amino acid Side: replacement amino acid NCBI Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters NCBI Step 4a: Select optional search parameters NCBI NCBI Step 4a: 選擇可選的搜索參數(shù) Select optional search parameters NCBI ⑥ Compositional adjustments: 這個選項是默認(rèn)選擇的, 一般來說可改善 E值的統(tǒng)計計算和提高靈敏度 (減少返回的假陽性結(jié)果的數(shù)目 )。 N代表任意堿基 (IUBcode)。 過濾對絕大多數(shù)序列都是有益的 ,“Filter”
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1