freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于距離的系統(tǒng)發(fā)生分析-資料下載頁(yè)

2025-05-02 00:53本頁(yè)面
  

【正文】 : 1977年, 法構(gòu)建多于 4個(gè)物種的樹(shù)的方法。他們建立了一個(gè)距離矩陣,用矩陣中的值計(jì)算出針對(duì)前 4個(gè)物種的 3個(gè)數(shù)值:⑴ dAB + dCD ⑵ dAC + dBD ⑶ dAD + dBC。 取和最小的兩個(gè)配對(duì)打分為 1,而其他的 4個(gè)配對(duì)打分為 0 。對(duì)數(shù)據(jù)集中所有可能的 4個(gè)物種的組合都重復(fù)以上的步驟,不斷累計(jì)得分。最后得分最高的一對(duì)物種聚為一組,即這兩個(gè)物種是近鄰,就像 UPMGA法一樣,得到一個(gè)新的距離矩陣,用新的距離矩陣開(kāi)始新一輪的打分過(guò)程,直到只剩下 3個(gè)物種(此時(shí),樹(shù)的拓?fù)浣Y(jié)構(gòu)已經(jīng)明確確定了)。 鄰近歸并法 ? 鄰近歸并法 是對(duì)上面的方法做了一些改動(dòng)。這類(lèi)算法首先是由一棵星狀樹(shù)開(kāi)始,不管數(shù)目多少,所有的物種都從一個(gè)中心節(jié)點(diǎn)出發(fā),然后通過(guò)最小化樹(shù)的分支長(zhǎng)度和,相繼找到近鄰。 ? 計(jì)算分支長(zhǎng)度和公式 : 1987年 提出 S12=( 1/( 2( N2))( ∑( d1k+d2k) +( 1/2) d12+( 1/N2)( ∑dij))) 式中樹(shù)的 1和 2的位置可以使其中任何一對(duì)物種, N是距離矩陣中物種的數(shù)目 k 是引入外部參考物種, dij是物種 i 和 j 之間的距離; 1988年, : Q12= ( N2) d12 ∑ d1i ∑ d2i 最大似然法 ? 最大似然法是另外一類(lèi)完全基于統(tǒng)計(jì)的系統(tǒng)發(fā)生樹(shù)重建方法的代表。該法在每組序列比對(duì)中考慮了每個(gè)核苷酸替換的概率。 ? 例如,在第 3章中我們已經(jīng)知道,轉(zhuǎn)換出現(xiàn)的概率大約是顛換的 3倍。在一個(gè)三序列的比對(duì)中,發(fā)現(xiàn)其中有一列為一個(gè) C、一個(gè) T和一個(gè) G,有理由認(rèn)為,C和 T所在的序列之間的關(guān)系有可能更接近。最后根據(jù)定義,概率總和最大的那棵樹(shù)最有可能是反映真實(shí)情況的系統(tǒng)發(fā)生樹(shù)。 多重序列比對(duì) ? 在前面第 2章提到多重序列比對(duì),在被比對(duì)的序列十分相似并且不涉及很多的插入或刪除事件情況下的序列比對(duì)是最容易的。兩個(gè)以上的序列同時(shí)比對(duì)是兩個(gè)序列比對(duì)的擴(kuò)展。多序列比對(duì)中的最主要的困難是計(jì)算。 ? ?例如:在多序列比對(duì)中,在一條序列中插入一個(gè)核苷酸意味著在其他每一條序列中加一個(gè)空位,并且能?chē)?yán)重的破壞對(duì)空位插入和長(zhǎng)度懲罰的的固定記分。一些研究也發(fā)現(xiàn)在多重序列比對(duì)中加以不同的順序加入新的序列對(duì)最后結(jié)果有嚴(yán)重的影響。 多重序列比對(duì) ? 由于相似序列比對(duì)比較容易,而且置信度較大,在進(jìn)行多重序列比對(duì)的時(shí)候應(yīng)考慮被研究序列的分化順序。如果序列的系統(tǒng)發(fā)生關(guān)系在比對(duì)之前是已知的,那么多重序列比對(duì)時(shí)將序列逐條加入,關(guān)系近的序列先加入。 ? ?例如: 一些流行的多重序列比對(duì)算法的常用策略是: ⑴對(duì)于被研究的序列,產(chǎn)生所有可能的兩兩序列比對(duì)的距離矩陣; ⑵用一種基于統(tǒng)計(jì)的方法,如 UPGMA,構(gòu)造一棵初始的樹(shù); ⑶依據(jù)推斷出的樹(shù),按照序列之間的關(guān)系重新比對(duì); ⑷從新的多重序列比對(duì)得到的兩兩距離構(gòu)造新的樹(shù); ⑸如果新的樹(shù)和前面的不一樣,則重復(fù)上過(guò)程。 本章總結(jié) ? 不做計(jì)算機(jī)模擬實(shí)驗(yàn),我們就很難了解同源序列之間的真實(shí)關(guān)系。即使是相對(duì)較少的序列,其可能的系統(tǒng)發(fā)生樹(shù)的數(shù)目也會(huì)以很驚人的速度增加。 ? 有多種方法能利用核苷酸和氨基酸序列信息推斷出基因和物種之間最有可能的系統(tǒng)發(fā)生樹(shù)。 ? 基于距離的系統(tǒng)發(fā)生樹(shù)重建方法通過(guò)考慮所有序列的總體相似度,反復(fù)聚類(lèi)那些最相似的序列,從而從很多可能的樹(shù)中集中地得到少數(shù)的樹(shù)。 課堂練習(xí) P81: Newick格式 (((A, B), C)(D, E))F的系統(tǒng)發(fā)生樹(shù)。 4個(gè)物種 A、 B、 C和 D所有可能的無(wú)根樹(shù)和有根樹(shù)。 思考題 作業(yè) P8182: ?
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1