【正文】
復制事件之后,會立刻出現(xiàn)非同義替換速率大于同義替換速率的現(xiàn)象。但是,若這一基因家族在其余的時間都是受到purifying selection 的作用,那么僅僅是兩個序列之間的比對是很難發(fā)現(xiàn)omega值大于1的位點。鑒于這一問題,本文提出了用于檢測基因復制后適應性進化的最大似然法,旨在完成以下目標:(1)同一個基因進化歷史中不時間點的選擇壓力;(2)這些選擇壓力是否不同。 支系間選擇壓力可變模型(Models of variable selective pressures among branches)(1)one ratio model ,即Phylogenetic tree中所有sites的omega值是一個恒定值。ω0=ω1=ω2=ω3;(2)Two ratio model, 復制事件之前的omega值和復制事件之后的omega值不相等。ω0≠ω1=ω2=ω3;90圖1 假設基因家族的進化樹Fig1 Phylogeny of a hypothetical gene family(3)Three ratio model, 該模型共假設三個omega值,即復制事件之前的omega值,復制事件之后的omega值,以及后期分支中的omega值。ω0≠ω1≠ω2=ω3。(4)Four ratio model, 該模型共假設四個omega,不僅復制事件前后的omega值不同以外,隨后的分支上的兩個omega值也不相同。即ω0≠ω1≠ω2≠ω3。 模型比較可以揭示的問題(likelihood ratio test)(1) one ratio model with two ratio model : 揭示基因家族的復制前后所受的選擇壓力是否相同;(2) two ratio model with three ratio model: 揭示基因家族復制后到分化前以及分化后這段時間的選擇壓力是否發(fā)生變化。(3) three ratio model with four ratio model: 揭示基因家族中兩個旁系同源分支之間的選擇壓力是否發(fā)生變化。 應用舉例——ECPEDN基因家族在基因復制之后非同義替換速率是否發(fā)生改變。ECP,即嗜酸性粒細胞衍生神經(jīng)毒素,EDN,即嗜酸性粒細胞陽離子蛋白。二者均是核糖核酸酶類,但其特異性功能發(fā)生了分化,ECP是陽離子毒素,對于寄生蟲和細菌都有非特異性毒性。但EDN是一種有效地抗病毒藥物通過有效地核酸降解。本文中對ECPEDN基因家族在基因復制之后的非同義替換率進行了檢驗。圖2 ECPEDN基因家族系統(tǒng)發(fā)育樹Fig 2 The phylogenetic tree of ECPEDN gene family本分析共設置了四個ratio Model,分別為one ratio Model, two ratio Model, three ratio Model and four ratio Model。其中R1 和R2的LRT檢測結果是顯著的(P=),這說明在基因復制事件之后,非同義替換速率發(fā)生了顯著的增加;R2和R3的LRT檢測結果也是顯著的,這說明在基因復制事件之后,ECPEDN基因家族經(jīng)歷了適應性檢測;R3和R4的LRT檢測結果也是顯著的,這表明ECP subclade 與EDN subclade所處的進化選擇壓力不同。 鑒定適應性進化的氨基酸位點(Identification of amino acid sites under positive selection)從蛋白質進化的角度而言,為了維持蛋白質功能的穩(wěn)定性,其平均非同義替換的數(shù)量往往較少。只有少數(shù)一部分氨基酸位點在進化過程中受到適應性進化的選擇。因此,計算整個支系的平均omega值往往很難檢測到positive selection。鑒于此,我們需要對小部分的condons所受的正選擇壓力進行檢測并確定存在這些正選擇壓力的位點的位置。為完成上述目標,我們可以根據(jù)已知的結構域和功能域的信息,將氨基酸位點分成若干具有獨立omega值的小位點合集。但是在不了解蛋白質的結構域和功能域的情況下,可以對 all amino acid sites 設計一個omega值分布(比如gamma 分布,beta 分布等)。通過對null Model 以及其衍生模型的LRT檢驗,驗證是否存在positive sites的假說,若positive sites存在,則通過NEB或者BEB法檢驗這些位點的后驗概率。 Lineage specific changes in selective pressure at specific amino acid sitesModel A: 指定ω0=0 且ω1=1,因此正選擇作用只約束在了前景枝中;通常選擇M1 與Model A進行LRT檢測,自由度df=2;Model B:ω0和ω1為自由參數(shù)(free parameters),所分析的整個支系中均有可能出現(xiàn)正選擇作用位點。通常選擇M3與Model B進行LRT檢測,自由度df=2;