正文內(nèi)容

dna序列分類(lèi)2000年數(shù)學(xué)建模競(jìng)賽題-展示頁(yè)

2024-09-02 15:13本頁(yè)面

　　

【正文】 17 18 3 .42 19 6. 60 20 5 .17 其中 b1 =aaa+ata b2=aca+aga b3=cac+ctc b4=ccc+cgc b5 =gag+gtg b6=gcg+ggg b7=tat+ttt b8=tct+tgt b9 =aac+caa+atc+cta b10=aag+gaa+atg+gta b11=aat+taa+att+tta b12=acc+cca+agc+cga b13=acg+gac+ctg+gtc b14=act+tca+agt+tga b15=cag+gac+ctt+ttc b16=cat+tac+ctt+ttc b17=ccg+gcc+cgg+ggc b18=cct+tcc+cgt+tgc b19=gat+tag+gtt+ttg b20=gct+tcg+ggt+tgg 綜合起來(lái)，形成了有 41 個(gè)變量的基本特征集。（不考慮字符串在序列片段中的起始位置，也采用“滾動(dòng)”算法。在參考文獻(xiàn) [1]的 Figur2 中，給出了這 20 種氨基酸的編碼（見(jiàn)圖 1）。（用“滾動(dòng)”算法，如 attcg 有 at,tt,tc,cg 共 4個(gè) 2字符串） (程序與附錄一類(lèi)似 ) 表 2 AA AC AT AG TA TC TG TT CA CT CC CG GA GT GC GG 1. .90 1 2. .90 3. .90 .90 .90 .90 .90 4. .90 5. .90 6. .00 .00 .90 7. .90 .90 .90 8. 9. .90 .00 2. 70 10. 11. .91 .91 .91 .91 .00 12. .91 .91 .91 .00 .91 .00 13. 2 14. .91 .00 .91 .9 1 .91 .00 .00 .00 .00 .00 .00 .00 .91 16. . .00 .91 .00 .91 .91 .913 .91 .91 20. .91 .91 .00 .00 .91 3． 3字符串的排列出現(xiàn)的頻率 A， T， C， G 這 4 個(gè)字符組成了 64 種不同的 3 字符串。 (程序見(jiàn)附錄一 ) 表 1 A C T G A+T 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. .00 16. 17. 18. 19. 20. 2． 2 字符串的排列出現(xiàn)的頻率 A， T， C， G 這 4 個(gè)字符組成了 16 種不同的 2 字符串。由于在不用于編碼蛋白質(zhì)的序列片段中， A和 T的含量特別多些，因此我們將 A和 T是否特別豐富作為一個(gè)特征。（一）特征的形成分別列舉一個(gè)字符， 2個(gè)字符， 3個(gè)字符的排列在序列中出現(xiàn)的頻率，構(gòu)成基本特征集。本問(wèn)題的學(xué)習(xí)樣本數(shù)為 20個(gè)，故特征參數(shù)的個(gè)數(shù)以 6— 8 個(gè)為宜。，而又不必要用太多的樣本，最好使特征參數(shù)的個(gè)數(shù)降至最少。在列舉了盡可能完備的特征參數(shù)集之后，就要借助于數(shù)學(xué) 的方法，使特征參數(shù)的數(shù)目（在保證分類(lèi)良好的前提下）減到最小。一．特征的形成和提取為了有效地實(shí)現(xiàn)分類(lèi)識(shí)別，首先要根據(jù)被識(shí)別的對(duì)象產(chǎn)生一組基本特征，并對(duì)基本特征進(jìn)行變換，得到最能反映分類(lèi)本質(zhì)的特征。給出的已知類(lèi)別的樣本稱(chēng)為學(xué)習(xí)樣本。題目給出了 20 個(gè)已知為兩個(gè)類(lèi)別的人工制造的 DNA 序列，要求我們從中提取特征，構(gòu)造分類(lèi)方法，從而對(duì) 20 個(gè)未標(biāo)明類(lèi)別的人工 DNA 序列和 182 個(gè)自然 DNA 序列進(jìn)行分類(lèi)。 3．較長(zhǎng)的 182 個(gè)自然序列與已知類(lèi)別的 20 個(gè)樣本序列具有共同的特征。二 .模型的合理假設(shè) 1．各序列中 DNA 堿基三聯(lián)組（即 3 字符串）的起始位置和基因表達(dá)不影響分類(lèi)的結(jié)果。作為研究 DNA序列的結(jié)構(gòu)的嘗試，提出以下對(duì)序列集合進(jìn)行分類(lèi)的問(wèn)題： 1）請(qǐng)從 20 個(gè)已知類(lèi)別的人工制造的序列（其中序列標(biāo)號(hào) 1— 10 為 A 類(lèi)， 1120 為 B類(lèi)）中提取特征，構(gòu)造分類(lèi)方法，并用這些已知類(lèi)別的序列，衡量你的方法是否足夠好。這些發(fā)現(xiàn)讓人們相信， DNA序列中存在著局部的和全局性的結(jié)構(gòu)，充分發(fā)掘序列的結(jié)構(gòu)對(duì)理解 DNA全序列是十分有意義的。又例如，在不用于編碼蛋白質(zhì)的序列片段中， A和 T的含量特別多些，于是以某些堿基特別豐富作為特征去研究 DNA序列的結(jié)構(gòu)也取得了一些結(jié)果。雖然人類(lèi)對(duì)它知之甚少，但也發(fā)現(xiàn)了其中的一些規(guī)律性和結(jié)構(gòu)。最后通過(guò)檢驗(yàn)證明所用的分類(lèi)數(shù)學(xué)模型效率較高。然后用 Fisher 線(xiàn)性判別法進(jìn)行分類(lèi)，得出了所求 20 個(gè)人工制造序列及 182 個(gè)自然序列的分類(lèi)結(jié)果如下： 1） 20 個(gè)人工序列： 22, 23， 25， 27， 29， 34， 35， 36， 37 為 A類(lèi)，其余為 B 類(lèi)。DNA 序列分類(lèi) 摘要本問(wèn)題是一個(gè)“有人管理分類(lèi)問(wèn)題 ”。首先分別列舉出 20 個(gè)學(xué)習(xí)樣本序列中 1字符串、 2 字符串、 3 字符串出現(xiàn)的頻率，構(gòu)成含 41 個(gè)變量的基本特征集，接著用主成分分析法從中提取出 4 個(gè)特征。 2） 182 個(gè)自然序列： 1， 4， 8， 10， 27， 29， 32， 41， 43， 48， 54， 63， 70， 72， 75， 76，81， 86， 90， 92， 102， 110， 116， 119， 126， 131， 144， 150， 157， 159， 160， 161，162， 163， 164， 165， 166， 169， 170， 182 為 B 類(lèi)，其余為 A 類(lèi)。一 . 問(wèn) 題重述人類(lèi)基因組計(jì)劃中 DNA全序列草圖是由 4個(gè)字符 A， T， C， G按一定順序排成的長(zhǎng)約 30億的序列，其中沒(méi)有“斷句”也沒(méi)有標(biāo)點(diǎn)符號(hào)。例如，在全序列中有一些是用于編碼蛋白質(zhì)的序列片段，即由這 4個(gè)字符組成的 64種不同的 3字符串，其中大多數(shù)用于編碼構(gòu)成蛋白質(zhì)的 20種氨基酸。此外，利用統(tǒng)計(jì)的方法還發(fā)現(xiàn)序列的某些片段之間具有相關(guān)性，等等。目前在這項(xiàng)研究中最普通的思想是省略序列的某些細(xì)節(jié)，突出特征，然后將其表示成適當(dāng)?shù)臄?shù)學(xué)對(duì)象。然后用你認(rèn)為滿(mǎn)意的方法，對(duì)另外 20個(gè)未標(biāo)明類(lèi)別的人工序列（標(biāo)號(hào) 21— 40）進(jìn)行分類(lèi)，把結(jié)果用序號(hào)（按從小到大的順序）標(biāo)明它們的類(lèi)別（無(wú)法分類(lèi)的不寫(xiě)入） 2）同樣方法對(duì) 182個(gè)自然 DNA序列 (它們都較長(zhǎng) )進(jìn)行分類(lèi)，像 1）一樣地給出分類(lèi)結(jié)果。 2． 64 種 3 字符串壓縮為 20 組后不影響分類(lèi)的結(jié)果。三 .模型建立與求解研究 DNA 序列具有什么結(jié)構(gòu)，其 A， T， C， G4個(gè)堿基排成的看似隨機(jī)的序列中隱藏著什么規(guī)律，是解讀人類(lèi)基因組計(jì)劃中 DNA 全序列草圖的基礎(chǔ)，也是生物信息學(xué)（ Bioinformaties）最重要的課題之一。這是模式識(shí)別中的“有人管理分類(lèi)”問(wèn)題，即事先規(guī)定了分類(lèi)的標(biāo)準(zhǔn)和種類(lèi)的數(shù)目，通過(guò)大批已知樣本的信息處理找出規(guī)律，再用計(jì)算機(jī)預(yù)報(bào)未知。對(duì)于此類(lèi)問(wèn)題，我們通過(guò)建立分類(lèi)數(shù)學(xué)模型（這包括形成和提取特征以及制定分類(lèi)決策）、考查分類(lèi)模型的效率、預(yù)報(bào)未知這幾個(gè)步驟來(lái)進(jìn)行。這就是特征形成和提取的過(guò)程。這是因?yàn)椋?，而且會(huì)帶來(lái)噪音，干擾分類(lèi)和數(shù)學(xué)模型的建立。模式識(shí)別計(jì)算一般要求樣本數(shù)至少為變量數(shù)的3 倍，否則結(jié)果不夠可靠。我們通過(guò)研究 4個(gè)字符 A,T,C,G 在 DNA 序列中的排列、組合特性，主要是研究字符和字符串的排列在序列中出現(xiàn)的頻率，從中提取 DNA 序列的結(jié)構(gòu) 特征參數(shù)。 i. 1 個(gè)字符的出現(xiàn)頻率表 1列出了 20 個(gè)樣本中 A， T， C， G這 4個(gè)字符出現(xiàn)的頻率。在表一中，列出了 A 和 T 出現(xiàn)的頻率之和。表 2 列出了 20 個(gè)樣本中各 2字符串出現(xiàn)的頻率。這 64 種 3 字符串構(gòu)成生物蛋白質(zhì)的 20種氨基酸。因此，在計(jì)算 3字符串的出現(xiàn)頻率時(shí)，我們根據(jù)圖 1將代表同一種氨基酸的 3 字符串合成一類(lèi)，只統(tǒng)計(jì) 20類(lèi) 3字符串的出現(xiàn)頻率。如 acgtcc 中就有 acg,cgt,gtc,tcc 共 4 個(gè) 3 字符串）見(jiàn)表 3。 (二 )特征的提取上述基本特征集中有 41 個(gè)變量，即樣本處于一個(gè)高維空間中。我們用主成分分析法進(jìn)行特征的提取，其步驟是： 1．求 X的均方差矩陣 V 的特征根，記為： λ 1≥λ 2≥??≥λ k＞ 0 λ k+1=?? =λ P=0 2．求λ 1,λ 2??λ K 對(duì)應(yīng)的標(biāo)準(zhǔn)正交的特征向量 r1， r2?? rK 得到第 i 個(gè)主成分為 yi=riX, i=1,2?? K 3．求第 i個(gè)主成分的貢獻(xiàn)率 ui=λ i/ ??ki 1λ j, i=1,2?? K及前 m 個(gè)主成分的累計(jì)貢獻(xiàn)率 vm=??mi1ui. 4．求得 q，使得 Vq≥ V0(V0一般在到 1 之間 )，則取 W=(r1,r2,?? ,rq) Y=XW 第 3 步所求的貢獻(xiàn)率，代表主成分表達(dá) X 的能力，貢獻(xiàn)率越大，對(duì)應(yīng)的主成分表達(dá) X的能力越強(qiáng)。就可以用低維特征 Y=（ y1,y2, ?? yq）來(lái)反映高維特征（ x1,x

點(diǎn)擊復(fù)制文檔內(nèi)容

教學(xué)課件相關(guān)推薦

【數(shù)學(xué)建模競(jìng)賽】蠓蟲(chóng)分類(lèi)-展示頁(yè)

【摘要】蠓蟲(chóng)分類(lèi)解：（1）Bayes判別：求條件概率假設(shè)假設(shè)兩類(lèi)數(shù)據(jù)均服從二維正態(tài)分布，，則條件概率為：決策規(guī)則為;或等價(jià)地:判決函數(shù)：類(lèi)似地，Bayes最小風(fēng)險(xiǎn)判別可通過(guò)給出風(fēng)險(xiǎn)后得到。x=[ ;

2024-09-06 05:11

垃圾分類(lèi)知識(shí)競(jìng)賽題-展示頁(yè)

【摘要】第一篇：垃圾分類(lèi)知識(shí)競(jìng)賽題垃圾分類(lèi)知識(shí)競(jìng)賽題一、選擇題（1）廣州市生活垃圾分為_(kāi)_____類(lèi)。A一B二C三D四（2）廣州市城市生活垃圾分為_(kāi)___________。A可回收物、其他垃圾...

2024-11-04 22:10

2022年數(shù)學(xué)建模競(jìng)賽培訓(xùn)體系的實(shí)踐-展示頁(yè)

【摘要】此資料由網(wǎng)絡(luò)收集而來(lái)，如有侵權(quán)請(qǐng)告知上傳者立即刪除。資料共分享，我們負(fù)責(zé)傳遞知識(shí)。數(shù)學(xué)建模競(jìng)賽培訓(xùn)體系的實(shí)踐數(shù)學(xué)建模競(jìng)賽培訓(xùn)體系的實(shí)踐本文關(guān)鍵詞：建模，競(jìng)賽，實(shí)踐，體系，數(shù)學(xué) 數(shù)學(xué)建模競(jìng)賽...

2025-03-15 01:35

艾滋病療法評(píng)價(jià)及療效預(yù)測(cè)數(shù)學(xué)建模論文高教社杯數(shù)學(xué)建模競(jìng)賽題-展示頁(yè)

【摘要】1艾滋病療法評(píng)價(jià)及療效預(yù)測(cè)摘要目前，艾滋病的傳染性和不可根除性，已經(jīng)成為當(dāng)今世界人類(lèi)社會(huì)的災(zāi)難．本文以美國(guó)艾滋病醫(yī)療試驗(yàn)機(jī)構(gòu)ACTG公布的兩組數(shù)據(jù)為樣本，采用了不同的方法對(duì)艾滋病療法進(jìn)行評(píng)價(jià)及療效的預(yù)測(cè)．針對(duì)問(wèn)題一，根據(jù)附件1數(shù)據(jù)，運(yùn)用MATLAB軟件分別對(duì)CD4濃度與時(shí)間、HIV濃度與時(shí)間進(jìn)行擬合得到濃度

2024-11-17 16:30

[理學(xué)]2010年數(shù)學(xué)建模期末選題c題-展示頁(yè)

【摘要】C題：協(xié)同進(jìn)化下的品牌競(jìng)爭(zhēng)與合作在一定區(qū)域內(nèi)，和生物一樣，沒(méi)有一個(gè)品牌或單個(gè)組織能夠單獨(dú)長(zhǎng)期生存。一個(gè)品牌直接或間接依靠其他品牌而存在，并形成一種有規(guī)律的組合，即經(jīng)濟(jì)共同體。在這個(gè)經(jīng)濟(jì)共同體中，對(duì)每一個(gè)品牌個(gè)體而言，生活在它周?chē)钠渌放苽€(gè)體或組織連同社會(huì)環(huán)境構(gòu)成了其生存的外部環(huán)境，品牌個(gè)體與其外部環(huán)境通過(guò)物質(zhì)、能量和信息的交換，構(gòu)成一個(gè)相互作用、相互

2025-01-18 00:22

節(jié)能減排競(jìng)賽題分類(lèi)-展示頁(yè)

【摘要】四川廣安發(fā)電有限責(zé)任公司節(jié)能減排專(zhuān)題競(jìng)賽復(fù)習(xí)資料節(jié)能減排競(jìng)賽題1.?中華人民共和國(guó)節(jié)約能源法，于?1997?年?11?月?1?日第八屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第二十八次會(huì)議通過(guò)　2007?年?10?月?28?日第十屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第三十次會(huì)議修訂

2025-04-03 07:32

[數(shù)學(xué)]2011數(shù)學(xué)建模競(jìng)賽選拔題-展示頁(yè)

【摘要】數(shù)學(xué)建模的一般步驟建立數(shù)學(xué)模型與其說(shuō)是一門(mén)技術(shù)，不如說(shuō)是一門(mén)藝術(shù)。成功建立一個(gè)好的模型，就如同完成一件杰出的藝術(shù)品，是一種復(fù)雜的創(chuàng)造性勞動(dòng)。正因?yàn)槿绱?，這里介紹的步驟只能是一種大致上的規(guī)范。：在建模前應(yīng)對(duì)實(shí)際背景有盡可能深入的了解，明確所要解決問(wèn)題的目的和要求，收集必要的數(shù)據(jù)。歸納為一句話(huà)：深入了解背景，明確目的要求，收集有關(guān)數(shù)據(jù)。：在充分消化信息的

2025-01-18 14:47

數(shù)學(xué)建模競(jìng)賽訓(xùn)練題(liu)-展示頁(yè)

【摘要】2013年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽訓(xùn)練題第一題:背景：學(xué)校的教學(xué)樓是一種人員非常集中的場(chǎng)所，而且具有較大的火災(zāi)荷載和較多的起火因素，一旦發(fā)生火災(zāi)，火災(zāi)及其煙氣蔓延很快，容易造成嚴(yán)重的人員傷亡。對(duì)于不同類(lèi)型的建筑物，人員疏散問(wèn)題的處理辦法有較大的區(qū)別，結(jié)合1號(hào)教學(xué)樓的結(jié)構(gòu)形式，對(duì)教學(xué)樓的典型的火災(zāi)場(chǎng)景作了分析，分析該建筑物中人員疏散設(shè)計(jì)的現(xiàn)狀，提出一種人員疏散的基礎(chǔ)，并對(duì)學(xué)校領(lǐng)導(dǎo)提出有益的見(jiàn)

2025-01-23 03:13

20xx年數(shù)學(xué)建模b題論文-展示頁(yè)

【摘要】交巡警服務(wù)平臺(tái)的設(shè)置與調(diào)度摘要本文建立了交巡警服務(wù)平臺(tái)調(diào)度方案的優(yōu)化模型，合理分配全市區(qū)交巡警服務(wù)平臺(tái)的管轄范圍，使其能在規(guī)定時(shí)間內(nèi)到達(dá)事發(fā)地，并在快速到達(dá)事發(fā)地的前提下提供了一系列合理的調(diào)度方案。對(duì)問(wèn)題一建立了以交巡警服務(wù)平臺(tái)的反應(yīng)時(shí)間最短、調(diào)度封鎖總路程最短兼顧工作強(qiáng)度的均衡性的優(yōu)化模型。應(yīng)用floyd算法得到各節(jié)

2024-11-13 17:27

2000年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽論文-展示頁(yè)

【摘要】2020年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽論文A題：DNA序列分析陳哲愚隊(duì)員：肖哲張平

2024-11-15 06:52

河南理工大學(xué)2014年數(shù)學(xué)建模競(jìng)賽-展示頁(yè)

【摘要】河南理工大學(xué)2014年數(shù)學(xué)建模競(jìng)賽基于0-1整體線(xiàn)性規(guī)劃法的工作分配問(wèn)題【摘要】效率是指對(duì)于有限資源(如原材料，人力現(xiàn)金等)。自古以來(lái)，不論是大到國(guó)家、社會(huì)，小到公司、個(gè)體。效率都是其追求的重要目標(biāo)。而減小成本也是相當(dāng)重要的。特別是在提高效率的同時(shí)減小成本和代價(jià)，這樣能給公司，國(guó)家等帶來(lái)最大程度上的的經(jīng)濟(jì)效益，還能促進(jìn)他們更好更快的發(fā)展。本模型旨在通過(guò)對(duì)6個(gè)人員進(jìn)行合適的工

2025-04-16 02:53

初中數(shù)學(xué)競(jìng)賽題(含答案)-展示頁(yè)

【摘要】一、選擇題(每小題7分，共56分．以下每題的4個(gè)結(jié)論中，僅有一個(gè)是正確的，請(qǐng)將正確答案的英文字母填在題后的圓括號(hào)內(nèi))1．(15屆江蘇初一1試)在-|－3|3，-(-3)3，(-3)3，-33中，最大的是(B)．(A)-|-3|3(B)-(-3)3(C)(-3)3(D)-332.(15屆江蘇初一1試)“a的2倍與b的一

2025-01-27 04:56

高中物理競(jìng)賽題競(jìng)賽題五答案-展示頁(yè)

【摘要】練習(xí)五答案1、提示——（1）對(duì)圖示的灰色三角形用正弦定理，有=得β=arcsin（2）以β為未知，看v（β）函數(shù)v=顯然vmin=usinα答案：（1）與公路夾角θ=arctg+arcsin（°+°=°）；（2）。2、提示——在小球未脫離軌道時(shí)，設(shè)一個(gè)一般的末態(tài)P：其

2025-01-23 12:18

數(shù)學(xué)建模-2014年度東華大學(xué)數(shù)學(xué)建模競(jìng)賽b題評(píng)閱要點(diǎn)-展示頁(yè)

【摘要】2014年度東華大學(xué)數(shù)學(xué)建模競(jìng)賽暨全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽選拔賽B題二手房估價(jià)問(wèn)題根據(jù)住房參與流通的時(shí)序結(jié)構(gòu)，住房市場(chǎng)可以分為一級(jí)市場(chǎng)和二級(jí)市場(chǎng)。一級(jí)市場(chǎng)是指新建住宅流量的權(quán)屬首次讓渡的市場(chǎng)，如新建商品住宅的買(mǎi)賣(mài)、租賃等。二級(jí)市場(chǎng)是以存量住宅為交易對(duì)象的市場(chǎng)，即住宅權(quán)屬的轉(zhuǎn)讓或再轉(zhuǎn)讓的市場(chǎng)，俗稱(chēng)二手房市場(chǎng)。二手房的價(jià)格評(píng)估，涉及的不確定因素眾多。評(píng)估的準(zhǔn)確性與評(píng)估所采用的方

2025-01-23 02:54

初三數(shù)學(xué)競(jìng)賽題word版-展示頁(yè)

【摘要】【精選】親愛(ài)的同行們，這不是病毒，這只是寫(xiě)在前面的話(huà)，答案在下面！一個(gè)倍感悲涼的數(shù)學(xué)競(jìng)賽輔導(dǎo)老師一年一度的全國(guó)初中數(shù)學(xué)競(jìng)賽又結(jié)束了，學(xué)生考完后帶他們?nèi)コ粤祟D便飯，看到他們雖然考得一塌糊涂但是終于解放了的開(kāi)心又帶著一絲無(wú)奈的神情，我感到很揪心！下午一回到家，把兒子撂在一邊，花了2個(gè)半鐘終于全部做完，雖然感覺(jué)解題能力比起三年前已大打折扣，但還

2025-01-18 18:25

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片