freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

dna序列分類2000年數(shù)學(xué)建模競賽題-文庫吧資料

2024-08-29 15:13本頁面
  

【正文】 .90 .90 .90 .90 .90 。 xx=[ .90 。 。 。 .00 。 。 。 。 。 。 。 x=[ 。 .94 .94 .94 .94 .94 .94 .94。 .97 .97 .97 。 .00 .00 。 .90 .90 .90 .00 .90 .00 。 .00 .89 .00 .00 .00 .00 。 .00 .00 .00 .00 .99 。 .00 .00 .96 .00 。 .00 .00 .95 .00 。 .98 .00 .00 .98 .00 .00 .00 。 ddd=[ .88 .00 .00 .88 。 。 .97 。 。 .90。 .89 。 .99 。 。 。 .00 .98 。 dd=[ 。 。 。 。 。 。 。 。 。 。) write(5,1)aa,cc,tt,gg 1 format(1x,) 20 CONTINUE END 附錄二 基本特征量的提取程序及結(jié)果 d=[ 。,status=39。 六.參考文獻(xiàn) [1]The Invention of the Geic Code, Brain Hayes(美 ), American Scientist— Computing Science, ., 1998 [2]《 MATLAB 入門》 后勤工程學(xué)院 1997 [3]《數(shù)學(xué)實(shí)驗(yàn)》 蕭樹鐵 主編 高等教育出版社 1999 [4]《概率論第二冊(cè) —— 數(shù)理統(tǒng)計(jì)》 復(fù)旦大學(xué) 高等教育出版社 1985 [5]《生命科學(xué)模型》 William F. Lucas 主編 國防科技大學(xué)出版社 1996 [6]《運(yùn)籌學(xué)基礎(chǔ)手冊(cè)》 徐光煇 主編 科學(xué)出版社 1999 [7]《數(shù)學(xué)模型》 姜啟源 主編 高等數(shù)學(xué)出版社 1993 七.附錄 附錄一 1 個(gè)字符出現(xiàn)頻率的計(jì)算程序 ] CHARACTER*121 LINE(40) integer a,c,t,g,at READ*,LINE DO 20 II=1,40 iii=ii+20 A=0 C=0 T=0 G=0 DO 10 I=1,121 IF(LINE(ii)(I:I).EQ.’a’)THEN A=A+1 else if(line(ii)(I:I).eq.’c’)then c=c+1 else if(line(ii)(I:I).eq.’t’)then t=t+1 else if(line(ii)(I:I).eq.’g’)then g=g+1 END IF 10 continue at=a+t actg=a+c+t+g aa=a/actg*100. cc=c/actg*100. tt=t/actg*100. gg=g/actg*100. aatt=at/actg*100. open(5,file=39。對(duì)研究 DNA序列的規(guī)律性和結(jié)構(gòu)提供了一種有效的分類模型。 五 . 模型的改進(jìn)方向及推廣 模型的改進(jìn):因?yàn)槟P蜎]考慮 DNA 序列的實(shí)際特性,當(dāng)序列變得很多很長很復(fù)雜時(shí),分類的準(zhǔn)確性會(huì)降低而不可用,因此應(yīng)增加對(duì) DNA 序列的生物特性的考慮。 缺點(diǎn): 由于只考慮了 DNA 樣本序列中 1字符串、 2字符串、 3字符串出現(xiàn)的頻率作為特征,DNA 序列的分類不一定與實(shí)際情況完全相符。 3. 采用模塊化分析,逐漸深入,提高了準(zhǔn)確性。 2. 僅用 4個(gè)特征參數(shù)即圓滿解決了較為復(fù)雜的分類問題。 四 .未知樣本的預(yù)報(bào) 現(xiàn)在用前 面建立的數(shù)學(xué)模型對(duì)題目所給的未知類型的 20 個(gè)人工序列和 182 個(gè)自然序列進(jìn)行預(yù)報(bào)。只有第三組的這一個(gè)結(jié)果有較大差異,占總數(shù)的 5%。 ( 3) 取出 17 的預(yù)報(bào)結(jié)果,與( 1)的結(jié)果相比,有兩個(gè)樣本的差異,占 5%。 每次取出一個(gè)學(xué)習(xí)樣本,以其余學(xué)習(xí)樣本作訓(xùn)練集,用分類模型對(duì)未知類別的第21~40 個(gè)樣本進(jìn)行預(yù)報(bào), 其結(jié)果有以下特點(diǎn): ( 1) 除分別取出 1 17, 20 的預(yù)報(bào)結(jié)果不同外,分別取出其余 16 中一個(gè),預(yù)報(bào)結(jié)果均為: 22, 23, 25, 27, 29, 34, 35, 36, 37,占 80%。結(jié)果見表 4。為了進(jìn)一步考查分類模型的有效性和可靠性,我們采用的方法是:預(yù)先留一部分學(xué)習(xí)樣本不參加訓(xùn)練,然后用分類決策模型對(duì)其作預(yù)報(bào),將預(yù)報(bào)成功率作為預(yù)報(bào)能力的指標(biāo)。 ( 2) 分類決策: Fisher 線性判別法。 因此,得出分類的數(shù)學(xué)模型為: ( 1) 特征選?。喝?W=( r1,r2,r3,r4),求 Y=XW,得出特征參數(shù)向量就是 Y的 4個(gè)列向量。 用上面得出的 4個(gè)主成分構(gòu)成的特征組和此分類決策,對(duì) 20個(gè)學(xué)習(xí)樣本進(jìn)行分類,能得出正確的結(jié)果。取分類門檻值為: U0=U(α *X 1+(1α )*X 2) 其中 0α 1,本問題中兩類樣本的個(gè)數(shù)相等,可取 α =1/2。取 U(x)=(X 1X 2)' (∑ 1+∑ 2)1X 就可滿足 (1)。即應(yīng)在不同母體下,使 U(x)的取值盡量分開。即選取線性判別函數(shù) U(x),使得: U(x)={E1[U(x)]E2[U(x)]}2/{D1 [U(x)]+D2[U(x)]}=max (1) 其中 Ei 與 Di分別表示母體 i 的期望和方差運(yùn)算, i=1, 2。基本作法是在學(xué)習(xí)樣本集的基礎(chǔ)上確定某個(gè)判決規(guī)則,使按這種判決規(guī)則對(duì)被甄別對(duì)象進(jìn)行分類所造成的錯(cuò)誤識(shí)別率最小或引起的損失最少。 (程序及結(jié)果見附錄二 ) 二. 分類決策的制定 前面已選取了特征參數(shù),把特征參數(shù)張成的多維空間稱為特征空間。 現(xiàn)將反映 20 個(gè)已知類別樣本的 41 個(gè)特征的隨機(jī)向量 X 進(jìn)行特征提取。只要前 q 個(gè)主成分的累計(jì)貢獻(xiàn)率超過給定的百分比 V。特征的提取就是通過變換的方法用低維空間來表示樣本,使得 X的大部分特性能由 Y來表達(dá),即將 p 維隨機(jī)向量 X變換成 q維隨機(jī)向量 Y( qp)。 (程序與附錄一類似 ) Figure 2. Symmetries of the diamond code sort the 64 codons into 20 classes, indicated here by 20 colors. All the codons in each class specified the same amino acid. 圖 1 Brian Hayes 在論文“ The Invention of the Geic Code”中給出的圖形 (注:圖中 DNA 被轉(zhuǎn)錄為 RNA,“ U”代表“ T”) 表 3 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20 1 2 2 .83 3 4 , 5 9 .52 6 7 7 .69 8 9 6 .93 10 11 5 .36 12 13 4 .50 14 1 15 1 16
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1