freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

全國(guó)研究生數(shù)學(xué)建模大賽-具有遺傳性疾病和性狀的遺傳位點(diǎn)分析-wenkub

2023-04-22 02:14:30 本頁面
 

【正文】 個(gè)位點(diǎn)的信息不會(huì)受到其它疾病或性狀的影響。(6)假設(shè)疾病不會(huì)受多個(gè)位點(diǎn)特殊排列組合的影響。問題一要求根據(jù)合適的方法,把1000個(gè)樣本在染色體片段上所有的位點(diǎn)信息轉(zhuǎn)換為數(shù)值編碼方式,這樣便于后面問題的統(tǒng)計(jì)分析和為數(shù)學(xué)建模鑒定基礎(chǔ)。(2)編碼規(guī)則要簡(jiǎn)單實(shí)用。因此,: 堿基編碼方式字符編碼CTAG數(shù)字編碼01110010: 不同堿基對(duì)對(duì)應(yīng)的編碼方式AATACCGCATTTCGGG00001100010110010011111101101010AGTGCTGAACTCCAGT00101110011110000001000101001011本文采用的DNA數(shù)字編碼技術(shù)具有許多的優(yōu)勢(shì):(1)體現(xiàn)了堿基互補(bǔ)配對(duì)的生物特性。五、問題二的分析與建模在問題二中,給定了1000個(gè)染色體片段樣本分別在9445個(gè)位點(diǎn)上的編碼信息,其中,這1000個(gè)樣本有500個(gè)來自正常樣本,500個(gè)來自患有A病樣本。在尋找特征位點(diǎn)中,常用的方法有遺傳算法(Genetic Algorithms, GA)[3]、決策樹(Decision tree, DT)[4]方法及多重對(duì)應(yīng)分析(Multiple correspondence analysis,MCA)[5]。由于CNN避免了對(duì)圖像復(fù)雜的前期預(yù)處理,可以直接輸入原始圖像,特別是其強(qiáng)大的自動(dòng)學(xué)習(xí)特征能力,相比傳統(tǒng)的特征設(shè)計(jì)而言,其人為干擾因素小,因此,近年來,CNN已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)。 建立的卷積神經(jīng)網(wǎng)絡(luò)模型,包括卷積層、池化層和分類層,其中卷積層和池化層是卷積神經(jīng)網(wǎng)絡(luò)的核心組成部分。一個(gè)卷積層的一個(gè)特征輸出可以表示為: (1)式中表示某一卷積層的第個(gè)輸出,χ表示待卷積圖像,分別表示卷積核的權(quán)值和偏置,對(duì)單個(gè)卷積核而言,采取權(quán)值共享方式(即W、b均相同)。 單個(gè)卷積核對(duì)輸入圖像卷積處理池化層:池化層主要對(duì)卷積層進(jìn)行特征處理,具有減小圖像分辨率及保持圖像全局特征的能力。由于特征圖的變長(zhǎng)不一定是2的倍數(shù),所以在邊緣處理上也有兩種方案:。 池化處理分類層:分類層可看為一個(gè)普通神經(jīng)網(wǎng)絡(luò)的輸出層,輸出層節(jié)點(diǎn)個(gè)數(shù)為類別數(shù)。卷積的概念己經(jīng)比較成熟,通過卷積核不斷對(duì)圖像進(jìn)行卷積,每個(gè)卷積核相當(dāng)于一個(gè)特征提取器,最終卷積得到一系列特征圖。 反卷積運(yùn)算反卷積:在卷積神經(jīng)網(wǎng)絡(luò)中,反卷積被用來可視化卷積網(wǎng)絡(luò),從像素級(jí)別上理解網(wǎng)絡(luò)每層學(xué)習(xí)到的特征圖像。由池化層到上層的重構(gòu)過程為反池化,由于池化過程不可逆,所以反池化只是正常池化的一種近似;即通過記錄正常池化時(shí)的位置,以其他位置置0的方式來重構(gòu)上層特征。展示了將其數(shù)字編碼對(duì)應(yīng)到數(shù)字圖像中的過程。在建立的模型中,網(wǎng)絡(luò)各層輸出大小及各層卷積核、。 網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)置項(xiàng)目參數(shù)說明學(xué)習(xí)率MomentumMinibatchsize8Dropout其中,Maxpool6層采取Dropout[8]技術(shù),讓網(wǎng)絡(luò)學(xué)習(xí)到的特征更具稀疏性。其中左側(cè)為正常樣本統(tǒng)計(jì)得出的激活區(qū)域,右側(cè)為A疾病樣本統(tǒng)計(jì)得出的激活區(qū)域。因此,我們分別選出1000個(gè)樣本中相對(duì)應(yīng)位置的15個(gè)位點(diǎn)的堿基對(duì),組成100015的堿基對(duì)樣本,按照問題一中的編碼方式,我們同樣可得到1000(154)的數(shù)據(jù)樣本,其中這1000個(gè)樣例中,500個(gè)位正常樣本,500個(gè)位患病樣本。 各分類器以15個(gè)致病位點(diǎn)為特征得到的識(shí)別率分類算法識(shí)別率LDA%SVM%RF%NBC%Adaboost%,5種分類算法在10折交叉驗(yàn)證中,識(shí)別率均達(dá)到了80%以上,說明了本模型篩選出來的致病位點(diǎn)是有效的。如果當(dāng)某個(gè)基因包含的位點(diǎn)集合中的一個(gè)或幾個(gè)位點(diǎn)屬于我們已經(jīng)找到的致病位點(diǎn)集合,那么我們認(rèn)為該基因與疾病相關(guān)。問題二認(rèn)為疾病由致病位點(diǎn)影響,而在實(shí)際中,科研人員往往把相關(guān)的性狀或疾病看成一個(gè)整體,然后來探尋與它們相關(guān)的位點(diǎn)或基因。分別求解10種性狀所對(duì)應(yīng)的相關(guān)位點(diǎn),以第一種性狀為例進(jìn)行說明。 標(biāo)簽為0的位點(diǎn)相加特征圖 為了體現(xiàn)標(biāo)簽0和1的特征位點(diǎn)差別,所以將標(biāo)簽為0的位點(diǎn)相加特征圖減去標(biāo)簽為1的位點(diǎn)相加特征圖,如下圖所示。 與性狀1相關(guān)聯(lián)的位點(diǎn)分布圖,我們可知,與性狀1相關(guān)聯(lián)的位點(diǎn)一共有14個(gè),它們的位置分別是第2482582682682973193963963964265606136988219個(gè)位點(diǎn)。 采用LDA、SVM、RF、NBC、Adaboost分類識(shí)別10種性狀的識(shí)別率 采用LDA分類識(shí)別10種性狀的識(shí)別率性狀12345678910識(shí)別率(%) 采用SVM分類識(shí)別10種性狀的識(shí)別率性狀12345678910識(shí)別率(%) 采用RF分類識(shí)別10種性狀的識(shí)別率性狀12345678910識(shí)別率(%) 采用NBC分類識(shí)別10種性狀的識(shí)別率性狀12345678910識(shí)別率(%) 采用Adaboost分類識(shí)別10種性狀的識(shí)別率性狀12345678910識(shí)別率(%),采用5種不同的分類器對(duì)其進(jìn)行識(shí)別,識(shí)別率均高于80%,從而可以說明,我們提取的位點(diǎn)是與10種性狀相關(guān)聯(lián)的。對(duì)于問題二、問題三,本文建立了卷積神經(jīng)網(wǎng)絡(luò)模型,關(guān)于遺傳疾病和性狀位點(diǎn)的分析中,常用的算法有遺傳算法(Genetic Algorithms,GA)、決策樹(Decision tree,DT)及多重對(duì)應(yīng)分析(Multiple correspondence analysis,MCA)。本文延續(xù)問題二的卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)模型對(duì)10個(gè)性狀分別尋找相關(guān)位點(diǎn)。參考文獻(xiàn)[1] Ellis, Nathan A. DNA helicases in inherited
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1