freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

提取結(jié)腸癌基因圖譜信息方法的研究doc(更新版)

2025-08-26 05:46上一頁面

下一頁面
  

【正文】 0 cancer220 0 cancer230 0 cancer240 0 cancer250 0 cancer260 0 cancer270 0 cancer280 0 cancer290 0 cancer300 0 cancer310 0 cancer320 0 cancer330 1 cancer340 0 cancer350 0 cancer360 0 cancer370 1 cancer380 0 cancer390 0 cancer400 0 由表9的運(yùn)算結(jié)果可知,按照該二分類Logistic回歸模型進(jìn)行預(yù)測,22例正常樣本中有1例被誤識為癌癥樣本,%(21/22);40例癌癥樣本中有2例被誤識為正常樣本,正確識別率達(dá)到95%(38/40),%(59/62)。根據(jù)“信噪比”的定義可知,信噪比的公式為: (10)現(xiàn)將給定結(jié)腸癌的數(shù)據(jù)和運(yùn)用神經(jīng)網(wǎng)絡(luò)模型篩選出來的13個特征基因的數(shù)據(jù)代入式(10)進(jìn)行計(jì)算,得到表14的數(shù)據(jù):總體均值;樣本均值表14 樣本方差總體信噪比樣本信噪比G1983 G1750 G444 G391 G1730 G22 G31 G1839 G163 G1221 G187 G1924 G1798 一般地,信噪比越大,說明混在基因里的噪聲越小。表10 模型系數(shù)的綜合檢驗(yàn)表表11 模型匯總表表12 二元邏輯回歸分類表表13 方程中的變量由表12的分類表可知,運(yùn)用二分類Logistic回歸模型處理包含40個腫瘤和22個正常樣本的結(jié)腸癌微陣列數(shù)據(jù),按照步驟3的方式提取特征基因,其分類檢驗(yàn)正確率最高,%,此時提取的3個特征基因分別為G49G1346和G1582。與最小二乘法不同的是,這里參數(shù)估計(jì)不存在精確解,只能通過迭代法獲得極大似然估計(jì)的數(shù)值解。 基于二分類Logistic回歸模型的求解(一)基本原理設(shè)為一個隨機(jī)變量,且服從兩點(diǎn)分布。當(dāng)培訓(xùn)率為70%、培訓(xùn)時間為15分鐘的條件下,輸出結(jié)果如圖圖5和表3所示。這種信號正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過程,是周而復(fù)始地進(jìn)行的??紤]到在根據(jù)“信噪比”剔除大部分無關(guān)基因的同時,還要留下一定數(shù)量的基因以提高實(shí)驗(yàn)的精確度,因此,本研究選擇剔除Bhattacharyya距離在0~,%,大大縮小了決定結(jié)腸癌差異的基因范圍,同時也留下了一定數(shù)量的基因以便做進(jìn)一步分析。依據(jù)該距離公式,即使基因在兩類不同樣本中分布的均值相同,只要分布的方差出現(xiàn)較大的差異,仍然可以獲得較大的距離值[3] Theodoridis S,Koutroumbas Recognition, York:Academic Press,pp177179(2003)。1999年,Golub等在進(jìn)行急性白血病的基因表達(dá)譜分析與亞型分類特征的鑒別時,曾以“信噪比”指標(biāo)作為衡量基因?qū)颖痉诸愗暙I(xiàn)大小的量度,成功的提取了信息基因、大大縮小了決定急性白血病亞型差異的基因范圍[1] Guyon I , Weston J , Barnhill S , et al . Gene selection for cancer classification using support vector machines , Machine Learning ,pp389422(2000).。樣本集的數(shù)據(jù)組織方式如表1所示。在基因譜中存在無關(guān)基因,且影響腫瘤的基因是少數(shù)的幾個。如果可以在分子水平上利用基因表達(dá)分布圖準(zhǔn)確地進(jìn)行腫瘤亞型的識別,對診斷和治療腫瘤具有重要意義。依據(jù)給定的62個樣本,%。 全國第七屆研究生數(shù)學(xué)建模競賽題 目 提取結(jié)腸癌基因圖譜信息方法的研究摘 要:本研究在分析基因表達(dá)譜數(shù)據(jù)特征的基礎(chǔ)上,研究有效提取基因圖譜信息的方法。將G49G134G1582三個基因數(shù)據(jù)代入該模型,當(dāng)時,可以判斷為正常,%;當(dāng)時,可以判斷為不正常,%。隨著大規(guī)模基因表達(dá)譜技術(shù)的發(fā)展,人類各種組織的正常的基因表達(dá)已經(jīng)獲得,各類病人的基因表達(dá)分布圖都有了參考的基準(zhǔn),因此基因表達(dá)數(shù)據(jù)的分析與建模已經(jīng)成為生物信息學(xué)研究領(lǐng)域中的重要課題。面對有效提取基因圖譜信息這樣前沿性課題,需要研究解決下列問題:由于基因間相關(guān)性很強(qiáng),如何選擇最好的分類因素,從給定數(shù)據(jù)中找出與特定腫瘤相關(guān)的基因?樣本相對基因數(shù)較少,為避免小樣本學(xué)習(xí)問題,根據(jù)結(jié)腸癌數(shù)據(jù)如何減少基因特征以確定相應(yīng)基因?噪聲對基因表達(dá)譜的影響不同,建立噪聲模型分析給定數(shù)據(jù)中噪聲能否對確定基因標(biāo)簽產(chǎn)生有利影響?腫瘤研究中通常已知若干基因和某種腫瘤有密切關(guān)系,如何利用確定基因建立診斷腫瘤的模型?2 模型假設(shè)某種特定的腫瘤的致癌基因之間具有很大的相關(guān)性。其中22個樣本被診斷為正常樣本(Normal),40個被診斷為腫瘤樣本(Cancer)。因此,必須對這些“無關(guān)基因”進(jìn)行剔除。由式(2)可知,Bhattacharyya距離由兩部分組成:第一項(xiàng)體現(xiàn)了基因在兩個類別中分布均值的差異對樣本分類的貢獻(xiàn);第二項(xiàng)體現(xiàn)了分布方差的不同對分類的貢獻(xiàn)。結(jié)腸癌的基因表達(dá)譜中基因Bhattacharyya距離的詳細(xì)分布情況如表2所示。誤差反向傳播是將輸出誤差以某種形式通過隱含層向輸入層逐層反向傳播,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元的依據(jù)。 圖3 含有兩個隱含層的BP網(wǎng)絡(luò)結(jié)構(gòu)圖(三)培訓(xùn)率為70%時的神經(jīng)網(wǎng)絡(luò)模型求解。因此,選擇其他模型進(jìn)行特征基因的篩選。通過采用極大似然法來估計(jì)參數(shù)。(三)134個基因進(jìn)行二分類Logistic模型求解根據(jù)基因Bhattacharyya距離的發(fā)布情況,對其進(jìn)行二分類Logistic回歸分析,輸出結(jié)果如表10至表13所示。 建立噪聲模型根據(jù)1999年Golub在《Science》發(fā)表的文章可知,基因表達(dá)譜中不可避免地含有噪聲,有的噪聲強(qiáng)度甚至較大,對含有噪聲的基因表達(dá)譜提取信息時會產(chǎn)生偏差。當(dāng)被檢出為正常樣本時,的取值為1;當(dāng)被檢出為腫瘤樣本時,的取
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1