freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

提取結腸癌基因圖譜信息方法的研究-文庫吧

2025-07-03 05:46 本頁面


【正文】 ”進行無關基因的剔除。在衡量基因含有樣本分類信息多少的度量問題上,采用“信噪比”(Singal to noise ratio)指標,即: (1)其中,為基因的信噪比;、分別為該基因在正常樣本和腫瘤樣本中表達水平的均值,、為其表達水平的標準差。由式(1)可知,如果某一基因在Normal、Cancer兩個類別中的分布均值相同,那么其信噪比,該基因?qū)⒈蛔鳛椤盁o關基因”而被剔除。然而,如果該基因在兩個類別中分布的方差出現(xiàn)較大差異,比如其在Cancer中分布方差很小,而在Normal中分布方差很大,那么從生物學的角度分析,該基因很可能與結腸癌致病機理緊密相關[2] 李澤,包雷,黃英武,基于基因表達譜的腫瘤分型和特征基因的選取,生物物理學報,,pp413417(2002)。根據(jù)這種分布方差的不同仍然可以很好的進行樣本類別的判斷?;谏鲜龇治觯梢圆捎没虻腂hattacharyya距離來衡量基因中蘊含的分類信息量,即: (2)其中,位基因的Bhattacharyya距離。由式(2)可知,Bhattacharyya距離由兩部分組成:第一項體現(xiàn)了基因在兩個類別中分布均值的差異對樣本分類的貢獻;第二項體現(xiàn)了分布方差的不同對分類的貢獻。依據(jù)該距離公式,即使基因在兩類不同樣本中分布的均值相同,只要分布的方差出現(xiàn)較大的差異,仍然可以獲得較大的距離值[3] Theodoridis S,Koutroumbas Recognition, York:Academic Press,pp177179(2003)。從模式分類的角度看,基因的Bhattacharyya距離越大,含有的樣本分類信息就越多,利用該基因信息對樣本進行分類的能力也就越強。由公式(2)計算出每個基因的Bhattacharyya距離,并用SPSS軟件作出基因的Bhattacharyya距離分布的直方圖,見圖2。圖2 基因Bhattacharyya距離發(fā)布的直方圖根據(jù)基因所含樣本類別信息的多少,可以將基因分為“信息基因”和“無關基因”兩類。設為信息基因集合,為無關基因集合,則“信息基因”與“無關基因”可如下定義[4] 李穎新,劉全金,阮曉鋼,急性白血病的基因表達譜分析與亞型分類特征的鑒別,中國生物醫(yī)學工程學報,,pp240244(2005): (3) 其中,為基因,為基因的Bhattacharyya距離,為指定的Bhattacharyya距離的閾值。由圖2可知。這些基因在兩個類別中的分布,無論其均值還是方差均無明顯差異,可以作為無關基因剔除。結腸癌的基因表達譜中基因Bhattacharyya距離的詳細分布情況如表2所示。考慮到在根據(jù)“信噪比”剔除大部分無關基因的同時,還要留下一定數(shù)量的基因以提高實驗的精確度,因此,本研究選擇剔除Bhattacharyya距離在0~,%,大大縮小了決定結腸癌差異的基因范圍,同時也留下了一定數(shù)量的基因以便做進一步分析。根據(jù)表2和式(3)對信息基因與無關基因的定義知:在閾值時,即在2000個基因中,有134個基因為信息基因;,即有1866個基因為無關基因。中134個基因均在不同程度上包含了樣本的分類信息,是進一步分析的基礎。表2 基因Bhattacharyya距離發(fā)布情況Bhattacharyya距離基因個數(shù)所占百分比0~1866%~113%~20%~1% 從分類角度確定基因“標簽” 基于神經(jīng)網(wǎng)絡模型的求解(一)基本原理BP(Back Propagation)神經(jīng)網(wǎng)絡模型是目前應用最為廣泛和成功的神經(jīng)網(wǎng)絡之一。該模型是在上個世紀80年代由Runelhart和McCelland為首的科學家小組提出的[5] 吳昌友,神經(jīng)網(wǎng)絡的研究及應用,東北農(nóng)業(yè)大學,2007。BP算法的基本思想是,學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。正向傳播時,輸入樣本從輸入層傳入,經(jīng)各隱含層處理后,傳向輸出層,若輸出層的實際輸出與期望的輸出不符合要求,則轉(zhuǎn)入誤差的反向傳播階段。誤差反向傳播是將輸出誤差以某種形式通過隱含層向輸入層逐層反向傳播,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元的依據(jù)。這種信號正向傳播與誤差反向傳播的各層權值調(diào)整過程,是周而復始地進行的。權值不斷調(diào)整的過程,也就是網(wǎng)絡的學習訓練過程。此過程一直進行到網(wǎng)絡輸出的誤差減少到可接受的程度或進行到預先設定的學習次數(shù)為止。(二)BP神經(jīng)網(wǎng)絡結構BP網(wǎng)絡與線性閾值單元組成的多層感知器阿絡結構完全相同,只是各隱節(jié)點的激活函數(shù)使用了Sigmoid函數(shù)。BP網(wǎng)絡輸出節(jié)點的激活函數(shù)根據(jù)應用的不同而異。如果BP網(wǎng)絡用于分類,則輸出節(jié)點一般用Sigmoid函數(shù)或雙曲正切函數(shù);如果多層感知器用于函數(shù)逼近,則輸出層節(jié)點用線性函數(shù)。如圖4是含有兩個隱含層的BP網(wǎng)絡結構圖。 圖3 含有兩個隱含層的BP網(wǎng)絡結構圖(三)培訓率為70%時的神經(jīng)網(wǎng)絡模型求解。當培訓率為70%、培訓時間為15分鐘的條件下,輸出結果如圖圖5和表3所示。圖4 培訓率為70%時的網(wǎng)絡圖表3 培訓率為70%時的自變量重要性ImportanceNormalized ImportanceImportanceNormalized ImportanceG22%G1067%G26%G1073%G31%G1115%G43%G1137%G47%G1153%G62%G1208%G66%G1221%G72%G1227%G75%G1256%G100%G1263%G127%G1293%G138%G1325%G141%G1328%G147%G1334%G163%G1340%G187%G1346%G241%G1381%G245%G1406%G249%G1411%G267%G1414%G281%G1423%G295%G1442%
點擊復制文檔內(nèi)容
教學教案相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1