freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

腫瘤信息基因啟發(fā)式寬度優(yōu)先搜索算法研究(已改無(wú)錯(cuò)字)

2022-10-17 20:03:48 本頁(yè)面
  

【正文】 +HBSA+SVM、Wilcoxon+HBSA+SVM 和 KruskalWallis+HBSA+SVM,分別把這三種方法命名為方法 方法 2 和方法 3。表 3 描述了 采用三種實(shí)驗(yàn)方法 分別 對(duì)三種腫瘤樣本集的閾值設(shè)定情況,現(xiàn)以 采用 方法 1 對(duì) Colon Tumor 數(shù)據(jù)集進(jìn)行分類(lèi) 加以說(shuō)明: 首先采用 BFSC 記分準(zhǔn)則選出前 300 個(gè)信息基因,然后采用 HBSA+SVM 算法 計(jì)算 每?jī)蓚€(gè)基因子集對(duì)樣 本的分類(lèi)情況,設(shè)定閾值為 90%,則分類(lèi)準(zhǔn)確率大于 90%的兩基因子集共發(fā)現(xiàn) 129個(gè),再以這 129 個(gè)兩基因子集為基礎(chǔ)搜索三基因子集,發(fā)現(xiàn)分類(lèi)準(zhǔn)確率大于 閾值 95%的三基因子集共有 137個(gè),最后再以此為基礎(chǔ)搜索四基因子集,發(fā)現(xiàn)分類(lèi)準(zhǔn)確率為 100%的四基因子集共有 2 個(gè),搜索結(jié)束。對(duì) 表3 中其它行的 解釋與此相同,且 所有實(shí)驗(yàn)結(jié)果都是采用 4折交叉驗(yàn)證方法獲得的 。 針對(duì)每一個(gè)腫瘤樣本集,當(dāng)算法執(zhí)行結(jié)束時(shí)便可獲得最佳信息基因子集集合 *A ,但由于 *A 中的信息基因子集是通 過(guò) 4折交叉驗(yàn)證方法獲取的,其分類(lèi)準(zhǔn)確率可能受樣本集的不同劃分的影響,所以我們還可進(jìn)一步采用全折交叉驗(yàn)證方法來(lái)評(píng)估 *A 中的信息基因子集的分類(lèi)性能以?xún)?yōu)選出更客觀的信息基因子集。 表 3 實(shí)驗(yàn)中 針對(duì)三種 腫瘤樣本 集 的閾值設(shè)定情況 實(shí)驗(yàn)方法 數(shù)據(jù)集 兩基因子集 三基因子集 四基因子集 方法 1 BFSC+HBSA+SVM Leukemia 100%( 7 個(gè)) N N Colon Tumor 90%( 129 個(gè)) 95%( 137 個(gè)) 100%( 2 個(gè)) SRBCT 82%( 216 個(gè) ) 96%( 92 個(gè)) 100%( 433 個(gè)) 方法 2 Wilcoxon+HBSA+SVM Leukemia 100%( 14 個(gè)) N N Colon Tumor 90%( 230 個(gè)) 95%( 307 個(gè)) 100%( 7 個(gè)) 方法 3 KruskalWallis+HBSA+SVM SRBCT 83%( 221 個(gè)) 96%( 93 個(gè)) 100%( 504 個(gè)) 實(shí)驗(yàn)結(jié)果 與分析 FSC 與 BFSC方法的比較 首先采用 FSC 和 BFSC 兩種 特征記分準(zhǔn)則 為每一個(gè)基因 Gg? 計(jì)算分值,然后 按每一個(gè)基因分值大小降序排列基因,并記 itop 表示排在前面的 i 個(gè)基因 所構(gòu)成的信息基因子集,圖 3 繪制了 針 對(duì) Leukemia 和Colon Tumor 兩種數(shù)據(jù)集的 )701( ?? itopi 的 4折交叉驗(yàn)證分類(lèi)準(zhǔn)確率的變化情況 。 比較發(fā)現(xiàn),對(duì)于Leukemia 數(shù)據(jù)集, 采用 BFSC 方法選出的信息基因子集的分類(lèi)性能略 優(yōu)于 FSC,盡 管兩種方法都能選 出 CV準(zhǔn) 確率高達(dá) 100% 的信 息基因子集 ,但采用 BFSC 方法選出的獲 得 100%CV 分類(lèi)準(zhǔn)確率的信息基因子集比采 用 FSC 方 法 所獲得的要多。 對(duì)于 Colon Tumor 數(shù)據(jù)集, 采用 BFSC 方法 選出的 信息基因子集的分類(lèi)性能也是 略 優(yōu) 于 FSC 方 法 , 因?yàn)椴?用 BFSC 方法 獲 得了最高 CV 分類(lèi) 準(zhǔn)確 率為 %的 信息基因子集,但采 用FSC 方 法只獲得了最高為 %的 CV 準(zhǔn)確 率 。 因此,從總體上說(shuō),在選擇信息基因方面 BFSC 方法 略 優(yōu)于 FSC 方法,所以,我們采用 BFSC 方法首先選出前 300 個(gè) 基因 作為初選信息基因子集 *G ,然后在這 300個(gè)基因范圍內(nèi)采用 HBSA 算法進(jìn)一步精選信息基因子集。 10 圖 3 Leukemia 和 Colon Tumor 兩個(gè)數(shù)據(jù)集 的 )701( ?? itopi 的分能性能比較 實(shí)驗(yàn)結(jié)果 表 4 給出了 采用 方法 1 在三種腫瘤數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn) 所獲得的 部分實(shí)驗(yàn)結(jié)果 ,表中的 C 和 ? 欄 表示分類(lèi)器 SVM( RBF) 所需要的參數(shù),其值表示 相應(yīng)基因子集獲得最高 4折交叉驗(yàn)證分類(lèi)準(zhǔn)確率時(shí)的參數(shù)取值(最佳參數(shù)對(duì)的取值 并不是唯一的) , max 欄表示 相應(yīng)基因子集獲得的最 高 4折交叉驗(yàn)證分類(lèi)準(zhǔn)確率, mean和 std 分別表示相應(yīng)基因子集 的全折交叉驗(yàn)證分類(lèi)準(zhǔn)確率和標(biāo)準(zhǔn)差 。 由 實(shí)驗(yàn)結(jié)果可知,分值高的基因組合在一起未必能獲得高的分類(lèi)準(zhǔn)確率 ,參數(shù) C 的取值可以固定為 200 以進(jìn)一步減少搜索最佳參數(shù)對(duì)的計(jì)算量 。對(duì)于 Leukemia 數(shù)據(jù)集,兩個(gè)信息基因 子集 {X95735, HG1612HT1612}和 {L09209, X68560}都獲得了 100%的全折交叉驗(yàn)證準(zhǔn)確率; 對(duì)于 Colon Tumor 數(shù)據(jù)集 ,四基因子集 {M58050,H06524,R62549,H24030}雖然獲得了100%的 4折交叉驗(yàn)證準(zhǔn)確率,但其全折交叉驗(yàn)證準(zhǔn)確率為 %,表明采用該基因子集來(lái)分類(lèi)樣本,兩類(lèi)樣本的邊界比較模糊,樣本集的不同劃分對(duì)分類(lèi)準(zhǔn)確率有一定影響,其影響程度可通過(guò) 相應(yīng)的 標(biāo)準(zhǔn)差來(lái)反映;對(duì)于 SRBCT 數(shù)據(jù)集,四基因子集 {770394, 207274, 812105, 25499}和 {629896,1435862,207274,809390}獲得了 100%的 全折 交叉驗(yàn)證準(zhǔn)確率 ,表明這兩個(gè)基因子集在分類(lèi)性能方面優(yōu)于其它 獲得了 100%的 4折交叉驗(yàn)證分類(lèi)準(zhǔn)確率的基因子集 。 表 5 給出了采用方法 2 和方法 3 所獲得的部分實(shí)驗(yàn)結(jié)果,表中欄目的含義同表 4。對(duì)比表 4 和 表 5 發(fā)現(xiàn),采用方法 2 和 3 獲得的最佳信息基因子集的數(shù)量比采用方法 1 獲得的最佳信息基因子集的數(shù)量多,所以可以 得出方法 2 和 3 略?xún)?yōu)于方法 1 的結(jié)論 , 也就是說(shuō),采用秩和檢驗(yàn)統(tǒng)計(jì)量初選信息基因的方法優(yōu)于采用 Bhattacharyya 特征記分準(zhǔn)則初選信息基因的方法。 實(shí)驗(yàn)結(jié)果與我們的假設(shè)非常吻合,表明 只需 3 或 4 個(gè)信息基因就能以很高的分類(lèi)準(zhǔn)確率分類(lèi)腫瘤樣本集的 假設(shè)是成立的。 表 4 采用方 法 1 獲 得的 部分 實(shí)驗(yàn)結(jié)果 腫瘤樣本集 序號(hào) 基因組合 4折 CV CV 準(zhǔn)確率 % C ? max mean std Leukemia 1 {M63379,Z15115} 200 100 2 {M23197,M31523} 200 100 3 {M23197,U46751} 200 100 4 {M31523,L47738} 200 100 11 5 {M31523,X62654} 200 100 6 {X95735,HG1612HT1612} 200 100 100 0 7 {L09209,X68560} 200 100 100 0 Colon Tumor 1 {R87126,H40137} 200 2 {J02854,R08021} 200 3 {J02854,R08021,U30825} 200 4 {J02854,R08021,T70062} 200 5 {J02854,R08021,H55758} 200 6 {J02854,R08021,T62947,R41866} 600 100 7 {M58050,H06524,R62549,H24030} 200 100 SRBCT 1 {812105, 52076} 200 2 {812105, 207274, 43733} 200 3 {770394, 207274, 812105, 25499} 200 100 100 0 4 {295985,769716,811000,183337} 200 100 5 {207274,770394,812105,1474955} 200 100 6 {629896,1435862,207274,809390} 200 100 100 0 7 {784224,295985,624360,824704} 200 100 注:表中針對(duì) SRBCT 數(shù)據(jù)集給出的是探針編號(hào) ,表 5 與 此相同 。 表 5 采用 方法 2 和 3 獲得的 部分 實(shí)驗(yàn)結(jié)果 Dataset 序號(hào) 基因組合 4折 CV CV 準(zhǔn)確率 % C ? max mean std Leukemia 1 {M23197, M31523} 200 100 2 {M23197, Y07604} 200 100 3 {M23197, U46751} 200 100 4 {M23197, U88666} 200 100 5 {X95735, HG1612HT1612} 200 100 100 0 6 {M31523, X62654} 200 100 7 {M31523, L47738} 200 100 8 {M31523, X85116} 200 100 9 {L09209, X68560} 200 100 100 0 10 {L09209, L07633} 200 100 11 {M63379, Z15115} 200 100 12 {X59417, Y07604} 200 100 Colon 1 {H23544, D42047} 1000 12 Tumor 2 {R87126, K03460, R08021} 200 3 {J02854, R08021,U30825} 200 4 {J02854, R08021, T70062} 200 5 {J02854, R08021, H55758} 200 6 {T60155, U09587, R08021} 800 7 {U02493, X12496, M16937} 200 8 {H06524, M58050, R62549, H24030} 200 100 9 {T60155, U09587, R08021, M58050} 200 100 10 {H24030, X12496, R08021, T51858} 200 100 11 {X12496, R08021, R67999, T70062} 400 100 12 {X12496, R08021, L28010, D00860} 200 100 SRBCT 1 {52076, 812105} 200 2 {207274, 812105, 43733} 200 3 {770394, 207274, 812105, 491565} 200 100 4 {295985, 207274, 629896, 1435862} 200 100 5 {295985, 784224, 624360, 810057} 800 100 6 {1435862, 207274, 812105, 383188} 200 100 7 {1435862, 629896, 207274, 21652} 200 100 8 {1435862, 629896, 207274, 812105} 200 100 9 {52076, 244618, 812105, 43733} 200 100 10 {377461, 207274, 812105, 25499} 200 100 11 {770394, 207274, 812105, 25499} 200 100 100 0 12 {295985, 207274, 878652, 365826} 200 100 分類(lèi)結(jié)果的可視化 分類(lèi)結(jié)果的可視化對(duì)于腫瘤的臨床診斷是很有意義的,它能幫助醫(yī)務(wù)人員以可視化的方式分析臨床樣本并積累診斷經(jīng)驗(yàn)。圖 4 繪制了 急性白血病數(shù) 據(jù)集的兩 基因 子集 {X95735, HG1612HT1612}構(gòu)成的二維散點(diǎn)圖 ,這兩個(gè)基因的全折交叉驗(yàn)證分類(lèi)準(zhǔn)確率為 100%,從圖中也能看出兩類(lèi)樣本能夠被清晰地分開(kāi),樣本邊界非常清楚。 圖 5 繪制了 結(jié)腸癌 數(shù)據(jù)集的兩 基因 子集 {J02854, R08021}構(gòu)成的二維散點(diǎn)圖 ,這兩個(gè)基因的全折交叉驗(yàn)證分類(lèi)準(zhǔn)確率為 %,由圖可知兩類(lèi)樣本并不能被清晰地分開(kāi),樣本邊界比較模糊,當(dāng)然可采用三基因子集 {J02854,R08021,U30825}來(lái)繪制三維散點(diǎn)圖, 這樣 兩類(lèi)樣本的邊界會(huì)更清晰一些 。 圖 6 繪制了 SRBCT 數(shù)據(jù)集 的三基因 子集 {207274, 812105, 43733}構(gòu)成的三維散點(diǎn)圖 ,其全折交叉驗(yàn)證分類(lèi)準(zhǔn)確率為 %,四類(lèi)樣本的邊界亦很 清楚 。 13 圖 4 急性白血病數(shù)據(jù)集的兩個(gè)基因 {X95735, HG1612HT1612}構(gòu)成的二維散點(diǎn)圖 圖 5 結(jié)腸癌 數(shù)據(jù)集的兩個(gè)基因 {J02854, R08021}構(gòu)成的二維散點(diǎn)圖 14 圖 6 SRBCT 數(shù)據(jù)集的三 個(gè)基因 {207274, 812105, 43733}構(gòu)成的三 維散點(diǎn)圖 實(shí)驗(yàn)結(jié)果的生物醫(yī)學(xué)解釋 根據(jù)生物醫(yī)學(xué)文獻(xiàn)可 知,所發(fā)現(xiàn)的許多分類(lèi)能力強(qiáng)的信息基 因多與腫瘤的發(fā)生發(fā)展存在密切聯(lián) 系,例如,基因X95735 和 M23197 是與白血病密切相關(guān)的兩個(gè)基 因 [34, 35]; 基因 M36634(Vasoactive Intestinal Peptide,VIP)則與結(jié)腸癌存在密切關(guān)系 [36, 37], VIP 可促進(jìn)結(jié)腸癌細(xì)胞 系 Lovo 和
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1