freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

從專家診病模型實例理解智慧醫(yī)療大數(shù)據(jù)文庫docxdocx(編輯修改稿)

2024-08-13 16:38 本頁面
 

【文章內(nèi)容簡介】 出每種分類變量的取值及每種取值的個數(shù)。比如,從這里我們可以看出藥物字段一共包含五種取值,且出現(xiàn)最多的是Y藥物。在這里目標變量為分類型,因此只能選擇分類預測類模型,如決策樹、邏輯回歸等。表2 數(shù)據(jù)描述預建模接下來便是嘗試建模,看看建模效果。圖3 預建模首先,從數(shù)據(jù)準備列轉(zhuǎn)換菜單下選擇類型轉(zhuǎn)換節(jié)點。由于性別、血壓、膽固醇三個字段實際存儲類型該是字符型,但這里是整型,因此為了便于以下分析,使用類型轉(zhuǎn)換節(jié)點將它們的類型從整型轉(zhuǎn)化為字符型。配置如下:其次,使用類型節(jié)點指定目標變量的角色,將藥物的角色設為目標。再次,從數(shù)據(jù)準備的行菜單中選擇分區(qū)節(jié)點。使用分區(qū)節(jié)點可以將數(shù)據(jù)集分成測試集和訓練集,訓練集用于訓練模型,測試集用于測試模型。配置如下:注意,如果選中使用隨機種子( ),則每次運行分區(qū)結(jié)果將會是一樣的,否則每次運行的結(jié)果將會不同,進而建模的結(jié)果也會不同。通常是選擇選中該項,使得訓練集和測試集都固定。另外,此處還有個很重要的用途,不選中 ,多次運行可以測試數(shù)據(jù)分布規(guī)律和模型穩(wěn)定性。還有一點要注意,這里分區(qū)即把數(shù)據(jù)集隨機分成兩份,通常訓練集要比測試集大,通常分為5:5,6:4,7:3,8:2,9:1。數(shù)據(jù)集越小,訓練集應該分的更多,原因是要保證模型的穩(wěn)定性,參與訓練的數(shù)據(jù)要足夠多。實際中,各種比例都會嘗試,目的有二:一是選擇最佳的比例,二是測試模型的穩(wěn)定性。然后,選擇分類預測節(jié)點,因為目標變量(藥物)為分類型。此處我們重點學習決策樹算法,所以就先選擇決策樹算法節(jié)點。節(jié)點連接如上圖3所示,在決策樹(訓練)節(jié)點配置中選擇目標變量藥物。其中,決策樹(訓練)節(jié)點連接分區(qū)節(jié)點。決策樹訓練節(jié)點可以采用默認配置,無需修改配置,如下:最后,使用分類評估節(jié)點評估模型的準確性。配置如下圖所示:評估結(jié)果:表3 模型評估1從表3中可以看出,模型測試準確度為95%,誤判5%。預建模的目的是為了從整體判斷現(xiàn)有變量與目標變量的相關性,以便可以根據(jù)經(jīng)驗預估最終
點擊復制文檔內(nèi)容
外語相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1