freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

從專家診病模型實例理解智慧醫(yī)療大數(shù)據(jù)文庫docxdocx-閱讀頁

2025-08-01 16:38本頁面
  

【正文】 第一種最難以實現(xiàn),一般企業(yè)的數(shù)據(jù)是有限的,企業(yè)內(nèi)部可用數(shù)據(jù)及外部可用網(wǎng)絡(luò)數(shù)據(jù),在項目需求調(diào)研階段就應(yīng)該明確,而企業(yè)外部行業(yè)數(shù)據(jù)難以獲取。而第三種方法才是項目中最可行,也是最重要的辦法。而優(yōu)化輸入最重要的環(huán)節(jié)就是數(shù)據(jù)探索。分析變量的相關(guān)性可以使用相關(guān)性計算,也可以使用圖形化分析,而后者最直觀常用。分析兩個數(shù)值型變量可以使用散點圖。通過分析,血壓和藥物字段有著強相關(guān)性,因為從圖中可以看出使用藥物B和藥物A的人都是高血壓(3表示高血壓,2表示正常,1表示低血壓),使用藥物C的人都是低血壓,這種很明細(xì)的規(guī)律反映出兩個字段間存在很強的相關(guān)關(guān)系,如下圖所示:同理,膽固醇和選擇藥物之間也有一定相關(guān)性,而性別和選擇藥物相關(guān)性不大,如下圖所示:接下來分析數(shù)值型字段的相關(guān)性,從圖中可以看出血液中的鈉和鉀相關(guān)性很弱或者沒有。就此圖來說,散點圖中的每一個點表示一個病例,而我們最想知道的還不是鈉和鉀的相關(guān)性,而是兩者與藥物的相關(guān)性,因為藥物才是我們分析的目標(biāo)。因此,我們使用藥物作為顏色區(qū)分,重新修正散點圖。這是很明顯的規(guī)律,說明這里面有一種很強的關(guān)聯(lián)。因此,我們發(fā)現(xiàn)了一個很重要的變量就是鈉和鉀的比例。優(yōu)化輸入首先,使用派生字段節(jié)點或者Java代碼段節(jié)點生成鈉鉀比例字段。配置如下:過濾后預(yù)覽數(shù)據(jù)如下:重新建模模型整體評估如下:表4 模型評估2從表4中可看出,模型精度從原來的95%提升帶了100%。下面我們再來解讀一下得到的決策樹模型。再看另外一個指標(biāo)膽固醇,若膽 固醇的值為1,全部判為X藥物,則準(zhǔn)確率為100%。如果血壓為3,全部判為A藥物,%。判為A藥物, 準(zhǔn)確率為100%。在商業(yè)中建模的目的是為了商業(yè)應(yīng)用,因此不僅要保證模型的準(zhǔn)確性,更要保證模型的穩(wěn)定性。只有可以控制風(fēng)險的模型才可以使用,否則不管理論模型建的多么漂亮都是沒有實際意義的。數(shù)據(jù)挖掘最重要的不僅是得到一個模型,還有分析得出最合理的輸入變量以及給出數(shù)據(jù)質(zhì)量管理的建議。因為這是你數(shù)據(jù)挖掘思路的
點擊復(fù)制文檔內(nèi)容
外語相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1