freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù)畢業(yè)論文-預(yù)覽頁

2025-08-08 21:28 上一頁面

下一頁面
 

【正文】 。連云港是中國江蘇省的一個城市,靠近上海。例如,每個病人可具有他 /她的個人健康簡況,由所有他 /她的臨床與每個臨床訪問相關(guān)聯(lián)的記錄組成。他去醫(yī)院進(jìn)行診斷之前,希望通過互聯(lián)網(wǎng)初步診斷,這樣就能知道他可能患有哪種疾病。因此,當(dāng)李某去醫(yī)院進(jìn)行診斷時,將花費李和醫(yī)生雙方更少的時間做出正確的處理,從而提高診斷效率。另一個是如何提取有用的診斷知識來幫助李從大量檢索出來的醫(yī)療記錄中弄清楚可能感染了什么疾病。具體來說,一個分布式基于 Lucene 搜索集群被設(shè)計出來旨在 提供高并發(fā)和可擴(kuò)展的在線醫(yī)療記錄檢索,數(shù)據(jù)分析和隱私保護(hù)功能。然后醫(yī)療記錄匹配用戶的疾病癥狀 ,性別和年齡在步驟 2 中檢索。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 3 本文的組織結(jié)構(gòu) 本文的其余部分安排如下?;谠朴嬎憧蚣艿募彝ピ\斷服務(wù)的評價將在第 5 部分被討論。 2 初步知識 在本節(jié)中,預(yù)備知識將被討論,來介紹醫(yī)療記錄和在基于云的架構(gòu)中應(yīng)用的一些技術(shù)。 ( 2)患者簡況:患者簡況通常包括病人的病史,包括疾病史,手術(shù)史,輸血史,以及過敏史等等。 一般來說,在日常的診斷中,患者的疾病通常是由他 /她的疾病的癥狀,以及他 /她的年齡和性別確定的。 Bahga and Madisetti, 20xx)是一個云計算框架,用來運行內(nèi)置商用硬件大型集群應(yīng)用程序。 圖 1 一個 XML 醫(yī)療記錄的例子 ( 2) MapReduce:MapReduce 是并行數(shù)據(jù)處理模型 ,該模型由兩個階段組成 :Map 和 Reduce。當(dāng)所有的映射任務(wù)完成 ,減少階段開始的中間數(shù)據(jù)具有相同關(guān)鍵是聚合。 在我們的提案中 ,HDFS 被采用到分布式存儲 Lucene 文件和索引文件。索引是負(fù)責(zé)建立索引文件從最初的文件轉(zhuǎn)化 Lucene 的文件,以方便快速上網(wǎng)查詢。首先 ,醫(yī)療記錄通過標(biāo)準(zhǔn) Lucene APIs 轉(zhuǎn)換為多個 Lucene 文檔。 3 云計算框架下的家庭診斷服務(wù) 應(yīng)用場景 在本文中,我們提出了一個基于云計算的框架來實現(xiàn)家庭診斷服務(wù),從歷史醫(yī)療記錄中提取一些診斷的幫助提供給用戶。因此,在疾病癥狀點陣的幫助下,目標(biāo)用戶很容易排除不可能的疾病而選擇感興趣的。從大規(guī)模和不斷增長的醫(yī)療記錄中搜索類似病歷需要按需數(shù)據(jù)存儲模型和彈性可擴(kuò)展性以管理高峰期進(jìn)入家庭診斷服務(wù)的權(quán)限。 表 1 基于云計算架構(gòu)的關(guān)鍵術(shù)語 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 6 圖 2 基于云計算架構(gòu)的家庭診斷服務(wù) 如圖 2 所示,云計算框架由兩個主要的集群組成,一個線下的 Hadoop 集群和一個在線的分布式搜索集群,它由一組四個集群和負(fù)載平衡器組成: ( 1)大規(guī)模數(shù)據(jù)存儲和并行索引建立采用離線的 Hadoop 集群。此外,四個簇以及一個負(fù)載平衡器包括在在線分布式搜索群集。( d)一個負(fù)載平衡器和一個由 K 個調(diào)度器所組成的調(diào)度集群被用于平衡用戶查詢的負(fù)載。換句話說,存儲在一排搜索節(jié)點集群中的每個節(jié)點中的索引文件組成了一個完整的索引文件。然后 ,我們?yōu)槊總€Lucene 文檔建立索引支持快速在線病歷檢索。對 XML 的醫(yī)療記錄 ,我們解析他們以建立相應(yīng)的 Lucene 文檔。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 8 圖 4 MapReduce 框架下構(gòu)建索引文件的流程圖 離線索引構(gòu)建 為了實現(xiàn)快速在線用戶查詢處理,索引文件建立時與每個 Lucene 文檔相關(guān)聯(lián)。根據(jù)分布式搜索集群中搜索節(jié)點的列的數(shù)量 (., N),每個映射節(jié)點會將索引文件分為 N 個部分。 而且,我們建立了三種類型的索引文件來進(jìn)行在線醫(yī)療數(shù)據(jù)檢索,包括反向檢索,概要檢索和細(xì)節(jié)檢索。如圖 1 所示 ,癥狀的描述是一個字符串 ,由特定的分離器分離出來。大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 9 算法 1 BF 簽名計算算法 算法 1 描述了如何為一組癥狀在醫(yī)療記錄中構(gòu)建一個布隆過濾器簽名 (BF 簽名 )。此外 ,h2(熱 )= 6,h2(咳嗽 )= 2,h2(呼吸困難 )= 9。 當(dāng)一個用戶輸入一組癥狀,它的簽名首先會由算法 1 生成,并且與每個醫(yī)療記錄 dS 的 BF 簽名相比較,如果 dS ∧ qS = qS ,那么 dS 可能滿足用戶的需求。每個值都包括一組 CR ids(臨床數(shù)據(jù)的 cIDs )和將被檢索的原始的癥狀集合的 ID;然而關(guān)鍵是這些原始癥狀集合的 BF 簽名。 概要檢索文件。 細(xì)節(jié)檢索文件。同時,為幫助目標(biāo)用戶做出更準(zhǔn)確的判斷 ,Lucene 文檔中的字段 ,如患者的年齡和性別 ,癥狀 ,診斷結(jié)果 ,以及所提供的治療醫(yī)師應(yīng)該返回供用戶參考使用。 圖 5 三種索引文件的數(shù)據(jù)結(jié)構(gòu) 在線分布式搜索集群 分布式搜索集群的關(guān)鍵組件 如圖 2 所示,基于 Lucene 的在線分布式搜索集群由五個主要組件組成,分布式搜索集群 = {負(fù)載平衡器 ,調(diào)度集群,搜索節(jié)點集群 ,集群數(shù)據(jù)分析 ,訪問控制集群 }。選擇規(guī)則通常是依賴于硬件 ,這里不做討論。當(dāng)醫(yī)療記錄被返回,它會合并檢索結(jié)果并把合并的結(jié)果轉(zhuǎn)發(fā)給數(shù)據(jù)分析集群的數(shù)據(jù)分析節(jié)點以建立疾病癥狀大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 11 點陣。節(jié)點選擇算法將在 節(jié)中討論。對于每次用戶查詢,一個搜索節(jié)點會被調(diào)度程序從每一列中選取以進(jìn)行醫(yī)療記錄檢索。與相關(guān)的醫(yī)療記錄相聯(lián)系,可以提取疾病分類和疾病癥狀。 ( 5)訪問控制集群 正如上述節(jié)中所討論的 ,類似的醫(yī)療記錄返回給目標(biāo)用戶作為一個更詳細(xì)的家庭診斷依據(jù)。而且,對于每個用戶域,細(xì)節(jié)檢索文件的字符串會被相應(yīng)地歸入靜態(tài)域和動態(tài)域。索引文件會記錄用戶 ID 和相關(guān)的用戶域之間的關(guān)系。調(diào)度集群大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 12 和數(shù)據(jù)分析集群會執(zhí)行家庭診斷服務(wù)。不失一般性,搜索節(jié)點集群的節(jié)點選擇將被討論以說明動態(tài)節(jié)點選擇算法的合理性。而且這 N 個最小堆棧與搜索節(jié)點集群的 N 列相對應(yīng),而對于每個最小堆棧, M 就是每列中的搜索節(jié)點數(shù)。在每次節(jié)點選擇循環(huán)中,調(diào)度程序會把查詢轉(zhuǎn)發(fā)給每列中 SFR ij 最小的搜索節(jié)點 ij,并且 SFR ij 會增加 1。 算法 2 節(jié)點選擇算法 4 家庭診斷服務(wù)的實現(xiàn) 在這個部分,我們將討論基于云計算框架的家庭診斷服務(wù)的實現(xiàn)。在從目標(biāo)用戶收到相關(guān)聯(lián)的一組癥狀查詢 ,負(fù)載平衡器將轉(zhuǎn)發(fā)查詢給某個調(diào)度程序。 步驟 4 返回結(jié)果中隱私信息的過濾 在這個子步中 ,醫(yī)療記錄中病人的隱私信息會根據(jù)目標(biāo)用戶的訪問權(quán)限被過濾。 定義 3(用戶查詢)一次用戶查詢可以定義為一個三元組(基本信息,疾病癥狀)。 示例(用戶查詢)用戶查詢可以是 =({性別 =女 ,年齡 =成人 },{癥狀 = {發(fā)燒、大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 15 咳嗽 } })。同時基本信息過濾也會運行以過濾一些男性的或非成年病人的記錄。( 3)通過個人數(shù)據(jù)簽名,用戶查詢的布隆簽名可以通過“ OR”操作計算出來。從形式上看,算法 3 說明了醫(yī)療記錄檢索的執(zhí)行過程。 (Belohlavek and Vychodil, 20xx。然后 ,三個步驟會進(jìn)行以分析具有相同癥狀的疾病之間的關(guān)系 ,即形式內(nèi)容構(gòu)建、形式概念 計算以及疾病癥狀點陣計算。 當(dāng)集合是有限的,內(nèi)容就可以通過一個交叉表來指定。交叉表的行代表疾病,列代表癥狀,符號√代表的是一個癥狀是否適用于一種疾病的一種二進(jìn)制關(guān)系。E 的共同癥狀特征 CF可以被定義為: }),(,|f{)( 39。F 的共同疾病 CE 可以被定義為: }),(,|e{)( 39。這些集群被稱為形式概念。39。39。 FE 概念中, 39。39。E 疾病集所共有的癥狀集合是 39。并且 {發(fā)燒、咳嗽 }在 {胸膜炎、結(jié)核、流感、肺炎 } 中都會出現(xiàn)。 疾病癥狀點陣計算 為了使得 節(jié)中計算得到的形式概念的層次關(guān)系可視化,一個偏序的關(guān)系揭示了具有相同癥狀的疾病之間的關(guān) 系和其底層結(jié)構(gòu)。根據(jù)定義 8,{胸膜炎 }是 {肺炎、胸膜炎 }的一個子集 ,而 {咳嗽、發(fā)熱、胸痛、呼吸困難 }也是 {咳嗽、發(fā)熱、胸痛、呼吸困難、胸悶 }的一個子集。它可以被哈斯圖所代替。診斷路徑示例是用紅色突出顯示在圖 8(b)。然后他 /她就可以檢查每一個標(biāo)識了“發(fā)燒”和“咳嗽”的診斷路徑以查看是否有其他有用的癥狀來區(qū)分這些可能的疾病。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 19 算法 4 家庭診斷服務(wù)的數(shù)據(jù)分析算法 返回結(jié)果中的隱私信息過濾 為了幫助用戶對他 /她的疾病有更詳細(xì)的信息 ,我們認(rèn)為 ,每個疾病關(guān)聯(lián)的醫(yī)療記錄也應(yīng)該呈現(xiàn)給目標(biāo)用戶。 (1)具有最小的服務(wù)錯誤率值得訪問控制節(jié)點被選中并通過利用節(jié)點選擇算法來進(jìn)行隱私信息的過濾。因此,在用戶訪問權(quán)限內(nèi)的動態(tài)域的會被返回給調(diào)度程序。具體來說,基于 Lucene 的分布式搜索集群是通過一系列實驗嘗試來評價的。 表 4 基于云架構(gòu)原型系統(tǒng)的配置 對于基于云計算的框架,一個私有的 Hadoop 集群被用于離線數(shù)據(jù)存儲(即Lucene 文件和索引文件)和索引構(gòu)建。圖 9 描述了原型框架。而對于每個從節(jié)點 ,都配有兩個 2TB 的磁盤。其他 3 個人電腦是用來實現(xiàn)一個調(diào)度集群、數(shù)據(jù)分析集群以及集群訪問控制的功能。 性能分析 在本節(jié)中,我們設(shè)計了 2 個測試用例對我們的提案進(jìn)行性能測試。把醫(yī)療記錄轉(zhuǎn)換為 Lucene 文檔后, Lucene文檔的大小也是 14GB。Ao et al .,20xx)被用于反向索引壓縮 。每一行的第 i個 (1≤ i≤ N)搜索節(jié)點包含第 i個 (1≤ i≤ N)索引碎片。此外,第 i次試驗中,第 i個搜索節(jié)點會被初始化來進(jìn)行醫(yī)療記錄檢索。 當(dāng) N≤3,每個搜索節(jié)點的 RAM(2GB)小于索引碎片的大小 ( 2GB)。然而 ,這并不意味著搜索節(jié)點越多 ,搜索節(jié)點就有更好的性能。因此 ,添加更多的搜索節(jié)點將會導(dǎo)致資源浪費。我們會進(jìn)行 6 次試驗來評估相對于不同的 M 值時的可擴(kuò)展性。原因是索引文件的大小是固定的 2G(RAM)和 CPU 不必因為 I / O 交換操作浪費大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 23 時間。然而 ,這并不意味著 M 越大 ,搜索集群的性能越好。例如 ,在這個測試用例中 ,M = 3 是最優(yōu)選擇??傊?,通過搜索節(jié)點集群的可擴(kuò)展性 ,我們的云計算框架可以實際應(yīng)用中達(dá)到最優(yōu)的性能。他想獲得一些關(guān)于他的疾病的預(yù)備知識,這樣他就可以知道他應(yīng)該在醫(yī)院的哪一部門提前預(yù)約。對于疾病癥狀 ,選擇“呼吸困難”和“咳嗽”。根據(jù)我們的檢索結(jié)果 ,有 49 個醫(yī)療記錄與李的查詢相匹配。 由于本文篇幅的限制 ,這里我們重點討論數(shù)據(jù)分析步驟如何建立癥狀點陣以及李如何使用疾病癥狀點陣來判斷他感染了哪種疾病。對于這 7 種疾病 ,都包含“呼吸困難”和“咳嗽”癥狀。 圖 11 疾病癥狀點陣的運行示例 疾病癥狀點陣計算 對于這 11 個概念,疾病癥狀點陣會通過偏序關(guān)系來計算,如定義 8 中所示。為了判斷他可能感染了哪種疾病 , ,李可以查看與一組癥狀和疾病結(jié)果相關(guān)的每個診斷路徑。此外 ,在我們的設(shè)計中 ,在疾病癥狀點陣中對于 每個疾病 ,有超鏈接可以到相應(yīng)的醫(yī)療記錄。處理大數(shù)據(jù)的挑戰(zhàn)主要體現(xiàn)于大規(guī)模數(shù)據(jù)存儲和高效知識挖掘技術(shù)。此外,作者在 (Chandramouli et al., 20xx)中提出了一個基于云架構(gòu)的過程模型稱為 Prism來幫助數(shù)據(jù)科學(xué)家從大的探索性數(shù)據(jù)中執(zhí)行漸進(jìn)采樣。比如健康庫 (HealthVault, 20xx。在 (Hsu et al., 20xx)中,討論了一種老年人 護(hù)理指導(dǎo)關(guān)于如何通過老年人學(xué)和老年醫(yī)療體系整合不同的領(lǐng)域與合作。盡管解決的問題千差萬別,但是提供一種普遍的醫(yī)療服務(wù),改善醫(yī)療服務(wù)使我們的共同目標(biāo)。這些知識會被存儲在計算機(jī)中,當(dāng)需要的時候,用戶可以訪問計算機(jī)來獲得具體的建議。同時,這個結(jié)果被存儲在糖尿病決策知識庫以作為未來診斷的依據(jù)。然而,我們并不是把知識作為專家經(jīng)驗存儲在計算機(jī)系統(tǒng)中以備未來使用。 而且,隱私問 題是醫(yī)療數(shù)據(jù)應(yīng)用的前提,這引起了許多研究人員的注意。在這些面向隱私的研究工作中,他們假定第三方服務(wù)提供者是不值得信賴的。通過基于云的架構(gòu),家庭診斷服務(wù)通過歷史醫(yī)療記錄讓用戶在家就獲得診斷幫助。 目前,只有一個基于云架構(gòu)的原型通過少量的呼吸醫(yī)學(xué)部門的醫(yī)療記錄被實現(xiàn)了。 致謝 本文部分受到中國國家科學(xué)基金會編號 91318301,和 61321491 的撥款;科技部的國家關(guān)鍵技術(shù)研發(fā)項目下 20xx bak21b06
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1