freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù)畢業(yè)論文-預(yù)覽頁(yè)

 

【正文】 。連云港是中國(guó)江蘇省的一個(gè)城市,靠近上海。例如,每個(gè)病人可具有他 /她的個(gè)人健康簡(jiǎn)況,由所有他 /她的臨床與每個(gè)臨床訪問(wèn)相關(guān)聯(lián)的記錄組成。他去醫(yī)院進(jìn)行診斷之前,希望通過(guò)互聯(lián)網(wǎng)初步診斷,這樣就能知道他可能患有哪種疾病。因此,當(dāng)李某去醫(yī)院進(jìn)行診斷時(shí),將花費(fèi)李和醫(yī)生雙方更少的時(shí)間做出正確的處理,從而提高診斷效率。另一個(gè)是如何提取有用的診斷知識(shí)來(lái)幫助李從大量檢索出來(lái)的醫(yī)療記錄中弄清楚可能感染了什么疾病。具體來(lái)說(shuō),一個(gè)分布式基于 Lucene 搜索集群被設(shè)計(jì)出來(lái)旨在 提供高并發(fā)和可擴(kuò)展的在線醫(yī)療記錄檢索,數(shù)據(jù)分析和隱私保護(hù)功能。然后醫(yī)療記錄匹配用戶的疾病癥狀 ,性別和年齡在步驟 2 中檢索。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 3 本文的組織結(jié)構(gòu) 本文的其余部分安排如下?;谠朴?jì)算框架的家庭診斷服務(wù)的評(píng)價(jià)將在第 5 部分被討論。 2 初步知識(shí) 在本節(jié)中,預(yù)備知識(shí)將被討論,來(lái)介紹醫(yī)療記錄和在基于云的架構(gòu)中應(yīng)用的一些技術(shù)。 ( 2)患者簡(jiǎn)況:患者簡(jiǎn)況通常包括病人的病史,包括疾病史,手術(shù)史,輸血史,以及過(guò)敏史等等。 一般來(lái)說(shuō),在日常的診斷中,患者的疾病通常是由他 /她的疾病的癥狀,以及他 /她的年齡和性別確定的。 Bahga and Madisetti, 20xx)是一個(gè)云計(jì)算框架,用來(lái)運(yùn)行內(nèi)置商用硬件大型集群應(yīng)用程序。 圖 1 一個(gè) XML 醫(yī)療記錄的例子 ( 2) MapReduce:MapReduce 是并行數(shù)據(jù)處理模型 ,該模型由兩個(gè)階段組成 :Map 和 Reduce。當(dāng)所有的映射任務(wù)完成 ,減少階段開(kāi)始的中間數(shù)據(jù)具有相同關(guān)鍵是聚合。 在我們的提案中 ,HDFS 被采用到分布式存儲(chǔ) Lucene 文件和索引文件。索引是負(fù)責(zé)建立索引文件從最初的文件轉(zhuǎn)化 Lucene 的文件,以方便快速上網(wǎng)查詢。首先 ,醫(yī)療記錄通過(guò)標(biāo)準(zhǔn) Lucene APIs 轉(zhuǎn)換為多個(gè) Lucene 文檔。 3 云計(jì)算框架下的家庭診斷服務(wù) 應(yīng)用場(chǎng)景 在本文中,我們提出了一個(gè)基于云計(jì)算的框架來(lái)實(shí)現(xiàn)家庭診斷服務(wù),從歷史醫(yī)療記錄中提取一些診斷的幫助提供給用戶。因此,在疾病癥狀點(diǎn)陣的幫助下,目標(biāo)用戶很容易排除不可能的疾病而選擇感興趣的。從大規(guī)模和不斷增長(zhǎng)的醫(yī)療記錄中搜索類(lèi)似病歷需要按需數(shù)據(jù)存儲(chǔ)模型和彈性可擴(kuò)展性以管理高峰期進(jìn)入家庭診斷服務(wù)的權(quán)限。 表 1 基于云計(jì)算架構(gòu)的關(guān)鍵術(shù)語(yǔ) 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 6 圖 2 基于云計(jì)算架構(gòu)的家庭診斷服務(wù) 如圖 2 所示,云計(jì)算框架由兩個(gè)主要的集群組成,一個(gè)線下的 Hadoop 集群和一個(gè)在線的分布式搜索集群,它由一組四個(gè)集群和負(fù)載平衡器組成: ( 1)大規(guī)模數(shù)據(jù)存儲(chǔ)和并行索引建立采用離線的 Hadoop 集群。此外,四個(gè)簇以及一個(gè)負(fù)載平衡器包括在在線分布式搜索群集。( d)一個(gè)負(fù)載平衡器和一個(gè)由 K 個(gè)調(diào)度器所組成的調(diào)度集群被用于平衡用戶查詢的負(fù)載。換句話說(shuō),存儲(chǔ)在一排搜索節(jié)點(diǎn)集群中的每個(gè)節(jié)點(diǎn)中的索引文件組成了一個(gè)完整的索引文件。然后 ,我們?yōu)槊總€(gè)Lucene 文檔建立索引支持快速在線病歷檢索。對(duì) XML 的醫(yī)療記錄 ,我們解析他們以建立相應(yīng)的 Lucene 文檔。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 8 圖 4 MapReduce 框架下構(gòu)建索引文件的流程圖 離線索引構(gòu)建 為了實(shí)現(xiàn)快速在線用戶查詢處理,索引文件建立時(shí)與每個(gè) Lucene 文檔相關(guān)聯(lián)。根據(jù)分布式搜索集群中搜索節(jié)點(diǎn)的列的數(shù)量 (., N),每個(gè)映射節(jié)點(diǎn)會(huì)將索引文件分為 N 個(gè)部分。 而且,我們建立了三種類(lèi)型的索引文件來(lái)進(jìn)行在線醫(yī)療數(shù)據(jù)檢索,包括反向檢索,概要檢索和細(xì)節(jié)檢索。如圖 1 所示 ,癥狀的描述是一個(gè)字符串 ,由特定的分離器分離出來(lái)。大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 9 算法 1 BF 簽名計(jì)算算法 算法 1 描述了如何為一組癥狀在醫(yī)療記錄中構(gòu)建一個(gè)布隆過(guò)濾器簽名 (BF 簽名 )。此外 ,h2(熱 )= 6,h2(咳嗽 )= 2,h2(呼吸困難 )= 9。 當(dāng)一個(gè)用戶輸入一組癥狀,它的簽名首先會(huì)由算法 1 生成,并且與每個(gè)醫(yī)療記錄 dS 的 BF 簽名相比較,如果 dS ∧ qS = qS ,那么 dS 可能滿足用戶的需求。每個(gè)值都包括一組 CR ids(臨床數(shù)據(jù)的 cIDs )和將被檢索的原始的癥狀集合的 ID;然而關(guān)鍵是這些原始癥狀集合的 BF 簽名。 概要檢索文件。 細(xì)節(jié)檢索文件。同時(shí),為幫助目標(biāo)用戶做出更準(zhǔn)確的判斷 ,Lucene 文檔中的字段 ,如患者的年齡和性別 ,癥狀 ,診斷結(jié)果 ,以及所提供的治療醫(yī)師應(yīng)該返回供用戶參考使用。 圖 5 三種索引文件的數(shù)據(jù)結(jié)構(gòu) 在線分布式搜索集群 分布式搜索集群的關(guān)鍵組件 如圖 2 所示,基于 Lucene 的在線分布式搜索集群由五個(gè)主要組件組成,分布式搜索集群 = {負(fù)載平衡器 ,調(diào)度集群,搜索節(jié)點(diǎn)集群 ,集群數(shù)據(jù)分析 ,訪問(wèn)控制集群 }。選擇規(guī)則通常是依賴(lài)于硬件 ,這里不做討論。當(dāng)醫(yī)療記錄被返回,它會(huì)合并檢索結(jié)果并把合并的結(jié)果轉(zhuǎn)發(fā)給數(shù)據(jù)分析集群的數(shù)據(jù)分析節(jié)點(diǎn)以建立疾病癥狀大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 11 點(diǎn)陣。節(jié)點(diǎn)選擇算法將在 節(jié)中討論。對(duì)于每次用戶查詢,一個(gè)搜索節(jié)點(diǎn)會(huì)被調(diào)度程序從每一列中選取以進(jìn)行醫(yī)療記錄檢索。與相關(guān)的醫(yī)療記錄相聯(lián)系,可以提取疾病分類(lèi)和疾病癥狀。 ( 5)訪問(wèn)控制集群 正如上述節(jié)中所討論的 ,類(lèi)似的醫(yī)療記錄返回給目標(biāo)用戶作為一個(gè)更詳細(xì)的家庭診斷依據(jù)。而且,對(duì)于每個(gè)用戶域,細(xì)節(jié)檢索文件的字符串會(huì)被相應(yīng)地歸入靜態(tài)域和動(dòng)態(tài)域。索引文件會(huì)記錄用戶 ID 和相關(guān)的用戶域之間的關(guān)系。調(diào)度集群大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 12 和數(shù)據(jù)分析集群會(huì)執(zhí)行家庭診斷服務(wù)。不失一般性,搜索節(jié)點(diǎn)集群的節(jié)點(diǎn)選擇將被討論以說(shuō)明動(dòng)態(tài)節(jié)點(diǎn)選擇算法的合理性。而且這 N 個(gè)最小堆棧與搜索節(jié)點(diǎn)集群的 N 列相對(duì)應(yīng),而對(duì)于每個(gè)最小堆棧, M 就是每列中的搜索節(jié)點(diǎn)數(shù)。在每次節(jié)點(diǎn)選擇循環(huán)中,調(diào)度程序會(huì)把查詢轉(zhuǎn)發(fā)給每列中 SFR ij 最小的搜索節(jié)點(diǎn) ij,并且 SFR ij 會(huì)增加 1。 算法 2 節(jié)點(diǎn)選擇算法 4 家庭診斷服務(wù)的實(shí)現(xiàn) 在這個(gè)部分,我們將討論基于云計(jì)算框架的家庭診斷服務(wù)的實(shí)現(xiàn)。在從目標(biāo)用戶收到相關(guān)聯(lián)的一組癥狀查詢 ,負(fù)載平衡器將轉(zhuǎn)發(fā)查詢給某個(gè)調(diào)度程序。 步驟 4 返回結(jié)果中隱私信息的過(guò)濾 在這個(gè)子步中 ,醫(yī)療記錄中病人的隱私信息會(huì)根據(jù)目標(biāo)用戶的訪問(wèn)權(quán)限被過(guò)濾。 定義 3(用戶查詢)一次用戶查詢可以定義為一個(gè)三元組(基本信息,疾病癥狀)。 示例(用戶查詢)用戶查詢可以是 =({性別 =女 ,年齡 =成人 },{癥狀 = {發(fā)燒、大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 15 咳嗽 } })。同時(shí)基本信息過(guò)濾也會(huì)運(yùn)行以過(guò)濾一些男性的或非成年病人的記錄。( 3)通過(guò)個(gè)人數(shù)據(jù)簽名,用戶查詢的布隆簽名可以通過(guò)“ OR”操作計(jì)算出來(lái)。從形式上看,算法 3 說(shuō)明了醫(yī)療記錄檢索的執(zhí)行過(guò)程。 (Belohlavek and Vychodil, 20xx。然后 ,三個(gè)步驟會(huì)進(jìn)行以分析具有相同癥狀的疾病之間的關(guān)系 ,即形式內(nèi)容構(gòu)建、形式概念 計(jì)算以及疾病癥狀點(diǎn)陣計(jì)算。 當(dāng)集合是有限的,內(nèi)容就可以通過(guò)一個(gè)交叉表來(lái)指定。交叉表的行代表疾病,列代表癥狀,符號(hào)√代表的是一個(gè)癥狀是否適用于一種疾病的一種二進(jìn)制關(guān)系。E 的共同癥狀特征 CF可以被定義為: }),(,|f{)( 39。F 的共同疾病 CE 可以被定義為: }),(,|e{)( 39。這些集群被稱(chēng)為形式概念。39。39。 FE 概念中, 39。39。E 疾病集所共有的癥狀集合是 39。并且 {發(fā)燒、咳嗽 }在 {胸膜炎、結(jié)核、流感、肺炎 } 中都會(huì)出現(xiàn)。 疾病癥狀點(diǎn)陣計(jì)算 為了使得 節(jié)中計(jì)算得到的形式概念的層次關(guān)系可視化,一個(gè)偏序的關(guān)系揭示了具有相同癥狀的疾病之間的關(guān) 系和其底層結(jié)構(gòu)。根據(jù)定義 8,{胸膜炎 }是 {肺炎、胸膜炎 }的一個(gè)子集 ,而 {咳嗽、發(fā)熱、胸痛、呼吸困難 }也是 {咳嗽、發(fā)熱、胸痛、呼吸困難、胸悶 }的一個(gè)子集。它可以被哈斯圖所代替。診斷路徑示例是用紅色突出顯示在圖 8(b)。然后他 /她就可以檢查每一個(gè)標(biāo)識(shí)了“發(fā)燒”和“咳嗽”的診斷路徑以查看是否有其他有用的癥狀來(lái)區(qū)分這些可能的疾病。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 19 算法 4 家庭診斷服務(wù)的數(shù)據(jù)分析算法 返回結(jié)果中的隱私信息過(guò)濾 為了幫助用戶對(duì)他 /她的疾病有更詳細(xì)的信息 ,我們認(rèn)為 ,每個(gè)疾病關(guān)聯(lián)的醫(yī)療記錄也應(yīng)該呈現(xiàn)給目標(biāo)用戶。 (1)具有最小的服務(wù)錯(cuò)誤率值得訪問(wèn)控制節(jié)點(diǎn)被選中并通過(guò)利用節(jié)點(diǎn)選擇算法來(lái)進(jìn)行隱私信息的過(guò)濾。因此,在用戶訪問(wèn)權(quán)限內(nèi)的動(dòng)態(tài)域的會(huì)被返回給調(diào)度程序。具體來(lái)說(shuō),基于 Lucene 的分布式搜索集群是通過(guò)一系列實(shí)驗(yàn)嘗試來(lái)評(píng)價(jià)的。 表 4 基于云架構(gòu)原型系統(tǒng)的配置 對(duì)于基于云計(jì)算的框架,一個(gè)私有的 Hadoop 集群被用于離線數(shù)據(jù)存儲(chǔ)(即Lucene 文件和索引文件)和索引構(gòu)建。圖 9 描述了原型框架。而對(duì)于每個(gè)從節(jié)點(diǎn) ,都配有兩個(gè) 2TB 的磁盤(pán)。其他 3 個(gè)人電腦是用來(lái)實(shí)現(xiàn)一個(gè)調(diào)度集群、數(shù)據(jù)分析集群以及集群訪問(wèn)控制的功能。 性能分析 在本節(jié)中,我們?cè)O(shè)計(jì)了 2 個(gè)測(cè)試用例對(duì)我們的提案進(jìn)行性能測(cè)試。把醫(yī)療記錄轉(zhuǎn)換為 Lucene 文檔后, Lucene文檔的大小也是 14GB。Ao et al .,20xx)被用于反向索引壓縮 。每一行的第 i個(gè) (1≤ i≤ N)搜索節(jié)點(diǎn)包含第 i個(gè) (1≤ i≤ N)索引碎片。此外,第 i次試驗(yàn)中,第 i個(gè)搜索節(jié)點(diǎn)會(huì)被初始化來(lái)進(jìn)行醫(yī)療記錄檢索。 當(dāng) N≤3,每個(gè)搜索節(jié)點(diǎn)的 RAM(2GB)小于索引碎片的大小 ( 2GB)。然而 ,這并不意味著搜索節(jié)點(diǎn)越多 ,搜索節(jié)點(diǎn)就有更好的性能。因此 ,添加更多的搜索節(jié)點(diǎn)將會(huì)導(dǎo)致資源浪費(fèi)。我們會(huì)進(jìn)行 6 次試驗(yàn)來(lái)評(píng)估相對(duì)于不同的 M 值時(shí)的可擴(kuò)展性。原因是索引文件的大小是固定的 2G(RAM)和 CPU 不必因?yàn)?I / O 交換操作浪費(fèi)大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 23 時(shí)間。然而 ,這并不意味著 M 越大 ,搜索集群的性能越好。例如 ,在這個(gè)測(cè)試用例中 ,M = 3 是最優(yōu)選擇??傊?,通過(guò)搜索節(jié)點(diǎn)集群的可擴(kuò)展性 ,我們的云計(jì)算框架可以實(shí)際應(yīng)用中達(dá)到最優(yōu)的性能。他想獲得一些關(guān)于他的疾病的預(yù)備知識(shí),這樣他就可以知道他應(yīng)該在醫(yī)院的哪一部門(mén)提前預(yù)約。對(duì)于疾病癥狀 ,選擇“呼吸困難”和“咳嗽”。根據(jù)我們的檢索結(jié)果 ,有 49 個(gè)醫(yī)療記錄與李的查詢相匹配。 由于本文篇幅的限制 ,這里我們重點(diǎn)討論數(shù)據(jù)分析步驟如何建立癥狀點(diǎn)陣以及李如何使用疾病癥狀點(diǎn)陣來(lái)判斷他感染了哪種疾病。對(duì)于這 7 種疾病 ,都包含“呼吸困難”和“咳嗽”癥狀。 圖 11 疾病癥狀點(diǎn)陣的運(yùn)行示例 疾病癥狀點(diǎn)陣計(jì)算 對(duì)于這 11 個(gè)概念,疾病癥狀點(diǎn)陣會(huì)通過(guò)偏序關(guān)系來(lái)計(jì)算,如定義 8 中所示。為了判斷他可能感染了哪種疾病 , ,李可以查看與一組癥狀和疾病結(jié)果相關(guān)的每個(gè)診斷路徑。此外 ,在我們的設(shè)計(jì)中 ,在疾病癥狀點(diǎn)陣中對(duì)于 每個(gè)疾病 ,有超鏈接可以到相應(yīng)的醫(yī)療記錄。處理大數(shù)據(jù)的挑戰(zhàn)主要體現(xiàn)于大規(guī)模數(shù)據(jù)存儲(chǔ)和高效知識(shí)挖掘技術(shù)。此外,作者在 (Chandramouli et al., 20xx)中提出了一個(gè)基于云架構(gòu)的過(guò)程模型稱(chēng)為 Prism來(lái)幫助數(shù)據(jù)科學(xué)家從大的探索性數(shù)據(jù)中執(zhí)行漸進(jìn)采樣。比如健康庫(kù) (HealthVault, 20xx。在 (Hsu et al., 20xx)中,討論了一種老年人 護(hù)理指導(dǎo)關(guān)于如何通過(guò)老年人學(xué)和老年醫(yī)療體系整合不同的領(lǐng)域與合作。盡管解決的問(wèn)題千差萬(wàn)別,但是提供一種普遍的醫(yī)療服務(wù),改善醫(yī)療服務(wù)使我們的共同目標(biāo)。這些知識(shí)會(huì)被存儲(chǔ)在計(jì)算機(jī)中,當(dāng)需要的時(shí)候,用戶可以訪問(wèn)計(jì)算機(jī)來(lái)獲得具體的建議。同時(shí),這個(gè)結(jié)果被存儲(chǔ)在糖尿病決策知識(shí)庫(kù)以作為未來(lái)診斷的依據(jù)。然而,我們并不是把知識(shí)作為專(zhuān)家經(jīng)驗(yàn)存儲(chǔ)在計(jì)算機(jī)系統(tǒng)中以備未來(lái)使用。 而且,隱私問(wèn) 題是醫(yī)療數(shù)據(jù)應(yīng)用的前提,這引起了許多研究人員的注意。在這些面向隱私的研究工作中,他們假定第三方服務(wù)提供者是不值得信賴(lài)的。通過(guò)基于云的架構(gòu),家庭診斷服務(wù)通過(guò)歷史醫(yī)療記錄讓用戶在家就獲得診斷幫助。 目前,只有一個(gè)基于云架構(gòu)的原型通過(guò)少量的呼吸醫(yī)學(xué)部門(mén)的醫(yī)療記錄被實(shí)現(xiàn)了。 致謝 本文部分受到中國(guó)國(guó)家科學(xué)基金會(huì)編號(hào) 91318301,和 61321491 的撥款;科技部的國(guó)家關(guān)鍵技術(shù)研發(fā)項(xiàng)目下 20xx bak21b06
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1