freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù)畢業(yè)論文(已修改)

2025-07-19 21:28 本頁面
 

【正文】 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 1 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 摘要: 自我護(hù)理服務(wù)在我們的日常生活中正變得越來越重要,特別是在面臨全球老齡化這樣緊迫的情況下。大量的歷史醫(yī)療記錄這樣的大數(shù)據(jù)使得用戶進(jìn)行自我護(hù)理服務(wù)成為可能,例如他們自己就可以通過類似的病人的病例來獲得診斷。發(fā)展這樣一種自我護(hù)理的服務(wù)就會面臨很多挑戰(zhàn)包括高并發(fā)和可擴展的的醫(yī)療記錄的檢索,數(shù)據(jù)分析,以及隱私的保護(hù)。在本文中,我們提出了一個基于云計算的架構(gòu)來實現(xiàn)自我護(hù)理服務(wù)稱為家庭診斷以解決上述挑戰(zhàn)。具體而言,一個基于 Lucene 的分布式搜索集群被設(shè)計出來旨在支持高并發(fā)和可擴展的病歷檢索,數(shù)據(jù)分析和隱私保護(hù)。此外,為 了加快醫(yī)療記錄檢索, Hadoop 集群被采用以存儲離線數(shù)據(jù)以及構(gòu)建索引。當(dāng)談及家庭診斷服務(wù)的實現(xiàn),我們可以從中獲得相似的歷史醫(yī)療記錄和疾病癥狀點陣,以幫助用戶查明他們可能感染了哪一種疾病。最后,一個原型系統(tǒng)會被設(shè)計出來以及一個運行實例會被呈現(xiàn)以證明我們的提案的擴展性以及效率。 關(guān)鍵詞: 基于云計算的架構(gòu),家庭診斷服務(wù),醫(yī)療大數(shù)據(jù) 1 介紹 背景 根據(jù)世界衛(wèi)生組織的報告,人們在亞健康狀態(tài)( SHS),也被稱為“第三狀態(tài)”(處于健康和生病之間),在世界人口中占 75% ( He et al., 20xx)。 在中國,處于這個狀態(tài)的人群數(shù)量已經(jīng)達(dá)到了 9 億人 ( Ding et al., 20xx) 。有相當(dāng)一部分人會密切關(guān)注他們的健康希望能獲得預(yù)防性健康檢查或以有類似病歷的病人來指導(dǎo)自己。而且,隨著人口老齡化的成長,有些為老年人的慢性疾病監(jiān)測也應(yīng)在日常生活中進(jìn)行。因此,為了滿足“ SHS”群體和人口老齡化的需求,按需自助服務(wù)應(yīng)該被發(fā)展以幫助人們可以在家方便地獲得疾病預(yù)防知識。(Rashidi and Cook, 20xx。 Cook et al., 20xx。 Doctor et al., 20xx). 另一方面,不斷增加的在日常臨床活動所產(chǎn)生的醫(yī)療和診斷數(shù)據(jù)量,使得開展醫(yī)療自助服務(wù)來滿足 SHS 人群和老年人的要求成為可能。然而,大量的醫(yī)療數(shù)據(jù),以及它的各種格式,造成大規(guī)模數(shù)據(jù)管理和高效的知識挖掘技術(shù)的挑戰(zhàn),這也被稱為“大數(shù)據(jù)”的問題。 (Chaudhuri, 20xx). 由于云計算的顯著特征,如彈性計算能力,和普遍的面向服務(wù)的性質(zhì) (Shang et al., 20xx。 Xu et al., 20xx), 云計算技術(shù)已被廣泛研究,并在大數(shù)據(jù)領(lǐng)域使用 (Canny and Zhao, 20xx。 Cheng et al., 20xx), 許多醫(yī)療保健服務(wù)已經(jīng)遷移到云環(huán)境。更具體來說,本文提出的研究報告是為連云港衛(wèi)生局建立一個基于大型研究項目的醫(yī)療信大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 2 息云平臺。連云港是中國江蘇省的一個城市,靠近上海。衛(wèi)生局是要搭建一個平臺,以收集所有的醫(yī)療信息,如每個來自當(dāng)?shù)乇=♂t(yī)師的醫(yī)療記錄。(例如,醫(yī)院,診所)。通過這樣做,各種醫(yī)療服務(wù)可以被制定以符合實際的醫(yī)療保健需求。例如,每個病人可具有他 /她的個人健康簡況,由所有他 /她的臨床與每個臨床訪問相關(guān)聯(lián)的記錄組成。 一個生動的例子 我們討論這個生動的例子是為了突出我們將要提出的問題。 假設(shè)有一個名叫李 某的患者,有一天生病了。并且他知道他的癥狀包括“高燒”和“呼吸困難”。他去醫(yī)院進(jìn)行診斷之前,希望通過互聯(lián)網(wǎng)初步診斷,這樣就能知道他可能患有哪種疾病。因此,他可以在事先通過醫(yī)院的主頁作出合適的預(yù)約。在上面的例子中,如果有一個醫(yī)療自助服務(wù),根據(jù)李某的疾病癥狀提供相似的歷史醫(yī)療記錄這樣的診斷協(xié)助,這將有助于李某做出合適的預(yù)約。此外,有相似的歷史病歷,李某會對他的病情更詳細(xì)的了解。因此,當(dāng)李某去醫(yī)院進(jìn)行診斷時,將花費李和醫(yī)生雙方更少的時間做出正確的處理,從而提高診斷效率。 然而問題出現(xiàn)了,就是如何去提供這樣一種自我 保健服務(wù)。具體來說,這個問題主要包含以下三點。第一點是如何根據(jù)李某的疾病癥狀在大規(guī)模和不斷增加的醫(yī)療記錄中提供實時在線醫(yī)療記錄檢索。另一個是如何提取有用的診斷知識來幫助李從大量檢索出來的醫(yī)療記錄中弄清楚可能感染了什么疾病。最后一個是如何避免在病歷隱私信息曝光,因為醫(yī)療記錄是隱私的、敏感的。 我們的工作和貢獻(xiàn) 通過這些觀察,在本文中,我們將通過以下工作來面對這些挑戰(zhàn)。( 1)在本文中我們提出了一個基于云的框架來實現(xiàn)一個名為家庭診斷的自我保健服務(wù)。具體來說,一個分布式基于 Lucene 搜索集群被設(shè)計出來旨在 提供高并發(fā)和可擴展的在線醫(yī)療記錄檢索,數(shù)據(jù)分析和隱私保護(hù)功能。為了加快病歷檢索, Hadoop集群被采用已進(jìn)行線下數(shù)據(jù)存儲和檢索庫。( 2)更具體來說,家庭診斷服務(wù)的實現(xiàn)由四個步驟組成。首先 ,用戶提交查詢有關(guān)他 /她的疾病信息。然后醫(yī)療記錄匹配用戶的疾病癥狀 ,性別和年齡在步驟 2 中檢索。通過檢索醫(yī)療記錄,數(shù)據(jù)分析在步驟 3 進(jìn)行,來計算疾病癥狀的點陣,揭示疾病常見癥狀之間的關(guān)系。最后 ,隱私敏感信息根據(jù)訪問控制策略在醫(yī)療記錄中被過濾。因此,疾病的癥狀點陣,以及進(jìn)行過隱私處理的醫(yī)療記錄被返回到用戶,這為用戶自己做一個初步的 診斷提供了一個詳細(xì)的診斷依據(jù)。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 3 本文的組織結(jié)構(gòu) 本文的其余部分安排如下。第 2 節(jié)討論的病歷初步知識,以及一些關(guān)鍵技術(shù),如基于云計算框架中被采用的 Hadoop 的計算框架和 Lucene 庫。基于云計算架構(gòu)的家庭診斷服務(wù)將在第 3 節(jié)介紹。第 4 節(jié)介紹了家庭診斷服務(wù)是如何為用戶提供了診斷援助的細(xì)節(jié)?;谠朴嬎憧蚣艿募彝ピ\斷服務(wù)的評價將在第 5 部分被討論。其中一個原型系統(tǒng)設(shè)計討論和一個運行示例會被提出以證明我們的建議的可擴展性和高效率。第 6 節(jié)討論了大醫(yī)療數(shù)據(jù)在工業(yè)和學(xué)術(shù)領(lǐng)域應(yīng)用的相關(guān)工作。第 7 節(jié)總結(jié)全文,并討論了今后的 工作。 2 初步知識 在本節(jié)中,預(yù)備知識將被討論,來介紹醫(yī)療記錄和在基于云的架構(gòu)中應(yīng)用的一些技術(shù)。 醫(yī)療記錄 定義 1(醫(yī)療記錄)從形式上看,電子病歷是去網(wǎng)絡(luò)由三元組定義: EMR=(病人數(shù)據(jù),病人簡況,臨床資料) (Zhang et al., 20xx。 Li et al., 20xx)。每個元素的內(nèi)容如下: ( 1)病人數(shù)據(jù):患者數(shù)據(jù)包括患者的基本信息,如患者的姓名,性別,出生年月日等 。 ( 2)患者簡況:患者簡況通常包括病人的病史,包括疾病史,手術(shù)史,輸血史,以及過敏史等等。 ( 3)臨床資料:臨床數(shù)據(jù)存儲詳細(xì)的臨床信息,包括癥狀集,病人投訴,現(xiàn)病史,診斷結(jié)果,治療方法等,與患者的每次訪問一個保健醫(yī)生相關(guān)。 通常情況下,在臨床活動中,電子病歷要么是一個 XML 文件由存儲在網(wǎng)絡(luò)文件系統(tǒng)的標(biāo)簽值對組成,或者存儲在關(guān)系數(shù)據(jù)庫中的關(guān)系記錄。圖 1 給出了XML 病歷的一個例子。 一般來說,在日常的診斷中,患者的疾病通常是由他 /她的疾病的癥狀,以及他 /她的年齡和性別確定的。另外,癥狀相同,同樣的性別和年齡相仿的患者傾向于感染類似疾病?;诖擞^察,使用者在在類似的醫(yī)療記錄檢索需要提供疾病癥狀,性別和年齡,如圖 1 三個紅色圓圈所示。 Hadoop: HDFS 和 MapReduce 框架 Hadoop (Ekanayake et al., 20xx。 Bahga and Madisetti, 20xx)是一個云計算框架,用來運行內(nèi)置商用硬件大型集群應(yīng)用程序。 Hadoop 由兩個主要組件組成。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 4 ( 1) HDFS:HDFS(Hadoop 分布式文件系統(tǒng) )在集群中的節(jié)點的集合中存儲文件。大文件分割成塊 (默認(rèn) 64 MB)和每一個塊可以寫入多個節(jié)點 (默認(rèn)值是 3)容錯。 圖 1 一個 XML 醫(yī)療記錄的例子 ( 2) MapReduce:MapReduce 是并行數(shù)據(jù)處理模型 ,該模型由兩個階段組成 :Map 和 Reduce。在映射階段 ,從分布式系統(tǒng) (如 HDFS)讀取 數(shù)據(jù) ,在一組集群中的計算節(jié)點之間分區(qū) ,并將節(jié)點作為一組鍵值對。映射任務(wù)過程的輸入 ,你記錄相互獨立的和中間結(jié)果作為鍵 值對。中間結(jié)果存儲在本地磁盤上運行的節(jié)點映射任務(wù)。當(dāng)所有的映射任務(wù)完成 ,減少階段開始的中間數(shù)據(jù)具有相同關(guān)鍵是聚合。映射任務(wù)處理輸入的相互獨立的記錄并產(chǎn)生中間結(jié)果作為鍵值對。中間結(jié)果存儲在本地磁盤上運行的節(jié)點映射任務(wù)。當(dāng)所有的映射任務(wù)完成 ,篩檢階段開始并把具有相同關(guān)鍵值得中間數(shù)據(jù)聚合起來。 在我們的提案中 ,HDFS 被采用到分布式存儲 Lucene 文件和索引文件。同時 ,MapReduce 計算框架用于 離線批處理索引構(gòu)建工作。 Lucene:信息檢索庫 Lucene 是一個高性能,可擴展的信息檢索( IR)庫,并通過 Apache 軟件基金會授權(quán)的開源項目 (Ochoa and Duval, 20xx。 Hatcher et al., 20xx). 它被廣泛應(yīng)用于許多搜索應(yīng)用,如 NetFlix, Digg, MySpace, LinkedIn 等等 (Apache Lucene, 20xx). Lucene 的核心部件是索引和搜索。索引是負(fù)責(zé)建立索引文件從最初的文件轉(zhuǎn)化 Lucene 的文件,以方便快速上網(wǎng)查詢。實際 上, Lucene 的允許應(yīng)用程序在幾乎所有的數(shù)據(jù)源添加搜索能力,包括遠(yuǎn)程 Web 服務(wù)器上的網(wǎng)頁,存儲在本地大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 5 的文件系統(tǒng),文本文件, MS Word 文檔, XML 網(wǎng)絡(luò) LES,或任何其他形式,從中我們可以提取文本文件信息。另一方面,搜索是這樣一個過程,根據(jù)在索引階段建立的索引文件,在索引文件中查找單詞以找到數(shù)據(jù)源。 在本文中 ,我們采用 Lucene 和 Hadoop 實現(xiàn)病歷家庭診斷服務(wù)的搜索。首先 ,醫(yī)療記錄通過標(biāo)準(zhǔn) Lucene APIs 轉(zhuǎn)換為多個 Lucene 文檔。然后 Lucene 文檔被存儲為塊文件在 Hadoop 的 HDFS 集群。 此外 ,為支持快速在線醫(yī)療記錄搜索、MapReduce 任務(wù)在每個 Lucene 文檔創(chuàng)建索引時被初始化。索引階段后 ,索引文件也存儲在 Hadoop 的 HDFS 集群。 3 云計算框架下的家庭診斷服務(wù) 應(yīng)用場景 在本文中,我們提出了一個基于云計算的框架來實現(xiàn)家庭診斷服務(wù),從歷史醫(yī)療記錄中提取一些診斷的幫助提供給用戶。更具體來說,家庭診斷服務(wù),根據(jù)目標(biāo)用戶的查詢,允許基于癥狀的病歷檢索。此外,為幫助用戶區(qū)分檢索到的病歷疾病,會進(jìn)行數(shù)據(jù)分析以構(gòu)建疾病癥狀點陣。這個疾病癥狀點陣在用戶查詢的過程中會揭示具有相同癥狀的疾病 的關(guān)系。因此,在疾病癥狀點陣的幫助下,目標(biāo)用戶很容易排除不可能的疾病而選擇感興趣的。同時 ,醫(yī)療記錄返回給目標(biāo)用戶以獲得更詳細(xì)的參考。此外 ,返醫(yī)療記錄返回到目標(biāo)用戶之前,隱私信息在醫(yī)療記錄會被過濾 ,以避免暴露醫(yī)療記錄中的敏感隱私數(shù)據(jù)。我們的家庭診斷服務(wù)旨在通過相似的歷史醫(yī)療記錄為用戶提供自我護(hù)理服務(wù)。從大規(guī)模和不斷增長的醫(yī)療記錄中搜索類似病歷需要按需數(shù)據(jù)存儲模型和彈性可擴展性以管理高峰期進(jìn)入家庭診斷服務(wù)的權(quán)限。由于云計算的顯著特征,如按需存儲,彈性計算能力,本文提出了基于云計算框架實施家庭診斷服務(wù)?;谠朴嬎?架構(gòu)概述的討論如下。 基于云計算架構(gòu)的概述 為了簡化討論,我們把一些術(shù)語羅列在下面的表 1 中。 表 1 基于云計算架構(gòu)的關(guān)鍵術(shù)語 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 6 圖 2 基于云計算架構(gòu)的家庭診斷服務(wù) 如圖 2 所示,云計算框架由兩個主要的集群組成,一個線下的 Hadoop 集群和一個在線的分布式搜索集群,它由一組四個集群和負(fù)載平衡器組成: ( 1)大規(guī)模數(shù)據(jù)存儲和并行索引建立采用離線的 Hadoop 集群。簡而言之 ,HDFS 是用于存儲索引文件和大量醫(yī)療記錄中轉(zhuǎn)換過來的 Lucene 文檔 。而MapReduce 計算模型用于平行索引構(gòu)建 。 ( 2)網(wǎng)上分布式搜索簇設(shè)計用于處理高并發(fā)和可擴展方式的用戶查詢。此外,四個簇以及一個負(fù)載平衡器包括在在線分布式搜索群集。相應(yīng)地,( a)一種搜索由 N M 個搜索節(jié)點組成的節(jié)點集群被設(shè)計出來以進(jìn)行病歷檢索。( b)由 P 個數(shù)據(jù)分析節(jié)點組成的數(shù)據(jù)分析集群被設(shè)計用于數(shù)據(jù)分析以建立一個疾病癥狀點陣。( c)由 Q 個訪問控制節(jié)點組成的訪問控制集群被采用以過濾隱私信息。( d)一個負(fù)載平衡器和一個由 K 個調(diào)度器所組成的調(diào)度集群被用于平衡用戶查詢的負(fù)載。在我們的提案中,基于云計算框架的可擴展性可以通過動態(tài)添加或刪除在每個集群中的節(jié)點 來獲得。兩個集群之間的關(guān)系的分析如下。一旦完成索引構(gòu)建,一個完整的索引文件就變分成 N 個片,此外,第 i個( 1 i N)的索引片被分配給在分布式搜索群集的每一行的第 i個( 1 i N)的搜索節(jié)點。換句話說,存儲在一排搜索節(jié)點
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1