freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務畢業(yè)論文-文庫吧

2025-06-04 21:28 本頁面


【正文】 集群中的每個節(jié)點中的索引文件組成了一個完整的索引文件。此外,在搜索節(jié)點的集群的第 i個( 1 i N)的列中的每個節(jié)點中包大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 7 含的第 i個( 1 i N)的索引碎片的相同副本。 離線 Hadoop 集群 在離線存儲模塊中,有兩個任務會進行,包括文檔存儲和索引建立。正如 節(jié)中所討論的 ,首先,醫(yī)療記錄被翻譯成幾個 Lucene 文檔。然后 ,我們?yōu)槊總€Lucene 文檔建立索引支持快速在線病歷檢索。具體地說 ,我們使用 Hadoop 集群進行 Lucene 文檔存儲、并行索引構建 ,以及相關索引文件存儲。 分布式數(shù)據(jù)存儲模型 正如初步知識那一節(jié)討論的,醫(yī)療記錄是作為 XML 文件存儲在文件系統(tǒng)或是 RDMBs 的關系記錄。 圖 3 家庭診斷服務的文檔存儲模型 根據(jù) Lucene 的性質(zhì) ,所有醫(yī)療記錄在索引階段之前都應該轉(zhuǎn)移到由字段值對組成的 Lucene 文檔。對 XML 的醫(yī)療記錄 ,我們解析他們以建立相應的 Lucene 文檔。對于存儲在 RDBMs 的醫(yī)療記錄 ,我們使用 HBase 作為中間件 ,使在多個關系數(shù)據(jù)庫中的“加入”操作更高效。特別的,把相關的醫(yī)療數(shù)據(jù)轉(zhuǎn)換為存儲在 HBase中的數(shù)據(jù)之后,我們可以應用“加入”和“刪除”操作把結構化的醫(yī)療記錄轉(zhuǎn)換為 Lucene 文檔。所有的 Lucene 文檔被存儲在 Hadoop 集群的 HDFS 中,如圖 3所示。 大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 8 圖 4 MapReduce 框架下構建索引文件的流程圖 離線索引構建 為了實現(xiàn)快速在線用戶查詢處理,索引文件建立時與每個 Lucene 文檔相關聯(lián)。我們采用 MapReduce 計算框架進行批量索引構建。圖 4 描述了 MapReduce框架來構建索引文件的流程圖。首先 ,每個文檔塊被分為若干個分區(qū) ,映射節(jié)點為給定文檔分區(qū)建立索引。根據(jù)分布式搜索集群中搜索節(jié)點的列的數(shù)量 (., N),每個映射節(jié)點會將索引文件分為 N 個部分。一旦完成映射工作,在每個映射節(jié)點上的 N 個碎片會重組到 reduce 節(jié)點,并完成合并操作。在完成合并操作后,可以獲得索引文件的 N 個碎片,它們存儲在 HDFS 中,如圖 3 所示。另外,為了能夠進行在線醫(yī)療數(shù)據(jù)檢索,索引文件的 N 個碎片被分布到分布式搜索集群的搜索節(jié)點中。 而且,我們建立了三種類型的索引文件來進行在線醫(yī)療數(shù)據(jù)檢索,包括反向檢索,概要檢索和細節(jié)檢索。這里,我們還是用 節(jié)的例子來解釋每個索引文件的內(nèi)容。 反向索引文件。反向索引文件記錄癥狀集和相應的醫(yī)療記錄 ID 之間的映射關系。如圖 1 所示 ,癥狀的描述是一個字符串 ,由特定的分離器分離出來。在基于癥狀的醫(yī)學檢索中,這種樸實的方法是為了使每個查詢中的癥狀集合與索引文件中的每個癥狀集相匹配。然而,大規(guī)模的字符串匹配在實際應用中并不是容易實現(xiàn)的。與( Li et al. 20xx)相似,布隆過濾器的簽名 (Bloom,1970)和布隆過濾器索引結構被用來加快基于癥狀的醫(yī)療記錄查詢。大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 9 算法 1 BF 簽名計算算法 算法 1 描述了如何為一組癥狀在醫(yī)療記錄中構建一個布隆過濾器簽名 (BF 簽名 )。對于圖 1 中所示的醫(yī)療記錄示例,假設 m的值設置為 10,并且分別有兩個離散函數(shù) h1 和 h2。則布隆過濾器簽名計算如下 : (1)癥狀組中的癥狀 = {發(fā)熱、咳嗽、呼吸困難 },其散列值被計算出來。 h1(熱 )= 5,h1(咳嗽 )= 6,h1(呼吸困難 )= 7。此外 ,h2(熱 )= 6,h2(咳嗽 )= 2,h2(呼吸困難 )= 9。 (2)因此 ,對于 h1,第一個 10 位向 量的值是 0001110000,5 日 ,6 日和 7 日根據(jù)散列值設置為 1。類似的 ,第二個 10 位向量的值等于 0100100010。( 3)由于 0001110000∧ 0100100010=0101110010,在醫(yī)療記錄中這個癥狀集設置的布隆濾波器簽名是 0101110010。 當一個用戶輸入一組癥狀,它的簽名首先會由算法 1 生成,并且與每個醫(yī)療記錄 dS 的 BF 簽名相比較,如果 dS ∧ qS = qS ,那么 dS 可能滿足用戶的需求。否則 dS 將被安全的刪除。受益于位操作,所有的在關于簽名的計算都是非常有效的。 BF 索引文件是由鍵值對組成的,并以序列文件存儲于 HDFS 中。每個值都包括一組 CR ids(臨床數(shù)據(jù)的 cIDs )和將被檢索的原始的癥狀集合的 ID;然而關鍵是這些原始癥狀集合的 BF 簽名。通過 BF 簽名查詢測試簽名,大量不合格的數(shù)據(jù)將被刪除。然而,在布隆過濾中被保留下來的 CR id 仍然不 是準確的。因此我們也會存儲原始的癥狀集以確保匹配。 概要檢索文件。概要文件檢索記錄了醫(yī)療記錄的一些關鍵部分,用于過濾掉不相關的醫(yī)療記錄。在我們的例子中,病人的性別、年齡將被記錄以過濾一些記大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 10 錄。這些記錄中患者的性別和年齡是與目標用戶的查詢條件所不符的。 細節(jié)檢索文件。細節(jié)檢索文件是由每個 Lucene 文檔中的字段值對所組成的,用于數(shù)據(jù)分析并返還給目標用戶。在我們的設計中 ,在 Lucene 文檔中的所有字段將被添加到細節(jié)索引文件。為了進行數(shù)據(jù)分析過程,診斷結果和疾病癥狀字段被用于建立疾病癥狀點陣,以顯示具有相同癥狀的 疾病之間的關系。同時,為幫助目標用戶做出更準確的判斷 ,Lucene 文檔中的字段 ,如患者的年齡和性別 ,癥狀 ,診斷結果 ,以及所提供的治療醫(yī)師應該返回供用戶參考使用。圖 5 中羅列了 Lucene文檔的一些字段,它是從圖 1 的醫(yī)療記錄轉(zhuǎn)換過來的。由于空間限制,我們不詳細列出所有字段索引。請注意 ,根據(jù) Lucene 索引構建的可配置特性,所有字段在Lucene 可以很容易地從細節(jié)索引文件中添加或刪除。 圖 5 三種索引文件的數(shù)據(jù)結構 在線分布式搜索集群 分布式搜索集群的關鍵組件 如圖 2 所示,基于 Lucene 的在線分布式搜索集群由五個主要組件組成,分布式搜索集群 = {負載平衡器 ,調(diào)度集群,搜索節(jié)點集群 ,集群數(shù)據(jù)分析 ,訪問控制集群 }。在下面的討論中 ,每個基本組件的責任將被展示。 ( 1)負載平衡器 負載均衡器是家庭診斷服務的一種硬件接口。在接受用戶查詢時 ,負載平衡器根據(jù)其選擇規(guī)則將查詢轉(zhuǎn)發(fā)到一個調(diào)度程序。選擇規(guī)則通常是依賴于硬件 ,這里不做討論。 ( 2)分配調(diào)度集群 為了支持高并發(fā)的用戶查詢,一個分配調(diào)度集群是由 K 個調(diào)度程序組成的。每個調(diào)度程序負責搜索節(jié)點集群、數(shù)據(jù)分析集群和訪問控制集群之間的協(xié)調(diào)。具體地 說,從負載平衡器收到用戶查詢之后,一個調(diào)度程序會從搜索節(jié)點集群的每一列選擇一個搜索節(jié)點執(zhí)行實時的醫(yī)療記錄檢索。當醫(yī)療記錄被返回,它會合并檢索結果并把合并的結果轉(zhuǎn)發(fā)給數(shù)據(jù)分析集群的數(shù)據(jù)分析節(jié)點以建立疾病癥狀大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 11 點陣。在把疾病癥狀點陣和醫(yī)療記錄返回給目標用戶之前,它會授權訪問控制集群過濾檢索到的醫(yī)療記錄中的隱私敏感信息以保護患者的隱私。從圖 2 中我們可以看到 ,每個集群包含多個節(jié)點。因此 ,對于每一個用戶查詢 ,節(jié)點選擇算法會進行以選擇合格的節(jié)點進行用戶查詢。節(jié)點選擇算法將在 節(jié)中討論。 ( 3)搜索節(jié)點集群 搜索節(jié) 點集群是一個彈性和可擴展的搜索矩陣 ,由 N M 搜索節(jié)點組成 (每個搜索節(jié)點包含索引碎片 ,并通過采用 Lucene 搜索庫功能開展實時醫(yī)療記錄檢索 )。每一行的第 i個 (1 i N)搜索節(jié)點包含完整的索引文件的第 i個碎片 ,如 節(jié)中討論。為了實現(xiàn)高并發(fā)的實時醫(yī)療記錄檢索, M1 個搜索節(jié)點被復制到每排的每個節(jié)點。對于每次用戶查詢,一個搜索節(jié)點會被調(diào)度程序從每一列中選取以進行醫(yī)療記錄檢索。通常 ,N 的值是由索引文件的大小和每個搜索節(jié)點的內(nèi)存性能決定的 ,而 M 的值是由并發(fā)用戶查詢的數(shù)量決定。 ( 4)數(shù)據(jù)分析集群 通常 ,對于 一個給定的用戶的查詢 , 由于用戶對醫(yī)學知識的欠缺,這種疾病癥狀集合可能是不完全的。因此,檢索到的相關的醫(yī)療記錄可能就包含多個疾病分類。與相關的醫(yī)療記錄相聯(lián)系,可以提取疾病分類和疾病癥狀。并且用戶沒有提供的癥狀可以用來區(qū)分疾病分類。在我們的提案中,數(shù)據(jù)分析集群旨在從檢索到的醫(yī)療記錄中計算疾病癥狀的點陣。關于如何計算疾病點陣的細節(jié)我們將在后續(xù)的章節(jié)討論。 ( 5)訪問控制集群 正如上述節(jié)中所討論的 ,類似的醫(yī)療記錄返回給目標用戶作為一個更詳細的家庭診斷依據(jù)。然而 ,醫(yī)療記錄是隱私敏感的。在醫(yī)療記錄返回給目標用戶之前 ,應該進行隱私保護 ,保證不會曝光病人的隱私信息。為了解決這一問題,我們設計了一個訪問控制策略,根據(jù)用戶的角色,用戶會被分為不同的用戶域。而且,對于每個用戶域,細節(jié)檢索文件的字符串會被相應地歸入靜態(tài)域和動態(tài)域。動態(tài)域中的信息可以通過相應域的角色獲得。而靜態(tài)域中的信息是不可獲取的。 在我們的設計中,每個訪問控制集群中的節(jié)點都會通過索引文件存儲用戶的權限。索引文件會記錄用戶 ID 和相關的用戶域之間的關系。而且,我們設計了另一個索引文件來存儲用戶域和與其相關的細節(jié)索引文件中的動態(tài)字符串之間的映射關系。在調(diào)度程序把結果返回給負載平衡器之前,它會根據(jù)相應地用戶 ID授權訪問控制集群過濾掉細節(jié)索引文件中的靜態(tài)域。 節(jié)點選擇算法 對于每次用戶查詢,調(diào)度程序會從搜索節(jié)點集群中選擇某些節(jié)點。調(diào)度集群大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 12 和數(shù)據(jù)分析集群會執(zhí)行家庭診斷服務。對于節(jié)點選擇,一種樸素的方法是采用循環(huán)調(diào)度算法,這樣每個節(jié)點都會輪流被選中。然而 ,循環(huán)調(diào)度算法的可擴展性較差 ,因為它不考慮每個節(jié)點的不同的服務能力。在這里, 我們提出了一個合理動態(tài)節(jié)點選擇算法,為每次用戶查詢選擇合適的節(jié)點。不失一般性,搜索節(jié)點集群的節(jié)點選擇將被討論以說明動態(tài)節(jié)點選擇算法的合理性。在搜索節(jié)點集群 ,集群中的每一行搜索節(jié)點構成一個完整的索引文件 ,每一列的搜索節(jié)點都是相同的。因此,對于每一次用戶查詢,每一列只有一個搜索節(jié)點被選中來進行醫(yī)療記錄查詢。簡而言之,調(diào)度集群有一個包含 N 個最小堆棧的集合,而每個最小堆棧都有 M 個元素(如圖 6 所示)。而且這 N 個最小堆棧與搜索節(jié)點集群的 N 列相對應,而對于每個最小堆棧, M 就是每列中的搜索節(jié)點數(shù)。 這里 ,在第 i(1 i N)個最小堆棧的第 j(1 j M)個元素就是搜索節(jié)點 nS 服務失敗率的值。 圖 6 調(diào)度程序節(jié)點選擇算法的流程圖 定義 2(服務失敗率, SFR)對于每個搜索節(jié)點,它的服務失敗率是由給定大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 13 時間內(nèi)無法響應的查詢的數(shù)量決定的。 SFR ij 的值越小,搜索節(jié)點 ij 的服務質(zhì)量越好。在每次節(jié)點選擇循環(huán)中,調(diào)度程序會把查詢轉(zhuǎn)發(fā)給每列中 SFR ij 最小的搜索節(jié)點 ij,并且 SFR ij 會增加 1。當 ij 把搜索結果返回給調(diào)度程序后,SFR ij 就減 1。同時 ,當 SFR ij 的價值發(fā)生變化時 ,該最小堆棧 (i)將進行調(diào)整 ,以達到一個平衡 ,以維持最小堆棧的值。算法 2 描述了如何為一次用戶查詢選擇一組搜索節(jié)點。 算法 2 節(jié)點選擇算法 4 家庭診斷服務的實現(xiàn) 在這個部分,我們將討論基于云計算框架的家庭診斷服務的實現(xiàn)。家庭診斷服務的實現(xiàn)由 4 個步驟組成(如圖 7 所示)。包括查詢提交,醫(yī)療記錄檢索,數(shù)據(jù)分析和返回的結果中隱私信息的過濾。 圖 7 實現(xiàn)家庭診斷服務的流程圖 大醫(yī)療數(shù)據(jù)背景下基于云架構的家庭診斷服務 14 步驟 1 查詢提交 在這一步中 ,目標用戶提交一個與他 /她的疾病信息有關的查詢 ,。在從目標用戶收到相關聯(lián)的一組癥狀查詢 ,負載平衡器將轉(zhuǎn)發(fā)查詢給某個調(diào)度程序。 步驟 2 醫(yī)療記錄檢索 調(diào)度程序會選擇一組搜索節(jié)點通過利用算法 2 去查詢與用戶查詢相匹配的醫(yī)療記錄。 步驟 3 數(shù)據(jù)分析 當從搜索節(jié)點收到匹配的醫(yī)療記錄后,調(diào)度程序會把搜索結果合并并把結果轉(zhuǎn)發(fā)給數(shù)據(jù)分析集群進行數(shù)據(jù)分析。數(shù)據(jù)分析節(jié)點會計算與步驟 2 中的醫(yī)療記錄相關的疾病癥狀點陣。 步驟 4 返回結果中隱私信息的過濾 在這個子步中 ,醫(yī)療記錄中病人的隱私信息會根據(jù)目標用戶的訪問權限被過濾。 在下面的討論中,我們將討論家庭診斷服務的 4 個步驟的細節(jié)。為了簡化討論,表 2 總結了一些關鍵術語。 表 2 家庭診斷服務中的關鍵術語 查詢
點擊復制文檔內(nèi)容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1