freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

大醫(yī)療數據背景下基于云架構的家庭診斷服務畢業(yè)論文(編輯修改稿)

2025-08-13 21:28 本頁面
 

【文章內容簡介】 提交 從形式上看,在我們的家庭診斷服務中,一次用戶查詢可以形式化為定義 3。 定義 3(用戶查詢)一次用戶查詢可以定義為一個三元組(基本信息,疾病癥狀)。簡化時,它可以被 Q=(BI, DS)替代。在定義 3 中,基本信息是指病人的性別和年齡(即 {女性或男性 }, {兒童、成年人或老年人 })。疾病癥狀是指病人的癥狀名稱。 示例(用戶查詢)用戶查詢可以是 =({性別 =女 ,年齡 =成人 },{癥狀 = {發(fā)燒、大醫(yī)療數據背景下基于云架構的家庭診斷服務 15 咳嗽 } })。 在收到用戶查詢時 ,負載平衡器根據其選擇規(guī)則將查詢轉發(fā)到一個調度程序。然后被選擇的調度程序會利用算法 2,將用戶查詢轉發(fā)到分布式搜索集群的N 個搜索節(jié)點。 醫(yī)療記錄檢索 給定一個包含一組癥狀的用戶查詢,每個搜索節(jié)點都會運行布隆簽名過濾去檢索同時出現“發(fā)燒”和“咳嗽”的醫(yī)療記錄。同時基本信息過濾也會運行以過濾一些男性的或非成年病人的記錄。 ( 1) BF 簽名過濾 如在第三節(jié)所討論的 ,BF 簽名采用加速癥狀匹配。( 1)用戶查詢中的每個癥狀是散列的 k 個值 是由 k 個散列函數 ,? ,所確定的。( 2)把 m維向量中與那些離散值 相應的位置 1。( 3)通過個人數據簽名,用戶查詢的布隆簽名可以通過“ OR”操作計算出來。( 4)通過 iS ,在反向檢索文件中的每個布隆簽名 BFcR 會被掃描,并與 iS 比較 。如果 BFcR ∧ iS = iS ,那么在 jcRe 中記錄的具體的癥狀會與 iQ 中記錄的癥狀相比較以確保 jcRe 包含 iQ 中所有的癥狀。 ( 2)基本信息過濾 對于經過 BF 簽名過濾的醫(yī)療記錄,它的性別和年齡會與用戶的性別年齡相比較,以過濾掉男性、老年人以及兒童患者。從形式上看,算法 3 說明了醫(yī)療記錄檢索的執(zhí)行過程。 算法 3 醫(yī)療數據檢索算法 大醫(yī)療數據背景下基于云架構的家庭診斷服務 16 數據分析 通常,用戶由于缺乏醫(yī)療知識,只能提供他 /她的一部分癥狀。與 節(jié)的檢索的醫(yī)療記錄相聯系,可能不止一種疾病滿足用戶的查詢。數據分析通過利用一種被稱為形式概念分析( FCA)的數學理論幫助用戶分析這些可能的疾病分類的相似和不同點。 (Belohlavek and Vychodil, 20xx。 Wu et al., 20xx。 Crampes et al., 20xx).FCA 會被采用以顯示具有相同癥狀的不同疾病分類之間的潛在關系。更具體地說 ,疾病名稱以及癥狀會從 節(jié)中獲得的醫(yī)療記錄中被提取。然后 ,三個步驟會進行以分析具有相同癥狀的疾病之間的關系 ,即形式內容構建、形式概念 計算以及疾病癥狀點陣計算。 形式內容構建 定義 4(形式內容) 在家庭診斷服務中,形式內容是指疾病集合 E 和癥狀集合 F 之間的一個二進制的關系 R。 R?EF, R 表示 E 和 F 之間的關系。 (e, f) ∈ R (e∈ E, and f∈ F)表明疾病 e 有癥狀 f。 當集合是有限的,內容就可以通過一個交叉表來指定。下面給了形式內容的一個例子。 示例(形式內容)表 3 中展示了一個簡單的例子。假設與 節(jié)搜索到的醫(yī)療記錄相聯系,疾病集合 E= {胸膜炎、結核、流感、肺炎 },而癥狀集合F= {發(fā)熱、咳嗽、呼吸困難、胸痛、胸悶 ,盜汗 ,身體疼痛 }。交叉表的行代表疾病,列代表癥狀,符號√代表的是一個癥狀是否適用于一種疾病的一種二進制關系。 表 3 家庭診斷服務形式概念的例子 形式概念計算 給定一個形式內容,形式概念就可以通過共同特征和公共實體的定義被計算。 定義 5(共同特征)給定一個疾病集合 EE?39。 ,則集合 39。E 的共同癥狀特征 CF可以被定義為: }),(,|f{)( 39。39。 RfeEeFECF ????? 大醫(yī)療數據背景下基于云架構的家庭診斷服務 17 定義 6(共同實體)類似的,給定一個癥狀集合 FF?39。 ,則集合 39。F 的共同疾病 CE 可以被定義為: }),(,|e{)( 39。39。 RfeFfEFCF ????? 例子(共同特征和共同實體):在表 3 中,比如, CF({胸膜炎、肺炎 })= {發(fā)熱、咳嗽、呼吸困難、胸痛 },和 CE({發(fā)燒、咳嗽 })= {胸膜炎、結核、流感、肺炎 }。 根據定義 5 和定義 6,疾病和相關的癥狀可以被歸入有意義的集合。這些集群被稱為形式概念。 定義 7(形式概念)內容( E,F,R)的形式概念可用一對 ),)(,( 39。39。39。39。 FFEEFE ??代替,其中 39。39。)( FECF ? , 39。39。)( EFCE ? 。而且,在 ),( 39。39。 FE 概念中, 39。E 被稱為概念的范圍, 39。F 被稱為概念的目的。 換句話說,在 ),( 39。39。 FE 概念中, 39。F 癥狀集所共有的疾病集合是 39。E ,而 39。E 疾病集所共有的癥狀集合是 39。F 。 示例(形式概念)比如,表 3 中的 ({胸膜炎、結核、流感、肺炎 },{咳嗽、發(fā)燒 })是一個形式概念。因為 {咳嗽、發(fā)燒 }是 {胸膜炎、結核、流感、肺炎 }的共同癥狀。并且 {發(fā)燒、咳嗽 }在 {胸膜炎、結核、流感、肺炎 } 中都會出現。此外 ,{胸膜炎、結核、流感、肺炎 }是程度的集合 。{發(fā)燒、咳嗽 }是唯一的現象。另外 ,({肺炎、胸膜炎 },{咳嗽、發(fā)熱、胸痛、呼吸困難 })是這種情況下的另一個概念。 疾病癥狀點陣計算 為了使得 節(jié)中計算得到的形式概念的層次關系可視化,一個偏序的關系揭示了具有相同癥狀的疾病之間的關 系和其底層結構。 定義 8(不等式關系)對于所有的形式內容( E,F,R)中的概念,一個不等式關系“ ? ” 可 以 被 定 義 在 形 式 內 容 的 概 念 上 。 特 別 的 ,jijjii FEFEFE ??? ),(),( 。 示例(不等關系)在表 3 中的形式概念中, ({胸膜炎 },{咳嗽、發(fā)熱、胸痛、呼吸困難、胸悶 })? ({肺炎、胸膜炎 },{咳嗽、發(fā)熱、胸痛、呼吸困難 })。根據定義 8,{胸膜炎 }是 {肺炎、胸膜炎 }的一個子集 ,而 {咳嗽、發(fā)熱、胸痛、呼吸困難 }也是 {咳嗽、發(fā)熱、胸痛、呼吸困難、胸悶 }的一個子集。 此外,部分排序可以被認為是 subsuper 關系。根據這個 subsuper 關系排序 ,大醫(yī)療數據背景下基于云架構的家庭診斷服務 18 它通過在上下文的概念定義了一個完整的點陣。而這個在本文中被稱為疾病癥狀點陣。它可以被哈斯圖所代替。圖 8( a)是一張哈斯表展示了表 3 中的內容的疾病癥狀點陣。疾病癥狀點陣的節(jié)點代表了形式概念的潛在內容。 圖 8 表 3 中的疾病癥狀點陣 有了疾病癥狀點陣,用戶可以通過自上而下瀏覽點陣的每一個診斷路徑獲得自我診斷。診斷路徑示例是用紅色突出顯示在圖 8(b)。同時,與每個路徑相聯系的是相關的癥狀和診斷結果,已用紅色標出。通過這個,用戶可以區(qū)分可能的疾病并且判斷他 /她可能感染了哪一種疾病。在用戶查詢的例子中 ,用戶查詢癥狀“發(fā)燒”和“咳嗽” ,有 4 個匹配這些癥狀 (如疾病、胸膜炎、結核、流感和肺炎 )。然后他 /她就可以檢查每一個標識了“發(fā)燒”和“咳嗽”的診斷路徑以查看是否有其他有用的癥狀來區(qū)分這些可能的疾病。例如 ,流感和肺炎都有“發(fā)燒”和“咳嗽”癥狀。而“胸痛” ,“呼吸困難”和“身體疼痛”癥狀 ,可以用來區(qū)分兩種疾病。 作為總結,家庭診斷服務的數據分析可以用算法 4 來描述。 大醫(yī)療數據背景下基于云架構的家庭診斷服務 19 算法 4 家庭診斷服務的數據分析算法 返回結果中的隱私信息過濾 為了幫助用戶對他 /她的疾病有更詳細的信息 ,我們認為 ,每個疾病關聯的醫(yī)療記錄也應該呈現給目標用戶。然而 ,醫(yī)療記錄是隱私數據 ,這是受法律保護的。因此 ,類似的醫(yī)療記錄返回到目標用戶之前,超出了目標用戶的訪問權限的隱私敏感信息應該被過濾 ,避免曝光病人的隱私。 根據節(jié)點選擇算法和 節(jié)中討論的訪問控制策略 ,隱私信息過濾過程包括三個主要步驟。 (1)具有最小的服務錯誤率值得訪問控制節(jié)點被選中并通過利用節(jié)點選擇算法來進行隱私信息的過濾。( 2)從 調度程序收到查詢以后,訪問控制節(jié)點會訪問本地索引文件。通過目標用戶的 ID,在用戶訪問權限內用戶域和相聯系的動態(tài)域就可以獲得。根據訪問控制策略,細節(jié)索引文件的與用戶相關的用戶域中的靜態(tài)域是不可訪問的。因此,在用戶訪問權限內的動態(tài)域的會被返回給調度程序。( 3)最后,調度程序會把細節(jié)索引文件中的動態(tài)域的信息返回給目標用戶。通過這些,隱私敏感信息就不會曝光給目標用戶。 大醫(yī)療數據背景下基于云架構的家庭診斷服務 20 5 評價 在這個部分,一個原型系統會被設計而且一個運行示例會演示我們的提案的可擴展性和效率。具體來說,基于 Lucene 的分布式搜索集群是通過一系列實驗嘗試來評價的。此外,為了更好地證明家庭診斷服務為目標用戶提供了診斷的依據,我們將討論一個運行示例。 原型系統設計 目前,我們實現了一個基于云計算框架的家庭診斷服務。原型系統的配置已經列在表 4 中。 表 4 基于云架構原型系統的配置 對于基于云計算的框架,一個私有的 Hadoop 集群被用于離線數據存儲(即Lucene 文件和索引文件)和索引構建。一個基于 Lucene 的分布式搜索集群是由21 臺 PC 部署在一起實現在線用戶查詢處理的功能。此外,我們用從連云港一家醫(yī)院的呼吸醫(yī)學部門 的 100 個醫(yī)療記錄作為我們原型實現的數據集。醫(yī)療記錄被存儲為 XML 文檔。圖 9 描述了原型框架。 圖 9 原型系統設計的框架 大醫(yī)療數據背景下基于云架構的家庭診斷服務 21 在圖 9 中 ,Hadoop 集群由 18 節(jié)點 (一個主節(jié)點和 17 個從節(jié)點 )。每個節(jié)點配置了兩個英特爾 (R)四核 E5620 工作在 GHz 的至強處理器 (R)和 24 GB RAM。主節(jié)點 ,裝有 2TB 的磁盤 。而對于每個從節(jié)點 ,都配有兩個 2TB 的磁盤。集群是在紅帽企業(yè)的 linux 服務器 , java 和 (Apache Hadoop, 20xx)的環(huán)境 下運行的。而對于搜索集群 ,21 臺個人電腦是在 Ubuntu ,Java 和 環(huán)境下部署的以運行在線用戶查詢處理。此外 ,搜索節(jié)點集群由18 個人電腦組成一個 3 * 6 搜索矩陣形式。其他 3 個人電腦是用來實現一個調度集群、數據分析集群以及集群訪問控制的功能。每個電腦配置了 2 個英特爾 E5400 GHz的處理器,有 2 GB內存。所有的方法都是在 Java 中實現。標準的 Hadoop MapReduce API 以及 Lucene API 相應地在索引構建和在線用戶查詢處理中被采用。 性能分析 在本節(jié)中,我們設計了 2 個測試用例對我們的提案進行性能測試。不失一般性,相對于搜索節(jié)點集群的大小,我們研究了基于云計算框架的可擴展性。 我們對 節(jié)提到的 100 個醫(yī)療記錄做了 1000 萬個副本。每個醫(yī)療記錄的大小是 ,總的大小是 14GB。把醫(yī)療記錄轉換為 Lucene 文檔后, Lucene文檔的大小也是 14GB。 Lucene 文檔作為塊文件被存儲在 Hadoop 集群的 HDFS中。索引構建階段以后,就可以獲得三種索引文件。此外 ,新的 PFD 壓縮機 (Yan et al .,20xx。Ao et al .,20xx)被用于反向索引壓縮 。而概要索引文件和詳細的索引文件被谷歌的 snappy 壓縮機壓縮 (Arroyuelo et al .,20xx)。壓縮后 ,索引文件的總大小是 GB。 對于在線病歷檢索 ,每個索引文件被分為 N 個碎片 (N 是搜索節(jié)點集群每一行的搜索節(jié)點的數量 )。每一行的第 i個 (1≤ i≤ N)搜索節(jié)點包含第 i個 (1≤ i≤ N)索引碎片。 ( 1)相對于 N 值的性能 表 5 性能關于 N 的測 大醫(yī)療數據背景下基于云架構的家庭診斷服務 22 在第一個測試用例中, M 為定值 1。我們進行 5 次試驗來評價搜索節(jié)點集群相對于不同 N 值時候的性能。(相應地, N 為 1,2,3,4,5)每次試驗中,我們模擬最初在客戶端有兩個并發(fā)的進程持續(xù)發(fā)送 50000 次查詢給調度程序。此外,第 i次試驗中,第 i個搜索節(jié)點會被初始化來進行醫(yī)療記錄檢索。平均延時, CPU 的利用率和 I/O 口的等待時間會被記錄。 在表 5 中,我們可以發(fā)現 ,當 N≤3,平均延遲和 I/O 等待會隨著 n 的增加顯著
點擊復制文檔內容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1