freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù)畢業(yè)論文(編輯修改稿)

2025-08-13 21:28 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 提交 從形式上看,在我們的家庭診斷服務(wù)中,一次用戶查詢可以形式化為定義 3。 定義 3(用戶查詢)一次用戶查詢可以定義為一個(gè)三元組(基本信息,疾病癥狀)。簡(jiǎn)化時(shí),它可以被 Q=(BI, DS)替代。在定義 3 中,基本信息是指病人的性別和年齡(即 {女性或男性 }, {兒童、成年人或老年人 })。疾病癥狀是指病人的癥狀名稱。 示例(用戶查詢)用戶查詢可以是 =({性別 =女 ,年齡 =成人 },{癥狀 = {發(fā)燒、大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 15 咳嗽 } })。 在收到用戶查詢時(shí) ,負(fù)載平衡器根據(jù)其選擇規(guī)則將查詢轉(zhuǎn)發(fā)到一個(gè)調(diào)度程序。然后被選擇的調(diào)度程序會(huì)利用算法 2,將用戶查詢轉(zhuǎn)發(fā)到分布式搜索集群的N 個(gè)搜索節(jié)點(diǎn)。 醫(yī)療記錄檢索 給定一個(gè)包含一組癥狀的用戶查詢,每個(gè)搜索節(jié)點(diǎn)都會(huì)運(yùn)行布隆簽名過濾去檢索同時(shí)出現(xiàn)“發(fā)燒”和“咳嗽”的醫(yī)療記錄。同時(shí)基本信息過濾也會(huì)運(yùn)行以過濾一些男性的或非成年病人的記錄。 ( 1) BF 簽名過濾 如在第三節(jié)所討論的 ,BF 簽名采用加速癥狀匹配。( 1)用戶查詢中的每個(gè)癥狀是散列的 k 個(gè)值 是由 k 個(gè)散列函數(shù) ,? ,所確定的。( 2)把 m維向量中與那些離散值 相應(yīng)的位置 1。( 3)通過個(gè)人數(shù)據(jù)簽名,用戶查詢的布隆簽名可以通過“ OR”操作計(jì)算出來。( 4)通過 iS ,在反向檢索文件中的每個(gè)布隆簽名 BFcR 會(huì)被掃描,并與 iS 比較 。如果 BFcR ∧ iS = iS ,那么在 jcRe 中記錄的具體的癥狀會(huì)與 iQ 中記錄的癥狀相比較以確保 jcRe 包含 iQ 中所有的癥狀。 ( 2)基本信息過濾 對(duì)于經(jīng)過 BF 簽名過濾的醫(yī)療記錄,它的性別和年齡會(huì)與用戶的性別年齡相比較,以過濾掉男性、老年人以及兒童患者。從形式上看,算法 3 說明了醫(yī)療記錄檢索的執(zhí)行過程。 算法 3 醫(yī)療數(shù)據(jù)檢索算法 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 16 數(shù)據(jù)分析 通常,用戶由于缺乏醫(yī)療知識(shí),只能提供他 /她的一部分癥狀。與 節(jié)的檢索的醫(yī)療記錄相聯(lián)系,可能不止一種疾病滿足用戶的查詢。數(shù)據(jù)分析通過利用一種被稱為形式概念分析( FCA)的數(shù)學(xué)理論幫助用戶分析這些可能的疾病分類的相似和不同點(diǎn)。 (Belohlavek and Vychodil, 20xx。 Wu et al., 20xx。 Crampes et al., 20xx).FCA 會(huì)被采用以顯示具有相同癥狀的不同疾病分類之間的潛在關(guān)系。更具體地說 ,疾病名稱以及癥狀會(huì)從 節(jié)中獲得的醫(yī)療記錄中被提取。然后 ,三個(gè)步驟會(huì)進(jìn)行以分析具有相同癥狀的疾病之間的關(guān)系 ,即形式內(nèi)容構(gòu)建、形式概念 計(jì)算以及疾病癥狀點(diǎn)陣計(jì)算。 形式內(nèi)容構(gòu)建 定義 4(形式內(nèi)容) 在家庭診斷服務(wù)中,形式內(nèi)容是指疾病集合 E 和癥狀集合 F 之間的一個(gè)二進(jìn)制的關(guān)系 R。 R?EF, R 表示 E 和 F 之間的關(guān)系。 (e, f) ∈ R (e∈ E, and f∈ F)表明疾病 e 有癥狀 f。 當(dāng)集合是有限的,內(nèi)容就可以通過一個(gè)交叉表來指定。下面給了形式內(nèi)容的一個(gè)例子。 示例(形式內(nèi)容)表 3 中展示了一個(gè)簡(jiǎn)單的例子。假設(shè)與 節(jié)搜索到的醫(yī)療記錄相聯(lián)系,疾病集合 E= {胸膜炎、結(jié)核、流感、肺炎 },而癥狀集合F= {發(fā)熱、咳嗽、呼吸困難、胸痛、胸悶 ,盜汗 ,身體疼痛 }。交叉表的行代表疾病,列代表癥狀,符號(hào)√代表的是一個(gè)癥狀是否適用于一種疾病的一種二進(jìn)制關(guān)系。 表 3 家庭診斷服務(wù)形式概念的例子 形式概念計(jì)算 給定一個(gè)形式內(nèi)容,形式概念就可以通過共同特征和公共實(shí)體的定義被計(jì)算。 定義 5(共同特征)給定一個(gè)疾病集合 EE?39。 ,則集合 39。E 的共同癥狀特征 CF可以被定義為: }),(,|f{)( 39。39。 RfeEeFECF ????? 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 17 定義 6(共同實(shí)體)類似的,給定一個(gè)癥狀集合 FF?39。 ,則集合 39。F 的共同疾病 CE 可以被定義為: }),(,|e{)( 39。39。 RfeFfEFCF ????? 例子(共同特征和共同實(shí)體):在表 3 中,比如, CF({胸膜炎、肺炎 })= {發(fā)熱、咳嗽、呼吸困難、胸痛 },和 CE({發(fā)燒、咳嗽 })= {胸膜炎、結(jié)核、流感、肺炎 }。 根據(jù)定義 5 和定義 6,疾病和相關(guān)的癥狀可以被歸入有意義的集合。這些集群被稱為形式概念。 定義 7(形式概念)內(nèi)容( E,F,R)的形式概念可用一對(duì) ),)(,( 39。39。39。39。 FFEEFE ??代替,其中 39。39。)( FECF ? , 39。39。)( EFCE ? 。而且,在 ),( 39。39。 FE 概念中, 39。E 被稱為概念的范圍, 39。F 被稱為概念的目的。 換句話說,在 ),( 39。39。 FE 概念中, 39。F 癥狀集所共有的疾病集合是 39。E ,而 39。E 疾病集所共有的癥狀集合是 39。F 。 示例(形式概念)比如,表 3 中的 ({胸膜炎、結(jié)核、流感、肺炎 },{咳嗽、發(fā)燒 })是一個(gè)形式概念。因?yàn)?{咳嗽、發(fā)燒 }是 {胸膜炎、結(jié)核、流感、肺炎 }的共同癥狀。并且 {發(fā)燒、咳嗽 }在 {胸膜炎、結(jié)核、流感、肺炎 } 中都會(huì)出現(xiàn)。此外 ,{胸膜炎、結(jié)核、流感、肺炎 }是程度的集合 。{發(fā)燒、咳嗽 }是唯一的現(xiàn)象。另外 ,({肺炎、胸膜炎 },{咳嗽、發(fā)熱、胸痛、呼吸困難 })是這種情況下的另一個(gè)概念。 疾病癥狀點(diǎn)陣計(jì)算 為了使得 節(jié)中計(jì)算得到的形式概念的層次關(guān)系可視化,一個(gè)偏序的關(guān)系揭示了具有相同癥狀的疾病之間的關(guān) 系和其底層結(jié)構(gòu)。 定義 8(不等式關(guān)系)對(duì)于所有的形式內(nèi)容( E,F,R)中的概念,一個(gè)不等式關(guān)系“ ? ” 可 以 被 定 義 在 形 式 內(nèi) 容 的 概 念 上 。 特 別 的 ,jijjii FEFEFE ??? ),(),( 。 示例(不等關(guān)系)在表 3 中的形式概念中, ({胸膜炎 },{咳嗽、發(fā)熱、胸痛、呼吸困難、胸悶 })? ({肺炎、胸膜炎 },{咳嗽、發(fā)熱、胸痛、呼吸困難 })。根據(jù)定義 8,{胸膜炎 }是 {肺炎、胸膜炎 }的一個(gè)子集 ,而 {咳嗽、發(fā)熱、胸痛、呼吸困難 }也是 {咳嗽、發(fā)熱、胸痛、呼吸困難、胸悶 }的一個(gè)子集。 此外,部分排序可以被認(rèn)為是 subsuper 關(guān)系。根據(jù)這個(gè) subsuper 關(guān)系排序 ,大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 18 它通過在上下文的概念定義了一個(gè)完整的點(diǎn)陣。而這個(gè)在本文中被稱為疾病癥狀點(diǎn)陣。它可以被哈斯圖所代替。圖 8( a)是一張哈斯表展示了表 3 中的內(nèi)容的疾病癥狀點(diǎn)陣。疾病癥狀點(diǎn)陣的節(jié)點(diǎn)代表了形式概念的潛在內(nèi)容。 圖 8 表 3 中的疾病癥狀點(diǎn)陣 有了疾病癥狀點(diǎn)陣,用戶可以通過自上而下瀏覽點(diǎn)陣的每一個(gè)診斷路徑獲得自我診斷。診斷路徑示例是用紅色突出顯示在圖 8(b)。同時(shí),與每個(gè)路徑相聯(lián)系的是相關(guān)的癥狀和診斷結(jié)果,已用紅色標(biāo)出。通過這個(gè),用戶可以區(qū)分可能的疾病并且判斷他 /她可能感染了哪一種疾病。在用戶查詢的例子中 ,用戶查詢癥狀“發(fā)燒”和“咳嗽” ,有 4 個(gè)匹配這些癥狀 (如疾病、胸膜炎、結(jié)核、流感和肺炎 )。然后他 /她就可以檢查每一個(gè)標(biāo)識(shí)了“發(fā)燒”和“咳嗽”的診斷路徑以查看是否有其他有用的癥狀來區(qū)分這些可能的疾病。例如 ,流感和肺炎都有“發(fā)燒”和“咳嗽”癥狀。而“胸痛” ,“呼吸困難”和“身體疼痛”癥狀 ,可以用來區(qū)分兩種疾病。 作為總結(jié),家庭診斷服務(wù)的數(shù)據(jù)分析可以用算法 4 來描述。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 19 算法 4 家庭診斷服務(wù)的數(shù)據(jù)分析算法 返回結(jié)果中的隱私信息過濾 為了幫助用戶對(duì)他 /她的疾病有更詳細(xì)的信息 ,我們認(rèn)為 ,每個(gè)疾病關(guān)聯(lián)的醫(yī)療記錄也應(yīng)該呈現(xiàn)給目標(biāo)用戶。然而 ,醫(yī)療記錄是隱私數(shù)據(jù) ,這是受法律保護(hù)的。因此 ,類似的醫(yī)療記錄返回到目標(biāo)用戶之前,超出了目標(biāo)用戶的訪問權(quán)限的隱私敏感信息應(yīng)該被過濾 ,避免曝光病人的隱私。 根據(jù)節(jié)點(diǎn)選擇算法和 節(jié)中討論的訪問控制策略 ,隱私信息過濾過程包括三個(gè)主要步驟。 (1)具有最小的服務(wù)錯(cuò)誤率值得訪問控制節(jié)點(diǎn)被選中并通過利用節(jié)點(diǎn)選擇算法來進(jìn)行隱私信息的過濾。( 2)從 調(diào)度程序收到查詢以后,訪問控制節(jié)點(diǎn)會(huì)訪問本地索引文件。通過目標(biāo)用戶的 ID,在用戶訪問權(quán)限內(nèi)用戶域和相聯(lián)系的動(dòng)態(tài)域就可以獲得。根據(jù)訪問控制策略,細(xì)節(jié)索引文件的與用戶相關(guān)的用戶域中的靜態(tài)域是不可訪問的。因此,在用戶訪問權(quán)限內(nèi)的動(dòng)態(tài)域的會(huì)被返回給調(diào)度程序。( 3)最后,調(diào)度程序會(huì)把細(xì)節(jié)索引文件中的動(dòng)態(tài)域的信息返回給目標(biāo)用戶。通過這些,隱私敏感信息就不會(huì)曝光給目標(biāo)用戶。 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 20 5 評(píng)價(jià) 在這個(gè)部分,一個(gè)原型系統(tǒng)會(huì)被設(shè)計(jì)而且一個(gè)運(yùn)行示例會(huì)演示我們的提案的可擴(kuò)展性和效率。具體來說,基于 Lucene 的分布式搜索集群是通過一系列實(shí)驗(yàn)嘗試來評(píng)價(jià)的。此外,為了更好地證明家庭診斷服務(wù)為目標(biāo)用戶提供了診斷的依據(jù),我們將討論一個(gè)運(yùn)行示例。 原型系統(tǒng)設(shè)計(jì) 目前,我們實(shí)現(xiàn)了一個(gè)基于云計(jì)算框架的家庭診斷服務(wù)。原型系統(tǒng)的配置已經(jīng)列在表 4 中。 表 4 基于云架構(gòu)原型系統(tǒng)的配置 對(duì)于基于云計(jì)算的框架,一個(gè)私有的 Hadoop 集群被用于離線數(shù)據(jù)存儲(chǔ)(即Lucene 文件和索引文件)和索引構(gòu)建。一個(gè)基于 Lucene 的分布式搜索集群是由21 臺(tái) PC 部署在一起實(shí)現(xiàn)在線用戶查詢處理的功能。此外,我們用從連云港一家醫(yī)院的呼吸醫(yī)學(xué)部門 的 100 個(gè)醫(yī)療記錄作為我們?cè)蛯?shí)現(xiàn)的數(shù)據(jù)集。醫(yī)療記錄被存儲(chǔ)為 XML 文檔。圖 9 描述了原型框架。 圖 9 原型系統(tǒng)設(shè)計(jì)的框架 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 21 在圖 9 中 ,Hadoop 集群由 18 節(jié)點(diǎn) (一個(gè)主節(jié)點(diǎn)和 17 個(gè)從節(jié)點(diǎn) )。每個(gè)節(jié)點(diǎn)配置了兩個(gè)英特爾 (R)四核 E5620 工作在 GHz 的至強(qiáng)處理器 (R)和 24 GB RAM。主節(jié)點(diǎn) ,裝有 2TB 的磁盤 。而對(duì)于每個(gè)從節(jié)點(diǎn) ,都配有兩個(gè) 2TB 的磁盤。集群是在紅帽企業(yè)的 linux 服務(wù)器 , java 和 (Apache Hadoop, 20xx)的環(huán)境 下運(yùn)行的。而對(duì)于搜索集群 ,21 臺(tái)個(gè)人電腦是在 Ubuntu ,Java 和 環(huán)境下部署的以運(yùn)行在線用戶查詢處理。此外 ,搜索節(jié)點(diǎn)集群由18 個(gè)人電腦組成一個(gè) 3 * 6 搜索矩陣形式。其他 3 個(gè)人電腦是用來實(shí)現(xiàn)一個(gè)調(diào)度集群、數(shù)據(jù)分析集群以及集群訪問控制的功能。每個(gè)電腦配置了 2 個(gè)英特爾 E5400 GHz的處理器,有 2 GB內(nèi)存。所有的方法都是在 Java 中實(shí)現(xiàn)。標(biāo)準(zhǔn)的 Hadoop MapReduce API 以及 Lucene API 相應(yīng)地在索引構(gòu)建和在線用戶查詢處理中被采用。 性能分析 在本節(jié)中,我們?cè)O(shè)計(jì)了 2 個(gè)測(cè)試用例對(duì)我們的提案進(jìn)行性能測(cè)試。不失一般性,相對(duì)于搜索節(jié)點(diǎn)集群的大小,我們研究了基于云計(jì)算框架的可擴(kuò)展性。 我們對(duì) 節(jié)提到的 100 個(gè)醫(yī)療記錄做了 1000 萬個(gè)副本。每個(gè)醫(yī)療記錄的大小是 ,總的大小是 14GB。把醫(yī)療記錄轉(zhuǎn)換為 Lucene 文檔后, Lucene文檔的大小也是 14GB。 Lucene 文檔作為塊文件被存儲(chǔ)在 Hadoop 集群的 HDFS中。索引構(gòu)建階段以后,就可以獲得三種索引文件。此外 ,新的 PFD 壓縮機(jī) (Yan et al .,20xx。Ao et al .,20xx)被用于反向索引壓縮 。而概要索引文件和詳細(xì)的索引文件被谷歌的 snappy 壓縮機(jī)壓縮 (Arroyuelo et al .,20xx)。壓縮后 ,索引文件的總大小是 GB。 對(duì)于在線病歷檢索 ,每個(gè)索引文件被分為 N 個(gè)碎片 (N 是搜索節(jié)點(diǎn)集群每一行的搜索節(jié)點(diǎn)的數(shù)量 )。每一行的第 i個(gè) (1≤ i≤ N)搜索節(jié)點(diǎn)包含第 i個(gè) (1≤ i≤ N)索引碎片。 ( 1)相對(duì)于 N 值的性能 表 5 性能關(guān)于 N 的測(cè) 大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務(wù) 22 在第一個(gè)測(cè)試用例中, M 為定值 1。我們進(jìn)行 5 次試驗(yàn)來評(píng)價(jià)搜索節(jié)點(diǎn)集群相對(duì)于不同 N 值時(shí)候的性能。(相應(yīng)地, N 為 1,2,3,4,5)每次試驗(yàn)中,我們模擬最初在客戶端有兩個(gè)并發(fā)的進(jìn)程持續(xù)發(fā)送 50000 次查詢給調(diào)度程序。此外,第 i次試驗(yàn)中,第 i個(gè)搜索節(jié)點(diǎn)會(huì)被初始化來進(jìn)行醫(yī)療記錄檢索。平均延時(shí), CPU 的利用率和 I/O 口的等待時(shí)間會(huì)被記錄。 在表 5 中,我們可以發(fā)現(xiàn) ,當(dāng) N≤3,平均延遲和 I/O 等待會(huì)隨著 n 的增加顯著
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1