freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務畢業(yè)論文-免費閱讀

2025-08-08 21:28 上一頁面

下一頁面
  

【正文】 致謝 本文部分受到中國國家科學基金會編號 91318301,和 61321491 的撥款;科技部的國家關(guān)鍵技術(shù)研發(fā)項目下 20xx bak21b06 的撥款。通過基于云的架構(gòu),家庭診斷服務通過歷史醫(yī)療記錄讓用戶在家就獲得診斷幫助。 而且,隱私問 題是醫(yī)療數(shù)據(jù)應用的前提,這引起了許多研究人員的注意。同時,這個結(jié)果被存儲在糖尿病決策知識庫以作為未來診斷的依據(jù)。盡管解決的問題千差萬別,但是提供一種普遍的醫(yī)療服務,改善醫(yī)療服務使我們的共同目標。比如健康庫 (HealthVault, 20xx。處理大數(shù)據(jù)的挑戰(zhàn)主要體現(xiàn)于大規(guī)模數(shù)據(jù)存儲和高效知識挖掘技術(shù)。為了判斷他可能感染了哪種疾病 , ,李可以查看與一組癥狀和疾病結(jié)果相關(guān)的每個診斷路徑。對于這 7 種疾病 ,都包含“呼吸困難”和“咳嗽”癥狀。根據(jù)我們的檢索結(jié)果 ,有 49 個醫(yī)療記錄與李的查詢相匹配。他想獲得一些關(guān)于他的疾病的預備知識,這樣他就可以知道他應該在醫(yī)院的哪一部門提前預約。例如 ,在這個測試用例中 ,M = 3 是最優(yōu)選擇。原因是索引文件的大小是固定的 2G(RAM)和 CPU 不必因為 I / O 交換操作浪費大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務 23 時間。因此 ,添加更多的搜索節(jié)點將會導致資源浪費。 當 N≤3,每個搜索節(jié)點的 RAM(2GB)小于索引碎片的大小 ( 2GB)。每一行的第 i個 (1≤ i≤ N)搜索節(jié)點包含第 i個 (1≤ i≤ N)索引碎片。把醫(yī)療記錄轉(zhuǎn)換為 Lucene 文檔后, Lucene文檔的大小也是 14GB。其他 3 個人電腦是用來實現(xiàn)一個調(diào)度集群、數(shù)據(jù)分析集群以及集群訪問控制的功能。圖 9 描述了原型框架。具體來說,基于 Lucene 的分布式搜索集群是通過一系列實驗嘗試來評價的。 (1)具有最小的服務錯誤率值得訪問控制節(jié)點被選中并通過利用節(jié)點選擇算法來進行隱私信息的過濾。然后他 /她就可以檢查每一個標識了“發(fā)燒”和“咳嗽”的診斷路徑以查看是否有其他有用的癥狀來區(qū)分這些可能的疾病。它可以被哈斯圖所代替。 疾病癥狀點陣計算 為了使得 節(jié)中計算得到的形式概念的層次關(guān)系可視化,一個偏序的關(guān)系揭示了具有相同癥狀的疾病之間的關(guān) 系和其底層結(jié)構(gòu)。E 疾病集所共有的癥狀集合是 39。 FE 概念中, 39。39。F 的共同疾病 CE 可以被定義為: }),(,|e{)( 39。交叉表的行代表疾病,列代表癥狀,符號√代表的是一個癥狀是否適用于一種疾病的一種二進制關(guān)系。然后 ,三個步驟會進行以分析具有相同癥狀的疾病之間的關(guān)系 ,即形式內(nèi)容構(gòu)建、形式概念 計算以及疾病癥狀點陣計算。從形式上看,算法 3 說明了醫(yī)療記錄檢索的執(zhí)行過程。同時基本信息過濾也會運行以過濾一些男性的或非成年病人的記錄。 定義 3(用戶查詢)一次用戶查詢可以定義為一個三元組(基本信息,疾病癥狀)。在從目標用戶收到相關(guān)聯(lián)的一組癥狀查詢 ,負載平衡器將轉(zhuǎn)發(fā)查詢給某個調(diào)度程序。在每次節(jié)點選擇循環(huán)中,調(diào)度程序會把查詢轉(zhuǎn)發(fā)給每列中 SFR ij 最小的搜索節(jié)點 ij,并且 SFR ij 會增加 1。不失一般性,搜索節(jié)點集群的節(jié)點選擇將被討論以說明動態(tài)節(jié)點選擇算法的合理性。索引文件會記錄用戶 ID 和相關(guān)的用戶域之間的關(guān)系。 ( 5)訪問控制集群 正如上述節(jié)中所討論的 ,類似的醫(yī)療記錄返回給目標用戶作為一個更詳細的家庭診斷依據(jù)。對于每次用戶查詢,一個搜索節(jié)點會被調(diào)度程序從每一列中選取以進行醫(yī)療記錄檢索。當醫(yī)療記錄被返回,它會合并檢索結(jié)果并把合并的結(jié)果轉(zhuǎn)發(fā)給數(shù)據(jù)分析集群的數(shù)據(jù)分析節(jié)點以建立疾病癥狀大醫(yī)療數(shù)據(jù)背景下基于云架構(gòu)的家庭診斷服務 11 點陣。 圖 5 三種索引文件的數(shù)據(jù)結(jié)構(gòu) 在線分布式搜索集群 分布式搜索集群的關(guān)鍵組件 如圖 2 所示,基于 Lucene 的在線分布式搜索集群由五個主要組件組成,分布式搜索集群 = {負載平衡器 ,調(diào)度集群,搜索節(jié)點集群 ,集群數(shù)據(jù)分析 ,訪問控制集群 }。 細節(jié)檢索文件。每個值都包括一組 CR ids(臨床數(shù)據(jù)的 cIDs )和將被檢索的原始的癥狀集合的 ID;然而關(guān)鍵是這些原始癥狀集合的 BF 簽名。此外 ,h2(熱 )= 6,h2(咳嗽 )= 2,h2(呼吸困難 )= 9。如圖 1 所示 ,癥狀的描述是一個字符串 ,由特定的分離器分離出來。根據(jù)分布式搜索集群中搜索節(jié)點的列的數(shù)量 (., N),每個映射節(jié)點會將索引文件分為 N 個部分。對 XML 的醫(yī)療記錄 ,我們解析他們以建立相應的 Lucene 文檔。換句話說,存儲在一排搜索節(jié)點集群中的每個節(jié)點中的索引文件組成了一個完整的索引文件。此外,四個簇以及一個負載平衡器包括在在線分布式搜索群集。從大規(guī)模和不斷增長的醫(yī)療記錄中搜索類似病歷需要按需數(shù)據(jù)存儲模型和彈性可擴展性以管理高峰期進入家庭診斷服務的權(quán)限。 3 云計算框架下的家庭診斷服務 應用場景 在本文中,我們提出了一個基于云計算的框架來實現(xiàn)家庭診斷服務,從歷史醫(yī)療記錄中提取一些診斷的幫助提供給用戶。索引是負責建立索引文件從最初的文件轉(zhuǎn)化 Lucene 的文件,以方便快速上網(wǎng)查詢。當所有的映射任務完成 ,減少階段開始的中間數(shù)據(jù)具有相同關(guān)鍵是聚合。 Bahga and Madisetti, 20xx)是一個云計算框架,用來運行內(nèi)置商用硬件大型集群應用程序。 ( 2)患者簡況:患者簡況通常包括病人的病史,包括疾病史,手術(shù)史,輸血史,以及過敏史等等。基于云計算框架的家庭診斷服務的評價將在第 5 部分被討論。然后醫(yī)療記錄匹配用戶的疾病癥狀 ,性別和年齡在步驟 2 中檢索。另一個是如何提取有用的診斷知識來幫助李從大量檢索出來的醫(yī)療記錄中弄清楚可能感染了什么疾病。他去醫(yī)院進行診斷之前,希望通過互聯(lián)網(wǎng)初步診斷,這樣就能知道他可能患有哪種疾病。連云港是中國江蘇省的一個城市,靠近上海。(Rashidi and Cook, 20xx。此外,為 了加快醫(yī)療記錄檢索, Hadoop 集群被采用以存儲離線數(shù)據(jù)以及構(gòu)建索引。發(fā)展這樣一種自我護理的服務就會面臨很多挑戰(zhàn)包括高并發(fā)和可擴展的的醫(yī)療記錄的檢索,數(shù)據(jù)分析,以及隱私的保護。有相當一部分人會密切關(guān)注他們的健康希望能獲得預防性健康檢查或以有類似病歷的病人來指導自己。 Xu et al., 20xx), 云計算技術(shù)已被廣泛研究,并在大數(shù)據(jù)領域使用 (Canny and Zhao, 20xx。 一個生動的例子 我們討論這個生動的例子是為了突出我們將要提出的問題。 然而問題出現(xiàn)了,就是如何去提供這樣一種自我 保健服務。為了加快病歷檢索, Hadoop集群被采用已進行線下數(shù)據(jù)存儲和檢索庫。第 2 節(jié)討論的病歷初步知識,以及一些關(guān)鍵技術(shù),如基于云計算框架中被采用的 Hadoop 的計算框架和 Lucene 庫。 醫(yī)療記錄 定義 1(醫(yī)療記錄)從形式上看,電子病歷是去網(wǎng)絡由三元組定義: EMR=(病人數(shù)據(jù),病人簡況,臨床資料) (Zhang et al., 20xx。另外,癥狀相同,同樣的性別和年齡相仿的患者傾向于感染類似疾病。在映射階段 ,從分布式系統(tǒng) (如 HDFS)讀取 數(shù)據(jù) ,在一組集群中的計算節(jié)點之間分區(qū) ,并將節(jié)點作為一組鍵值對。同時 ,MapReduce 計算框架用于 離線批處理索引構(gòu)建工作。然后 Lucene 文檔被存儲為塊文件在 Hadoop 的 HDFS 集群。同時 ,醫(yī)療記錄返回給目標用戶以獲得更詳細的參考。簡而言之 ,HDFS 是用于存儲索引文件和大量醫(yī)療記錄中轉(zhuǎn)換過來的 Lucene 文檔 。在我們的提案中,基于云計算框架的可擴展性可以通過動態(tài)添加或刪除在每個集群中的節(jié)點 來獲得。具體地說 ,我們使用 Hadoop 集群進行 Lucene 文檔存儲、并行索引構(gòu)建 ,以及相關(guān)索引文件存儲。我們采用 MapReduce 計算框架進行批量索引構(gòu)建。這里,我們還是用 節(jié)的例子來解釋每個索引文件的內(nèi)容。對于圖 1 中所示的醫(yī)療記錄示例,假設 m的值設置為 10,并且分別有兩個離散函數(shù) h1 和 h2。否則 dS 將被安全的刪除。概要文件檢索記錄了醫(yī)療記錄的一些關(guān)鍵部分,用于過濾掉不相關(guān)的醫(yī)療記錄。圖 5 中羅列了 Lucene文檔的一些字段,它是從圖 1 的醫(yī)療記錄轉(zhuǎn)換過來的。 ( 2)分配調(diào)度集群 為了支持高并發(fā)的用戶查詢,一個分配調(diào)度集群是由 K 個調(diào)度程序組成的。 ( 3)搜索節(jié)點集群 搜索節(jié) 點集群是一個彈性和可擴展的搜索矩陣 ,由 N M 搜索節(jié)點組成 (每個搜索節(jié)點包含索引碎片 ,并通過采用 Lucene 搜索庫功能開展實時醫(yī)療記錄檢索 )。并且用戶沒有提供的癥狀可以用來區(qū)分疾病分類。動態(tài)域中的信息可以通過相應域的角色獲得。對于節(jié)點選擇,一種樸素的方法是采用循環(huán)調(diào)度算法,這樣每個節(jié)點都會輪流被選中。 這里 ,在第 i(1 i N)個最小堆棧的第 j(1 j M)個元素就是搜索節(jié)點 nS 服務失敗率的值。家庭診斷服務的實現(xiàn)由 4 個步驟組成(如圖 7 所示)。 在下面的討論中,我們將討論家庭診斷服務的 4 個步驟的細節(jié)。 在收到用戶查詢時 ,負載平衡器根據(jù)其選擇規(guī)則將查詢轉(zhuǎn)發(fā)到一個調(diào)度程序。( 4)通過 iS ,在反向檢索文件中的每個布隆簽名 BFcR 會被掃描,并與 iS 比較 。 Wu et al., 20xx。下面給了形式內(nèi)容的一個例子。39。 定義 7(形式概念)內(nèi)容( E,F,R)的形式概念可用一對 ),)(,( 39。)( EFCE ? 。 FE 概念中, 39。此外 ,{胸膜炎、結(jié)核、流感、肺炎 }是程度的集合 。 此外,部分排序可以被認為是 subsuper 關(guān)系。同時,與每個路徑相聯(lián)系的是相關(guān)的癥狀和診斷結(jié)果,已用紅色標出。然而 ,醫(yī)療記錄是隱私數(shù)據(jù) ,這是受法律保護的。( 3)最后,調(diào)度程序會把細節(jié)索引文件中的動態(tài)域的信息返回給目標用戶。一個基于 Lucene 的分布式搜索集群是由21 臺 PC 部署在一起實現(xiàn)在線用戶查詢處理的功能。集群是在紅帽企業(yè)的 linux 服務器 , java 和 (Apache Hadoop, 20xx)的環(huán)境 下運行的。不失一般性,相對于搜索節(jié)點集群的大小,我們研究了基于云計算框架的可擴展性。而概要索引文件和詳細的索引文件被谷歌的 snappy 壓縮機壓縮 (Arroyuelo et al .,20xx)。平均延時, CPU 的利用率和 I/O 口的等待時間會被記錄。從表 5 中 ,我們可以看到當 N 3,隨著每行的搜索節(jié)點的增加 ,CPU 利用率和延遲不會改變很多。(相應地, M 為 1,2,3, 4,5,6)同樣,有 50000 次查詢會通過在客戶端初始化的 6 個并發(fā)進程被連續(xù)地發(fā)送到調(diào)度節(jié)點。如表 6 中所示,當 M 4,它導致 CPU 資源浪費 ,因為相比于增加的 M 延遲并不會減少太多。 家庭診斷服務的 一個運行示例 為了更好地描述家庭診斷服務為用戶提供的自我護理服務,我們在本節(jié)中會討論一個運行示例。因此 ,李的查詢可以這樣表達,查詢 =({男 ,成人 },{呼吸困難、咳嗽 })。 形式內(nèi)容構(gòu)建 表 7 形式內(nèi)容的運行示例 首先 ,疾病類別和相關(guān)疾病癥狀從 檢索到的醫(yī)療記錄中提取。而且圖 11 展示的疾病癥狀點陣會被一個 Hasse 表所替代。與急性膿胸相關(guān)的醫(yī)療記錄為李做出正確的診斷提供一個更詳細的參考。棱鏡模型可以為數(shù)據(jù)科學家提供可重復的語義和源數(shù)據(jù)。而且在系統(tǒng)中提到了一種醫(yī)療問卷平臺來幫助老年人通過問卷形式運行自我診斷。 (Jackson, 1998。我們的設計中所獲得的知識(即疾病癥狀點陣)是在線和動態(tài)計算的,它提供了實時的、更客觀的診斷幫助。不同于研究工作,我們認為家庭 診斷服務的提供者不會曝光病人的隱私。在我們的未來工作中,我們會把家庭診斷服務植入到正在發(fā)展中的醫(yī)療健康信息云平臺項目中,把自我護理服務提供給更多的連云港市民,并支持一些潛在的客戶包括外科醫(yī)生獲取一些診斷的參考。n, M., Suel, T., 20xx. To index or not to index: timespace tradeoffs in search engines with positional ranking functions. In: Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 255–264. [5] Bahga, A., Madisetti, ., 20xx. Analyzing massive machine maintenance data in a puting cloud. IEEE Trans. Parallel Distributed Syst. 23 (10), 1831–1843. [6] Belohlavek, R., Vychodil, V., 20xx. Formal concept analysis with background knowl edge: attribute priorities. IEEE Trans. Syst. Man Cybern. Part C: Appl. Rev. 39 (4), 399–409. [
點擊復制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1